场景二,对话:
小明:怎么解决SoftMax不能表达“我不知道”的问题呢?
我:宇宙有物资和空间,如果物资叫“有”,那空间就叫“无”
小明:蛮有道理的!
我:我们把全宇宙看成一个全集,那么可以用数学表达宇宙万物。宇宙={ 空集,子集1,子集2,… }。空集就代表宇宙空间,其它子集就代表物质。
小明:如果你这样问ChatGPT:“我口袋里有什么?”,而我们希望它回答“我不知道”,那怎么训练它用“我不知道”回答呢?
我:我们将问题看成上文+下文,那么“我口袋里有什么?”就变成{{上文}{我口袋里有什么}}因为是直接问的没有上文,所以{{ },{我口袋里有什么}}把这种情况,直接训练到对应答案“我不知道”,然后,就加强了“什么”和空集“{ }”的联系,SelfAttention就会显示什么和这种情况下的空集分配权重很大。
小明:怎么解决SoftMax不能表达“我不知道”的问题呢?
我:宇宙有物资和空间,如果物资叫“有”,那空间就叫“无”
小明:蛮有道理的!
我:我们把全宇宙看成一个全集,那么可以用数学表达宇宙万物。宇宙={ 空集,子集1,子集2,… }。空集就代表宇宙空间,其它子集就代表物质。
小明:如果你这样问ChatGPT:“我口袋里有什么?”,而我们希望它回答“我不知道”,那怎么训练它用“我不知道”回答呢?
我:我们将问题看成上文+下文,那么“我口袋里有什么?”就变成{{上文}{我口袋里有什么}}因为是直接问的没有上文,所以{{ },{我口袋里有什么}}把这种情况,直接训练到对应答案“我不知道”,然后,就加强了“什么”和空集“{ }”的联系,SelfAttention就会显示什么和这种情况下的空集分配权重很大。