DeepSeek的奇特表现
最近,DeepSeek在面对简单问题时展现出了怪异的一面。就从“Strawberry”中有几个字母'r'这个幼儿园级别的计数问题说起。它先是逐个检查字母拼写,确认正确后却开始反复反思,在两个R还是三个R之间摇摆不定,陷入了“验证拼写”-“怀疑结论”-“再验证拼写”-“再怀疑结论”的循环。关键词:DeepSeek、Strawberry、反思中文难题的应对
接着,又给它抛出“来到杨过曾经生活过的地方,小龙女动情的说:‘我也想过过过儿过过的生活’,这句话有几个‘过’字”这个中文世界的经典难题。它正确拆解、计数得出答案7后,光速进入反思模式,在7个和8个之间纠结,最后竟得出8个的错误答案,连简单的加法都能算错。关键词:杨过、过字、反思AI为何陷入“反思魔咒”
为何AI会陷入这种“反思魔咒”呢?一方面,推理模型经历的RLHF阶段,若人类标注者倾向给“思考周密”的回答高分,模型就会插入大量验证步骤,追求“看起来正确”。另一方面,模型内部验证器机制有缺陷,基础能力脆弱,在复杂流程中暴露问题,导致出现效率低下、过程迷惑且引入错误等情况。关键词:AI、反思魔咒、RLHF如何看待AI的“拧巴”认真
AI的“思考”过程和人类不同,我们不要被它长篇大论的“思考过程”迷惑,过程长不一定可靠,可能只是在执行被过度训练的“表演程序”。尤其要注意其中关键计算或逻辑节点,或许可以告诉它“不需要解释”。关键词:AI、思考过程、信任转载请注明来自小说网站推荐,本文标题:《惊了!DeepSeek数字母竟如此“纠结”,你猜它最后答对了吗?》
还没有评论,来说两句吧...