惊了！DeepSeek数字母竟如此“纠结”，你猜它最后答对了吗？

梅丽莎·K 2025-05-01 中医 5 次浏览 0个评论

DeepSeek的奇特表现

最近，DeepSeek在面对简单问题时展现出了怪异的一面。就从“Strawberry”中有几个字母'r'这个幼儿园级别的计数问题说起。它先是逐个检查字母拼写，确认正确后却开始反复反思，在两个R还是三个R之间摇摆不定，陷入了“验证拼写”-“怀疑结论”-“再验证拼写”-“再怀疑结论”的循环。关键词：DeepSeek、Strawberry、反思

中文难题的应对

接着，又给它抛出“来到杨过曾经生活过的地方，小龙女动情的说：‘我也想过过过儿过过的生活’，这句话有几个‘过’字”这个中文世界的经典难题。它正确拆解、计数得出答案7后，光速进入反思模式，在7个和8个之间纠结，最后竟得出8个的错误答案，连简单的加法都能算错。关键词：杨过、过字、反思

AI为何陷入“反思魔咒”

为何AI会陷入这种“反思魔咒”呢？一方面，推理模型经历的RLHF阶段，若人类标注者倾向给“思考周密”的回答高分，模型就会插入大量验证步骤，追求“看起来正确”。另一方面，模型内部验证器机制有缺陷，基础能力脆弱，在复杂流程中暴露问题，导致出现效率低下、过程迷惑且引入错误等情况。关键词：AI、反思魔咒、RLHF