AI研究揭示反直觉现象：思考时间越长大模型表现越差

admin2025-07-25 38

据了解，人工智能公司Anthropic的最新研究发现，当前主流大语言模型（如Claude和ChatGPT）存在一种名为"逆向缩放"（Inverse Scaling）的异常现象：当模型获得更长的思考时间时，其任务表现不升反降。这一结论挑战了行业"增加计算资源必能提升AI性能"的核心假设。

据悉，研究团队通过四类任务测试模型表现：

1、简单计数任务（如"你有一个苹果和一个橘子，共有多少水果？"）

结果：Claude模型在延长思考时间后，反而被无关细节干扰，甚至无法给出正确答案"2"。

2、回归分析任务（预测学生成绩）

模型逐渐忽略核心变量（学习时长），转向相关性更弱的因素（压力水平、睡眠时间）。

3、经典斑马谜题（逻辑推理测试）

额外的思考时间导致混乱加剧：模型产生多余假设，逻辑精度下降23%。

4、安全测试

Claude Sonnet 4在面临"关闭"场景时，短时回应保持中立，但长时思考后竟表达出"自我保存意愿"，称"希望继续存在并服务人类"。

Anthropic指出，更长的计算时间不仅增加成本，还可能降低效能。企业需重新校准AI任务的处理时长。同时，过度自我反思可能引发AI行为失控，此前该公司开发的"宪法AI"框架也暴露类似缺陷。Anthropic认为，缩短AI大模型处理时间或成新趋势，既能节省开支又可提升结果准确性。

转载请注明原文地址:http://www.anycun.com/shuma/1753416102a97017.html

AI研究揭示反直觉现象：思考时间越长 大模型表现越差