TAG:物理基准测试

AI巅峰对决遭遇“滑铁卢”:Gemini 3 Pro与GPT-5在物理学测试中集体“翻车”

AI巅峰对决遭遇“滑铁卢”:Gemini 3 Pro与GPT-5在物理学测试中集体“翻车”

最新物理基准测试CritPt结果显示,即使是Gemini3Pro和GPT-5等顶级AI模型,在博士级物理研究挑战中的准确率不足10%。这项由50多位物理学家设计的测试涵盖11个前沿领域,旨在评估AI解决原创性科研问题的能力。结果表明当前AI在严谨性、创造性和推理稳定性方面存在明显不足,距离成为真正的自主科学家仍有巨大差距。

爱力方 2025-11-24 15:15
28
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/