TAG:科学推理

北大学生与AI比拼结果出乎意料

北大学生与AI比拼结果出乎意料

北京大学化学与分子工程学院联合多个团队，让174名大二学生与GPT、Gemini等AI模型同场参加有机化学考试，使用高难度原创题库SUPERChem评估AI的科学推理能力。结果显示，顶尖AI表现仅与低年级本科生平均水平相当，尤其在处理视觉信息和复杂逻辑推理时存在明显瓶颈。这项研究旨在推动AI从知识记忆向深度理解跨越，为化学与人工智能领域提供重要评测基准。

每日经济新闻

2025-12-28 18:41

11

·

0

AI科研新基准：FrontierScience测评模型推理能力

AI科研新基准：FrontierScience测评模型推理能力

本文介绍了新推出的AI科学研究基准FrontierScience，该基准专注于评估AI模型在物理、化学和生物等领域的专家级科学推理能力。文章通过初步评估结果展示了GPT-5.2在奥林匹克版和研究版中的表现，并探讨了AI如何加速科学研究流程以及当前在开放式思维方面的局限性。

2025-12-17 16:40

4

·

0

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

2026-05-11

·

0 浏览

多空胶着恒指震荡整理，AI景气外溢主导行情波动

2026-05-11

·

0 浏览

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

2026-05-11

·

0 浏览

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

2026-05-11

·

0 浏览

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

2026-05-11

·

0 浏览

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

2026-05-11

·

0 浏览

4月汽车出口增长51% 国内零售下跌超20%

2026-05-11

·

0 浏览

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

2026-05-11

·

0 浏览

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

2026-05-11

·

0 浏览

申昊科技拟设具身智能子公司加码人形机器人业务

2026-05-11

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/

浙ICP备2025176963号-3

标签云 RSS订阅滚动资讯资讯排行