TAG:学术研究

ChatGPT 5.5 Pro 一小时破解博士级数学难题,AI 数学能力显著提升

ChatGPT 5.5 Pro 一小时破解博士级数学难题,AI 数学能力显著提升

剑桥大学菲尔兹奖得主 Timothy Gowers 分享使用 ChatGPT 5.5 Pro 的经历,该 AI 在一小时内成功解决了一个组合数学领域的博士级开放性问题,展示了其在识别简洁论证和构建原创证明思路方面的突破性能力。这一进展引发学术界对 AI 数学能力的新关注,并提出建立专门审核机制的建议,可能深远影响数学研究、教育和学术评价体系。

2026-05-09 17:11
0
0

学术团队仅凭SFT打破大厂垄断,OpenSeeker-v2登顶搜索智能体榜单

学术团队仅凭SFT打破大厂垄断,OpenSeeker-v2登顶搜索智能体榜单

学术团队发布的OpenSeeker-v2搜索智能体,仅通过监督微调(SFT)方法,便在多项基准测试中超越工业巨头模型,打破大厂垄断。该团队采用创新的数据合成策略,训练出高性能模型,并在BrowseComp等测试中刷新纪录。这一成果不仅展示了SFT的潜力,还通过开源降低了前沿技术研发门槛,为学术界和开源社区提供了轻量化开发路径。

2026-05-06 16:37
88
0

中国程序员“单挑”苹果:通宵揪出其AI论文30%数据错误,迫使ICLR紧急勘误

中国程序员“单挑”苹果:通宵揪出其AI论文30%数据错误,迫使ICLR紧急勘误

ICLR2025审稿期间,苹果一篇声称小模型超越GPT-5的视觉推理论文被曝存在严重数据问题。阶跃星辰研究员Lei Yang在复现中发现官方代码遗漏图片输入,修复后准确率暴跌;抽查20道题中6道Ground Truth标签错误,估算整体错误率约30%。事件引发学术圈对自动生成数据集质量管控的反思,作者团队已紧急修正基准并承诺更新实验结果。

爱力方 2025-12-01 15:24
50
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/