TAG:数学推理

中国通矩模型全球首创几何奥数自主命题秒级破解

中国科研团队开发的全球首个兼具自主出题与自动解题能力的通用人工智能系统“通矩模型”在《自然·机器智能》发表。该系统能创造高质量几何难题并入选人类数学竞赛，仅用消费级显卡即可在38分钟内解决近25年国际奥数几何难题，标志着AI在数学推理领域实现从被动模仿到主动创造的范式转变。

aibase

2026-01-27 13:52

字节发布Seed新模型数学竞赛夺金展推理实力

字节跳动Seed AI团队发布数学推理模型Seed Prover1.5，该模型在国际数学奥林匹克竞赛中获得金牌，仅用16.5小时解决IMO2025前五题，成绩与谷歌Gemini并驾齐驱。模型通过大规模强化学习、Agentic Prover和Sketch Model等创新技术，将证明成功率提升至近90%，并在北美数学竞赛中刷新纪录，标志着AI推理能力迈入新阶段。

爱力方

2025-12-25 18:00

IMO金牌成AI试金石？DeepSeek-Math-V2的突破，让学术界重新审视AI极限

DeepSeek正式发布DeepSeek-Math-V2开源数学推理模型，这款6850亿参数的MoE模型成为全球首个达到国际数学奥林匹克金牌水平的开源AI。模型采用创新的‘生成-验证’双模型闭环机制，通过实时逻辑审查和自我修正实现真正的可自我验证能力。在2025年IMO竞赛中取得83.3%正确率获得金牌，在普特南数学竞赛中更是取得118/120的近乎满分成绩，全面超越此前所有公开模型。

爱力方

2025-11-28 11:56

微博的“效率革命”：Vibe Thinker让轻量化AI成为一行代码的事

微博开源Vibe Thinker大模型仅15亿参数却在数学竞赛中击败6710亿参数的DeepSeek R1，准确率领先3.4%，推理延迟降低42%。该模型采用轻量化MoE架构，后训练成本仅7800美元，支持Hugging Face一键下载及商用，最低可在单张RTX4090运行，适用于教育、金融等实时场景。

爱力方

2025-11-18 17:12

通知

尊敬的用户

user

TAG:数学推理

中国通矩模型全球首创几何奥数自主命题秒级破解

字节发布Seed新模型数学竞赛夺金展推理实力

IMO金牌成AI试金石？DeepSeek-Math-V2的突破，让学术界重新审视AI极限

微博的“效率革命”：Vibe Thinker让轻量化AI成为一行代码的事

快讯

AI振兴网络视听每一帧，但人仍是不可替代的灵魂

中国工程院院士郑纬民：从模型服务走向词元服务，是智能体时代对基础设施的必然要求

微软接手OpenAI挪威星际之门项目加码AI算力布局

让AI帮忙买保险结果付款给了陌生人？每经记者亲测：通用AI和保险AI用谁买保险更靠谱

爱奇艺创始人、首席执行官龚宇：期待AI生成的高品质影视作品

激进投资者施压叠加AI效率提升 Snap启动16%裁员计划股价盘前大涨11%

地平线副总裁吕鹏：物理AI时代需打造超级平台，舱驾融合是智能电动2026发展方向

加纳驻华大使携手APUS签署战略合作，启动KOJO BONSU GEN Z AI CLUB

AI时代背景下初高中学习：真人老师与AI工具谁更能提升学习效果

佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍

推荐专栏

爱力方

机器人大讲堂

user

TAG:数学推理

中国通矩模型全球首创 几何奥数自主命题秒级破解

字节发布Seed新模型 数学竞赛夺金展推理实力

IMO金牌成AI试金石？DeepSeek-Math-V2的突破，让学术界重新审视AI极限

微博的“效率革命”：Vibe Thinker让轻量化AI成为一行代码的事

快讯

AI振兴网络视听每一帧，但人仍是不可替代的灵魂

中国工程院院士郑纬民：从模型服务走向词元服务，是智能体时代对基础设施的必然要求

微软接手OpenAI挪威星际之门项目 加码AI算力布局

让AI帮忙买保险结果付款给了陌生人？每经记者亲测：通用AI和保险AI用谁买保险更靠谱

爱奇艺创始人、首席执行官龚宇：期待AI生成的高品质影视作品

激进投资者施压叠加AI效率提升 Snap启动16%裁员计划 股价盘前大涨11%

地平线副总裁吕鹏：物理AI时代需打造超级平台，舱驾融合是智能电动2026发展方向

加纳驻华大使携手APUS签署战略合作，启动KOJO BONSU GEN Z AI CLUB

AI时代背景下初高中学习：真人老师与AI工具谁更能提升学习效果

佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍

推荐专栏

爱力方

机器人大讲堂

中国通矩模型全球首创几何奥数自主命题秒级破解

字节发布Seed新模型数学竞赛夺金展推理实力

微软接手OpenAI挪威星际之门项目加码AI算力布局

激进投资者施压叠加AI效率提升 Snap启动16%裁员计划股价盘前大涨11%