TAG:大模型训练
谷歌DeepMind推出解耦式DiLoCo:优化异步训练架构 可容忍硬件故障
本文介绍谷歌DeepMind推出的解耦式DiLoCo分布式训练架构,该架构通过将训练任务分散到异步计算孤岛,解决传统同步训练易受单点硬件故障影响的问题,可大幅降低跨数据中心带宽需求,具备自愈能力且支持异构硬件协同,有效提升大模型训练效率与鲁棒性。
Meta收集员工日常行为数据用于训练大模型,隐私边界再受挑战
Meta推出“模型能力倡议”(MCI),计划收集员工鼠标点击、键盘输入与屏幕内容等日常工作行为数据,用于加速大模型“Muse Spark”训练,提升AI对人类使用计算机习惯的理解与操作能力。该举措同时引发隐私与数据安全担忧,员工关注数据处理边界与保护措施。
亚马逊进军内容授权市场 AI时代开启出版商新收益模式
亚马逊计划推出AI内容授权市场,为出版商与AI开发者搭建版权交易桥梁,终结数据免费使用时代。该平台将基于使用量计费,整合AWS生态,旨在解决版权争议并拓展亚马逊在AI领域的战略布局。微软等巨头也在布局类似市场,高质量数据授权成为AI竞争新焦点。
摩尔线程发布URPO框架:大模型训练新范式获AAAI 2026认可
摩尔线程在AAAI 2026会议上发布URPO框架,这是一种统一奖励与策略优化技术,通过将指令遵循和奖励评判功能整合到单一模型中,显著提升大语言模型的训练效率和性能。实验显示基于Qwen2.5-7B的URPO在AlpacaEval和RewardBench等基准测试中超越传统方法,为AI训练开辟了新路径。
互联网
2025-11-14 15:35
车展速递:芯驰科技披露新一代AI座舱芯片X10进展,整体系统BOM成本降低至少1500元
2026-04-25
0 浏览
长城汽车一季度营收451.09亿元,魏牌V9X年内将进入中东等海外市场
2026-04-25
0 浏览
车展速递:孔明3.0新一代高阶智能驾驶将于今年9月上车,航盛集团董事长杨洪称汽车电子出海阵痛不可避免
2026-04-25
0 浏览
安波福杨晓明:在华发展战略再进阶,中国正转变为全球汽车市场创新引擎
2026-04-25
0 浏览
人形机器人不止能表演:交管机器人已走进路口开展交通指挥工作
2026-04-25
0 浏览
AI基建热潮引发担忧,投资者要求甲骨文为140亿美元债券支付更高溢价
2026-04-25
0 浏览
腾讯面向汽车行业开放全栈智能体能力,加速汽车产业智能化落地
2026-04-25
0 浏览
对话「豆脚」创作者同济子豪:人形机器人行业为何仍需要“搞抽象”?
2026-04-25
0 浏览
电网百亿级集中采购启动,具身智能产业链迎来确定性增量机遇
2026-04-25
0 浏览
每经热评:这一刻或成中国AI产业链的“DeepSeek时刻”
2026-04-25
0 浏览