TAG:大模型训练

谷歌DeepMind推出解耦式DiLoCo:优化异步训练架构 可容忍硬件故障

谷歌DeepMind推出解耦式DiLoCo:优化异步训练架构 可容忍硬件故障

本文介绍谷歌DeepMind推出的解耦式DiLoCo分布式训练架构,该架构通过将训练任务分散到异步计算孤岛,解决传统同步训练易受单点硬件故障影响的问题,可大幅降低跨数据中心带宽需求,具备自愈能力且支持异构硬件协同,有效提升大模型训练效率与鲁棒性。

2026-04-24 15:59
0
0

Meta收集员工日常行为数据用于训练大模型,隐私边界再受挑战

Meta收集员工日常行为数据用于训练大模型,隐私边界再受挑战

Meta推出“模型能力倡议”(MCI),计划收集员工鼠标点击、键盘输入与屏幕内容等日常工作行为数据,用于加速大模型“Muse Spark”训练,提升AI对人类使用计算机习惯的理解与操作能力。该举措同时引发隐私与数据安全担忧,员工关注数据处理边界与保护措施。

2026-04-24 10:30
0
0

亚马逊进军内容授权市场 AI时代开启出版商新收益模式

亚马逊进军内容授权市场 AI时代开启出版商新收益模式

亚马逊计划推出AI内容授权市场,为出版商与AI开发者搭建版权交易桥梁,终结数据免费使用时代。该平台将基于使用量计费,整合AWS生态,旨在解决版权争议并拓展亚马逊在AI领域的战略布局。微软等巨头也在布局类似市场,高质量数据授权成为AI竞争新焦点。

2026-02-10 16:28
23
0

摩尔线程发布URPO框架:大模型训练新范式获AAAI 2026认可

摩尔线程发布URPO框架:大模型训练新范式获AAAI 2026认可

摩尔线程在AAAI 2026会议上发布URPO框架,这是一种统一奖励与策略优化技术,通过将指令遵循和奖励评判功能整合到单一模型中,显著提升大语言模型的训练效率和性能。实验显示基于Qwen2.5-7B的URPO在AlpacaEval和RewardBench等基准测试中超越传统方法,为AI训练开辟了新路径。

2025-11-14 15:35
31
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/