TAG:模型训练

阿里黑科技炸场!0.6B 小模型“魔改”成 17B MoE,激活参数仅 5%,CPU 直接跑 30token/s!

阿里黑科技炸场!0.6B 小模型“魔改”成 17B MoE,激活参数仅 5%,CPU 直接跑 30token/s!

本文介绍阿里国际数字商业团队推出的Marco-Mini-Instruct MoE模型,该模型通过Upcycling技术由0.6B小模型升级为17B总参数规模,激活参数仅5%,CPU上可实现30token/s的推理速度,性能超越4B级Dense模型,为行业提供了低成本、高效率的MoE炼制新路径,大幅降低中小团队落地MoE的门槛。

2026-04-10 10:53
0
0

京东云JoyBuilder助力GR00T N1.5千卡训练,推动具身智能规模化应用

京东云JoyBuilder助力GR00T N1.5千卡训练,推动具身智能规模化应用

京东云JoyBuilder模型开发平台完成关键升级,成功支持GR00T N1.5模型完成千卡级训练,成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台。通过全栈优化,训练效率较开源社区版本提升3.5倍,大幅加速了具身智能迈向规模化落地的进程。

爱力方 2025-12-08 15:02
24
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/