TAG:奖励建模

具身智能公司提出新方法,解决困扰机器人长程任务多年的“奖励瓶颈”问题

具身智能公司提出新方法,解决困扰机器人长程任务多年的“奖励瓶颈”问题

文章聚焦机器人长程任务中的“奖励瓶颈”,介绍逐际动力联合高校提出的ARM框架:以“前进/后退/停滞”三态相对优势替代绝对进度估计,并结合MIMO时序Transformer、自动化进度重建与AW-BC训练策略,显著提升长视界操作学习效率与稳定性,在双手毛巾折叠任务中实现99.4%成功率。

2026-04-22 11:06
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/