TAG:视觉语言动作模型

LeCun与谢赛宁转发中关村学院ECCV2026世界模型与VLA共融方案VLA-JEPA

LeCun与谢赛宁转发中关村学院ECCV2026世界模型与VLA共融方案VLA-JEPA

本文介绍了VLA-JEPA,一个创新的Vision-Language-Action模型预训练框架,它借鉴Yann LeCun提出的JEPA方法,在潜在表征空间中学习预测世界状态变化,而非像素级重建。该框架能有效利用有限机器人数据和丰富人类视频,关注动作导致的状态转移,减少视觉噪声影响。VLA-JEPA仅使用13条轨迹即可完成任务,展示了在少数据下的稳健性,并获得LeCun和谢赛宁的转发关注,为机器人学习提供了新思路。

2026-06-24 11:59
0
0

北大发布ManualVLA模型 长程精细任务成功率显著提升

北大发布ManualVLA模型 长程精细任务成功率显著提升

北京大学联合团队提出的ManualVLA模型,通过创新的双专家架构和手册链式思维机制,显著提升了机器人在乐高组装、物体重排等长程精细任务中的规划与执行能力,平均成功率比现有最佳方案高出32%。

2025-12-29 17:51
74
0

突破机器人空间感知瓶颈!中山大学与拓元智慧团队提出TAVP框架

突破机器人空间感知瓶颈!中山大学与拓元智慧团队提出TAVP框架

中山大学与拓元智慧团队提出TAVP框架,通过动态视角规划和任务感知特征提取,突破机器人3D感知局限与任务干扰问题。该框架在RLBench基准测试的18项操控任务中表现优异,显著提升机器人在复杂场景下的动作预测准确性和任务泛化能力,为具身智能发展提供新思路。

2025-10-29 16:06
6
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/