TAG:人类视频数据

首次纯人类视频预训练VLA实现灵巧操作,少量数据微调即可部署成功

首次纯人类视频预训练VLA实现灵巧操作,少量数据微调即可部署成功

该研究首次提出使用纯人类视频预训练视觉-语言-动作(VLA)模型,实现机器人灵巧操作。通过VITRA框架,自动从人类活动视频中提取3D手部运动轨迹、分割原子动作并生成语言指令,构建了超大规模数据集。预训练模型展现出强大的零样本手部动作预测能力,仅需少量真实机器人数据微调,即可在真实环境中高效部署,对新物体和环境泛化能力强,显著降低了机器人学习的数据获取成本。

2026-06-08 19:56
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/