TAG:Vision-Language-Act

中科院与南京大学及Dexmal推出Realtime-VLA FLASH,机器人操控实现毫秒级

中科院与南京大学及Dexmal推出Realtime-VLA FLASH,机器人操控实现毫秒级

中科院联合南大与Dexmal推出Realtime-VLA FLASH框架,通过投机推理范式优化基于扩散的视觉-语言-动作模型,将推理延迟从58.0ms降至7.8ms,实现3.04倍加速。该框架采用轻量草稿模型生成候选动作块,主模型并行验证,并引入阶段感知回退机制,确保在精细调整阶段的可靠性,为机器人操控的实时应用如高速传送带抓取提供高效解决方案。

2026-05-26 18:12
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/