TAG:多模态分割
五校联手推出DeSa2VA框架,攻克多模态分割难题
五校联合团队推出的DeSa2VA框架解决了多模态分割中的模态鸿沟问题。文章重点介绍了HO-Cap解决方案,它通过低成本RGB-D相机和AR头显,结合半自动化AI标注流程,高效生成高精度手-物交互3D数据。配套开源的HO-Cap数据集包含65.6万帧数据,覆盖多种日常物体和交互场景,大幅降低了相关研究门槛,并可直接用于机器人操作、VR/AR等领域的训练与测试。
五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!
五校联合研究团队开发出DeSa2VA框架,通过解耦增强提示技术解决多模态分割中的模态鸿沟问题。该框架将MLLM隐藏状态显式解耦为文本和视觉表征,采用文本-视觉对齐训练和动态掩码融合方案,显著提升了图像、视频分割及视觉问答任务的准确性与鲁棒性,为计算机视觉领域提供了新的技术突破。
AI振兴网络视听每一帧,但人仍是不可替代的灵魂
2026-04-15
0 浏览
中国工程院院士郑纬民:从模型服务走向词元服务,是智能体时代对基础设施的必然要求
2026-04-15
0 浏览
微软接手OpenAI挪威星际之门项目 加码AI算力布局
2026-04-15
0 浏览
让AI帮忙买保险结果付款给了陌生人?每经记者亲测:通用AI和保险AI用谁买保险更靠谱
2026-04-15
0 浏览
爱奇艺创始人、首席执行官龚宇:期待AI生成的高品质影视作品
2026-04-15
0 浏览
激进投资者施压叠加AI效率提升 Snap启动16%裁员计划 股价盘前大涨11%
2026-04-15
0 浏览
地平线副总裁吕鹏:物理AI时代需打造超级平台,舱驾融合是智能电动2026发展方向
2026-04-15
0 浏览
加纳驻华大使携手APUS签署战略合作,启动KOJO BONSU GEN Z AI CLUB
2026-04-15
0 浏览
AI时代背景下初高中学习:真人老师与AI工具谁更能提升学习效果
2026-04-15
0 浏览
佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍
2026-04-15
0 浏览