TAG:通义实验室

阿里通义实验室推出Wan2.7视频生成模型

阿里通义实验室推出Wan2.7视频生成模型

阿里通义实验室重磅发布全新的Wan2.7-Video视频生成模型,旨在革新AI视频创作体验,解决内容不专业和修改困难两大痛点。该模型支持文本、图像、视频和音频全模态输入,赋予创作者前所未有的自由度与精确控制力。用户可像编辑文档一样,精细调整画面结构、剧情走向、局部细节,轻松实现视频元素替换、背景转换、乃至角色台词与镜头角度的修改。此外,Wan2.7-Video还具备创意快速复刻和剧情无缝延续功能,极大提升了创作效率和灵活性。

2026-04-03 16:10
0
0

Qwen3.5-Omni发布 215项SOTA技术引领全感官AI

Qwen3.5-Omni发布 215项SOTA技术引领全感官AI

通义实验室发布全新多模态大模型Qwen3.5-Omni,具备全模态处理能力,在215项测试中获得业界最佳成绩。模型采用Hybrid-Attention MoE架构,支持256K超长上下文处理,并引入ARIA技术与RVQ编码提升语音交互能力。应用场景包括Vibe Coding、拟人化实时交互、视频拆解和音色克隆,标志着AI向理解物理世界的智能体迈进。

2026-03-31 10:32
60
0

通义实验室发布PrismAudio:让AI听懂视频实现智能配音告别声画分离

通义实验室发布PrismAudio:让AI听懂视频实现智能配音告别声画分离

阿里通义实验室发布全新视频生成音频框架PrismAudio,通过引入思维链与多维度强化学习评估,实现声音与画面的精准同步,解决AI配音中‘声画两张皮’难题。9秒视频仅需0.63秒生成高质量环境音效,轻量高效,已入选ICLR2026,推动影视创作进入‘所见即所闻’的真音时代。

2026-03-24 16:59
76
0

阿里通义开源影视级配音模型Fun-CineForge 解决音画同步问题

阿里通义开源影视级配音模型Fun-CineForge 解决音画同步问题

阿里通义实验室发布开源影视级配音大模型Fun-CineForge,首次引入时间模态概念,攻克音画不同步、情感表达缺失等难题。支持复杂场景下的精准配音,配套CineDub数据集构建流程显著降低标注成本,已在GitHub、HuggingFace和魔搭社区上线,推动AI语音技术向影视后期制作迈进。

2026-03-16 18:11
0
0

通义开源首个影视级配音大模型 AI实现情感化语音

通义开源首个影视级配音大模型 AI实现情感化语音

阿里通义实验室开源全球首个影视级配音大模型Fun-CineForge,突破AI配音机械感瓶颈,实现情感化表达和多场景音效还原。该模型采用创新一体化设计,配套开放高质量数据集构建方法,为影视创作者提供低成本高质量配音解决方案。

2026-03-16 17:42
0
0

马云谈AI之际 阿里千问核心负责人林俊旸辞职

马云谈AI之际 阿里千问核心负责人林俊旸辞职

阿里千问(Qwen)大模型核心负责人林俊旸社交媒体官宣卸任,阿里云暂未回应。报道指其离职或与团队拟分拆、管理范围缩小及对技术路线分歧有关;后训练负责人郁博文亦离职。事件发生在马云罕见发声强调AI加速迭代之际,引发外界对阿里AI组织调整与人才流动的关注。

2026-03-04 16:55
0
0

阿里AI业务整合 千问统一大模型品牌

阿里AI业务整合 千问统一大模型品牌

阿里巴巴宣布将AI业务品牌统一为“千问”,整合基础与专业模型,并推出千问APP作为旗舰应用。千问3.5开源模型在Hugging Face平台获得极高评价,春节期间APP处理近2亿次指令,日活用户增长显著。通义实验室的成立进一步强化了AI研发架构,助力阿里巴巴在人工智能领域持续创新。

2026-03-02 15:28
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/