TAG:音画同步
Seedance 2.0 发布:多模态架构实现音画同步创作
字节跳动Seed团队正式发布新一代视频创作模型Seedance 2.0,采用统一多模态音视频联合生成架构,支持15秒高质量多镜头输出与音画同步。该模型在复杂运动场景的物理还原、多模态参考输入以及视频编辑延展能力上实现突破,旨在降低影视、广告等领域的工业级创作门槛。
开源版Veo 3登场:LTX-2发布,20秒4K音画同步AI视频本地可生成
Lightricks团队开源LTX-2模型,这是一个支持一次性生成长达20秒4K高清视频的完整音视频基础模型,实现了画面、声音与口型的完美同步。模型权重和代码已全部开源,支持本地部署,在消费级显卡上即可流畅运行,大幅降低了AI视频创作的门槛。
Seedance 1.5 Pro上线火山方舟 推出全新AI视频生成技术
Seedance 1.5 Pro正式上线火山方舟,带来AI视频生成技术的重大革新。该模型在音画同步、多语言对白配音和影视级叙事张力方面表现突出,支持毫秒级音画同步和原生音效生成,显著提升视频质量和创作效率。适用于电商、广告、影视等多个领域,助力创作者实现高质量内容生产。
千问APP融合万相Wan2.5 视频功能全面进化
千问APP接入阿里万相Wan2.5模型,视频创作能力全面升级,成为首个支持音视频同步输出的移动端AI助手。用户只需一张照片和一段文字,即可生成1080P高清、动作自然的唱跳视频,最长10秒,大幅降低创作门槛并激发用户创意。
Character AI联合耶鲁大学发布Ovi:实现音画同步的视频生成模型
Character AI与耶鲁大学联合推出开源项目Ovi,这是一项革命性的音画同步视频生成技术。通过创新的双骨干交叉模态融合架构,Ovi实现了音频和视频的并行处理与实时交互,彻底解决了传统方法中音画不同步的问题。该技术采用扩散变换器架构和旋转位置嵌入技术,确保嘴唇运动与发音等细节的精确匹配,为高质量视频生成提供了全新解决方案。
互联网
2025-11-14 10:53
AI振兴网络视听每一帧,但人仍是不可替代的灵魂
2026-04-15
0 浏览
中国工程院院士郑纬民:从模型服务走向词元服务,是智能体时代对基础设施的必然要求
2026-04-15
0 浏览
微软接手OpenAI挪威星际之门项目 加码AI算力布局
2026-04-15
0 浏览
让AI帮忙买保险结果付款给了陌生人?每经记者亲测:通用AI和保险AI用谁买保险更靠谱
2026-04-15
0 浏览
爱奇艺创始人、首席执行官龚宇:期待AI生成的高品质影视作品
2026-04-15
0 浏览
激进投资者施压叠加AI效率提升 Snap启动16%裁员计划 股价盘前大涨11%
2026-04-15
0 浏览
地平线副总裁吕鹏:物理AI时代需打造超级平台,舱驾融合是智能电动2026发展方向
2026-04-15
0 浏览
加纳驻华大使携手APUS签署战略合作,启动KOJO BONSU GEN Z AI CLUB
2026-04-15
0 浏览
AI时代背景下初高中学习:真人老师与AI工具谁更能提升学习效果
2026-04-15
0 浏览
佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍
2026-04-15
0 浏览