TAG:人工智能技术
字节跳动发布StoryMem系统 解决AI视频角色一致性难题
字节跳动与南洋理工大学联合推出StoryMem系统,通过存储关键帧并在后续场景生成时参考,有效解决了AI视频生成中角色外观和环境不一致的问题。该系统在跨场景一致性上比现有模型提升了28.7%,用户调查显示其在美观性和一致性方面表现更佳,但处理复杂多角色场景时仍需优化提示描述。
字节跳动推出StoryMem技术 解决AI视频角色走样问题
字节跳动与南洋理工大学联合推出StoryMem系统,通过创新的“混合记忆库”设计,为AI视频生成提供长期记忆能力,有效解决了角色走样和环境闪烁的行业难题。该系统基于高效算法,在保持角色形象和背景细节跨场景一致性的同时,显著提升了视频生成质量,已在开源平台发布供开发者使用。
智谱开源周落幕 四项视频生成技术开放
智谱多模态开源周圆满落幕,团队开源了四项视频生成核心技术:SCAIL、RealVideo、Kaleido和SSVAE。这些技术分别针对影视级角色动画生成、实时流式视频生成、多主体一致性生成以及训练效率优化,旨在解决视频生成领域的关键难题,推动AI视频技术的发展与创新。
苹果发布STARFlow-V 革新视频生成技术
苹果公司推出创新视频生成模型STARFlow-V,采用归一化流技术替代主流扩散模型,显著提升长视频生成的稳定性和训练效率。该模型支持文本转视频、图像转视频及视频编辑等多种任务,通过双重架构优化时间序列与单帧细节,在自回归模型中表现优异。未来苹果将继续优化计算速度和物理准确性,推动视频生成技术发展。
字节发布Seedream 4.5 图像生成实现多图一致性
字节跳动Seed团队发布Seedream 4.5,重点突破多图场景一致性和美学指令遵循两大核心能力。新版本解决了AI图像生成中角色、服饰、光影在多图中不一致的痛点,实现了批量生成的高度统一,同时在复杂风格描述下精准控制画面质感,为电商、IP设计等商业场景提供强大支持。
AI振兴网络视听每一帧,但人仍是不可替代的灵魂
2026-04-15
0 浏览
中国工程院院士郑纬民:从模型服务走向词元服务,是智能体时代对基础设施的必然要求
2026-04-15
0 浏览
微软接手OpenAI挪威星际之门项目 加码AI算力布局
2026-04-15
0 浏览
让AI帮忙买保险结果付款给了陌生人?每经记者亲测:通用AI和保险AI用谁买保险更靠谱
2026-04-15
0 浏览
爱奇艺创始人、首席执行官龚宇:期待AI生成的高品质影视作品
2026-04-15
0 浏览
激进投资者施压叠加AI效率提升 Snap启动16%裁员计划 股价盘前大涨11%
2026-04-15
0 浏览
地平线副总裁吕鹏:物理AI时代需打造超级平台,舱驾融合是智能电动2026发展方向
2026-04-15
0 浏览
加纳驻华大使携手APUS签署战略合作,启动KOJO BONSU GEN Z AI CLUB
2026-04-15
0 浏览
AI时代背景下初高中学习:真人老师与AI工具谁更能提升学习效果
2026-04-15
0 浏览
佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍
2026-04-15
0 浏览