TAG:语音AI
微软开源语音AI VibeVoice 单次处理90分钟多说话人对话 GitHub获27K星
微软开源了前沿语音AI家族VibeVoice,包含自动语音识别(ASR)和文本转语音(TTS)模型,支持长达90分钟的多说话人对话处理,GitHub已获27K Star。项目采用MIT许可,支持本地部署,无需云端费用,为语音合成领域带来创新突破。
语音AI巨头ElevenLabs获5亿美元融资 估值升至110亿美元
全球领先的语音AI公司ElevenLabs宣布完成5亿美元融资,估值飙升至110亿美元,相比一年前增长超三倍。公司年经常性收入已达3.3亿美元,展现出强劲的商业化能力。本轮融资由红杉资本领投,资金将用于产品研发、全球市场扩张以及从语音模型向多模态智能代理的战略升级,旨在革新人机交互方式。
印度语音AI创企Bolna融资630万美元,专注多语种通话技术
印度班加罗尔语音AI初创公司Bolna近日获得630万美元种子轮融资,由General Catalyst领投。该公司提供多语种智能通话平台,通过强大的编排层支持自动外呼和高并发处理,服务于电商、金融等行业。自商业化以来,日通话量从1500次增至20万次,拥有超1050家付费客户。新资金将用于团队扩张和方言技术研发,目标在2026年实现500万美元ARR。
阿里通义开源语音交互大模型Fun-Audio-Chat-8B 超低延迟情绪识别
阿里通义实验室开源Fun-Audio-Chat-8B语音交互大模型,采用端到端S2S架构实现超低延迟对话,具备情感感知与语音函数调用能力,性能领先开源竞品并媲美顶级闭源模型,适用于情感陪伴、智能控制等多场景。
你的打字效率即将提升10倍?Wispr获2500万美元,证明AI语音才是输入的终极答案
语音AI创企Wispr宣布完成2500万美元B+轮融资,总融资额达8100万美元。公司年用户增长100倍,12个月留存率70%,自研ASR错误率低至10%,显著优于行业标杆。产品已覆盖Windows/Mac/iOS平台,计划升级为语音优先操作系统,实现语音驱动工作流自动化。
AI振兴网络视听每一帧,但人仍是不可替代的灵魂
2026-04-15
0 浏览
中国工程院院士郑纬民:从模型服务走向词元服务,是智能体时代对基础设施的必然要求
2026-04-15
0 浏览
微软接手OpenAI挪威星际之门项目 加码AI算力布局
2026-04-15
0 浏览
让AI帮忙买保险结果付款给了陌生人?每经记者亲测:通用AI和保险AI用谁买保险更靠谱
2026-04-15
0 浏览
爱奇艺创始人、首席执行官龚宇:期待AI生成的高品质影视作品
2026-04-15
0 浏览
激进投资者施压叠加AI效率提升 Snap启动16%裁员计划 股价盘前大涨11%
2026-04-15
0 浏览
地平线副总裁吕鹏:物理AI时代需打造超级平台,舱驾融合是智能电动2026发展方向
2026-04-15
0 浏览
加纳驻华大使携手APUS签署战略合作,启动KOJO BONSU GEN Z AI CLUB
2026-04-15
0 浏览
AI时代背景下初高中学习:真人老师与AI工具谁更能提升学习效果
2026-04-15
0 浏览
佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍
2026-04-15
0 浏览