TAG:语音AI

微软开源语音AI VibeVoice 单次处理90分钟多说话人对话 GitHub获27K星

微软开源语音AI VibeVoice 单次处理90分钟多说话人对话 GitHub获27K星

微软开源了前沿语音AI家族VibeVoice,包含自动语音识别(ASR)和文本转语音(TTS)模型,支持长达90分钟的多说话人对话处理,GitHub已获27K Star。项目采用MIT许可,支持本地部署,无需云端费用,为语音合成领域带来创新突破。

2026-03-30 15:33
0
0

语音AI巨头ElevenLabs获5亿美元融资 估值升至110亿美元

语音AI巨头ElevenLabs获5亿美元融资 估值升至110亿美元

全球领先的语音AI公司ElevenLabs宣布完成5亿美元融资,估值飙升至110亿美元,相比一年前增长超三倍。公司年经常性收入已达3.3亿美元,展现出强劲的商业化能力。本轮融资由红杉资本领投,资金将用于产品研发、全球市场扩张以及从语音模型向多模态智能代理的战略升级,旨在革新人机交互方式。

2026-02-05 11:39
8
0

印度语音AI创企Bolna融资630万美元,专注多语种通话技术

印度语音AI创企Bolna融资630万美元,专注多语种通话技术

印度班加罗尔语音AI初创公司Bolna近日获得630万美元种子轮融资,由General Catalyst领投。该公司提供多语种智能通话平台,通过强大的编排层支持自动外呼和高并发处理,服务于电商、金融等行业。自商业化以来,日通话量从1500次增至20万次,拥有超1050家付费客户。新资金将用于团队扩张和方言技术研发,目标在2026年实现500万美元ARR。

2026-01-21 17:14
38
0

阿里通义开源语音交互大模型Fun-Audio-Chat-8B 超低延迟情绪识别

阿里通义开源语音交互大模型Fun-Audio-Chat-8B 超低延迟情绪识别

阿里通义实验室开源Fun-Audio-Chat-8B语音交互大模型,采用端到端S2S架构实现超低延迟对话,具备情感感知与语音函数调用能力,性能领先开源竞品并媲美顶级闭源模型,适用于情感陪伴、智能控制等多场景。

爱力方 2025-12-24 17:06
23
0

你的打字效率即将提升10倍?Wispr获2500万美元,证明AI语音才是输入的终极答案

你的打字效率即将提升10倍?Wispr获2500万美元,证明AI语音才是输入的终极答案

语音AI创企Wispr宣布完成2500万美元B+轮融资,总融资额达8100万美元。公司年用户增长100倍,12个月留存率70%,自研ASR错误率低至10%,显著优于行业标杆。产品已覆盖Windows/Mac/iOS平台,计划升级为语音优先操作系统,实现语音驱动工作流自动化。

爱力方 2025-11-21 15:15
24
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/