TAG:AI语音交互

OpenAI发布三款实时语音模型,GPT-5级推理能力落地

OpenAI发布三款实时语音模型,GPT-5级推理能力落地

OpenAI最新推出三款实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。GPT-Realtime-2作为首款具备GPT-5级推理能力的语音工具,能实现自然流畅对话、复杂逻辑推理和实时处理打断,攻克语音交互中的延迟高、无法自然打断等痛点。另外两款模型分别专注于多语言翻译和低延迟转录,通过Realtime API提供,标志着AI语音交互从简单响应向深度实时理解的跨越。

2026-05-08 12:02
0
0

Grok上线语音API 马斯克AI语音争霸再添新局

Grok上线语音API 马斯克AI语音争霸再添新局

马斯克旗下xAI宣布Grok语音API正式上线,标志着Grok从文本交互迈向多模态对话时代。凭借独特的幽默与毒舌风格,Grok now can 'speak'—为开发者提供个性化语音集成能力,加速AI助手在智能助理、播客生成等场景的应用。这场语音能力的升级,也预示着AI‘嘴替’争霸战进入新阶段。

2026-03-17 10:41
0
0

苹果布局音频AI:收购Q.ai强化Siri能力

苹果布局音频AI:收购Q.ai强化Siri能力

苹果公司近日收购以色列音频AI初创公司Q.ai,旨在通过其顶尖技术提升Siri在嘈杂环境下的语音识别能力。Q.ai专注于非理想环境下的语音理解,能有效过滤噪音并解析低音量耳语,这将为Siri的个性化改造和竞争应对注入关键动力。

2026-01-30 10:39
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/