TAG:AI语音交互
OpenAI发布三款实时语音模型,GPT-5级推理能力落地
OpenAI最新推出三款实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。GPT-Realtime-2作为首款具备GPT-5级推理能力的语音工具,能实现自然流畅对话、复杂逻辑推理和实时处理打断,攻克语音交互中的延迟高、无法自然打断等痛点。另外两款模型分别专注于多语言翻译和低延迟转录,通过Realtime API提供,标志着AI语音交互从简单响应向深度实时理解的跨越。
Grok上线语音API 马斯克AI语音争霸再添新局
马斯克旗下xAI宣布Grok语音API正式上线,标志着Grok从文本交互迈向多模态对话时代。凭借独特的幽默与毒舌风格,Grok now can 'speak'—为开发者提供个性化语音集成能力,加速AI助手在智能助理、播客生成等场景的应用。这场语音能力的升级,也预示着AI‘嘴替’争霸战进入新阶段。
苹果布局音频AI:收购Q.ai强化Siri能力
苹果公司近日收购以色列音频AI初创公司Q.ai,旨在通过其顶尖技术提升Siri在嘈杂环境下的语音识别能力。Q.ai专注于非理想环境下的语音理解,能有效过滤噪音并解析低音量耳语,这将为Siri的个性化改造和竞争应对注入关键动力。
基流科技清华90后创始人3年带领公司闯港股 成中国最大AI包工头
2026-05-13
0 浏览
中国AI用电量暴增,算电协同概念梳理
2026-05-13
0 浏览
手术机器人行业的竞争窗口正在收窄,留给新入局者的时机不多。
2026-05-13
0 浏览
马化腾反思一年前对AI的乐观预期 腾讯坚持正确发展路径避免盲目竞争
2026-05-13
0 浏览
数据基建,具身智能的下一场竞争
2026-05-13
0 浏览
百度AI认知三年跃迁:从人人都是开发者到人人都是超级个体
2026-05-13
0 浏览
德国官员表示期待中国车企赴德合作生产汽车
2026-05-13
0 浏览
AI人才争夺战升温,月之暗面与DeepSeek的反大厂化之路
2026-05-13
0 浏览
软银从OpenAI投资中获利450亿美元
2026-05-13
0 浏览
谷歌正抢先布局移动端AI:Gemini将植入Android 迎战苹果大更新
2026-05-13
0 浏览