TAG:语音交互
蚂蚁GPASS智能眼镜新增共享单车语音解锁功能
蚂蚁GPASS与千问AI眼镜深度融合,推出创新“AI办事”功能,用户仅需通过语音指令即可完成共享单车骑行、还车及停车缴费。该方案基于GPASS底层技术,集成声纹核身,并打通支付宝出行生态,实现信息无缝流转。用户在双手被占用场景下也能享受无感化操作,极大提升了出行便利性与安全性。此举标志着AI眼镜从基础交互设备向全能型随身智能终端迈进,持续拓宽智能生活应用场景。
OpenAI推出ChatGPT CarPlay版 适配苹果车载系统
OpenAI 正式发布支持苹果 CarPlay 的 ChatGPT 版本,驾驶员可通过语音安全使用 AI 助手。文章详细介绍了纯语音交互设计、苹果的严格规范以及车载 AI 的未来发展趋势。
谷歌推进氛围设计 Stitch更新支持语音驱动UI开发
谷歌推出AI编程工具Stitch的重大更新,引入语音功能推动“氛围设计”概念,使开发者能通过语音指令实时修改UI界面。这一创新降低了设计门槛,但也引发业内对AI依赖和设计精准度的讨论。
谷歌Stitch颠覆AI设计规则 五大功能挑战Figma霸主地位
Google Stitch 重大更新彻底改变了AI设计工具的定义,从简单的UI生成器进化为AI原生软件设计画布。新功能包括AI原生无限画布、智能设计Agent、语音交互Vibe Design、即时原型生成和DESIGN.md设计系统,让设计流程更加智能高效。这些创新不仅降低了设计门槛,还可能重塑整个软件开发流程。
肯德基联手阿里千问上线AI点餐助手 实现全流程语音点餐
肯德基与阿里通义千问大模型合作推出AI点餐助手“小K”,支持全流程语音交互。用户可通过自然语言指令(如预算、人数)完成智能套餐配置,车载端实现从选品到取餐的闭环服务。该应用利用RAG技术增强理解与对话能力,并结合历史记录进行个性化推荐,展现了AI智能体在餐饮数字化和业务流程整合中的深度应用。
AI外呼迈入精准时代 声网美团发布首个行业评测基准
声网与美团联合发布首个AI外呼行业评测基准VoiceAgentEval,通过真实业务场景、多维度评估和150种对话模拟,推动AI模型从技术参数转向业务实效,让AI外呼更具人性化和实用性。
ElevenLabs获5亿美元融资 估值达110亿美元成全球最贵AI语音公司
ElevenLabs完成5亿美元D轮融资,估值飙升至110亿美元,成为全球估值最高的AI语音服务商。公司2025年ARR超3.3亿美元,企业客户增长迅猛,技术产品加速迭代,标志着语音AI在企业级应用进入全面爆发期。
通义千问代打电话引热议 人机难辨引关注
阿里通义千问App推出AI“任务助理”代打电话订餐功能,凭借高度拟人化的语音和实时情绪识别能力,让AI与真人沟通真假难辨。文章探讨了该技术如何打破AI语音生硬的刻板印象,并展望未来AI对AI的高效交互场景,为忙碌或社恐人群提供生活减负新体验。
京东智能购物助手JoyGlance上线乐奇AI眼镜
京东科技与乐奇Rokid合作推出全球首款智能眼镜购物应用JoyGlance,通过AI大模型与光波导显示技术深度融合,实现语音指令快速识别商品,将购物流程简化为“说、看、付”,并采用金融级声纹识别保障支付安全。
东软集团与Cerence AI合作 构建智能座舱新体验
东软集团与Cerence AI达成战略合作,共同开发新一代智能座舱平台,聚焦智能语音和大语言模型技术,旨在为全球汽车制造商提供高效、预集成的智能交互解决方案,提升驾驶安全与情感体验。
英伟达推出 PersonaPlex-7B-v1 全双工语音交互技术
英伟达发布PersonaPlex-7B-v1全双工语音对话模型,采用单一Transformer架构实现端到端语音理解与生成,显著降低延迟并支持自然中断处理。该模型通过语音和文本双重引导实现深度个性化控制,在对话流畅度和任务达成率上表现优异,重塑了实时语音交互体验。
VC揭秘:哪些AI产品能避开OpenAI降维打击
本文基于投资机构Premise合伙人的观点,探讨了在OpenAI等巨头主导的AI市场中,初创公司如何寻找生存空间。文章指出,需要管理大量人力或复杂线下交付的平台型业务、语音交互驱动的“礼宾式”服务,以及深度集成特定垂直场景的产品,是初创公司可能避开巨头“降维打击”的关键机会。同时,文章展望了2026年消费级AI市场的潜在爆发和形态演变。
智元机器人与MiniMax联手推进全模态AI机器人应用
智元机器人与MiniMax达成合作,MiniMax将为智元机器人提供全流程的文本到语音AI技术支持。合作内容包括打造专属人设体系、优化语音交互体验、实现个性化音色合成,并基于音乐生成模型拓展娱乐场景,旨在提升机器人交互的个性化和多样化水平。
智元机器人联合MiniMax,实现人形机器人语音交互全链路AI技术落地
智元机器人与MiniMax达成战略合作,将端到端文本到语音技术应用于人形机器人,提升自然交互与情感表达能力。该技术可实现真人般流畅对话、多情感语气切换及低延迟语音输出,率先应用于家庭服务、商业导览等场景,推动具身智能生态成熟与人形机器人实用化进程。
OpenAI 推出全新音频AI技术,智能硬件产品即将面世
OpenAI正在加速音频AI模型的研发,旨在为2026年推出的新一代语音模型及语音优先智能硬件产品系列提供技术支持。新模型将具备更自然、富有情感的语音输出能力,并支持实时打断与“边听边说”的流畅交互。相关设备可能包括无屏智能眼镜等,致力于减少屏幕依赖,通过自然语音提升用户体验。