TAG:多语言支持

Mistral AI 发布 OCR4 模型：支持 170 种语言，输出质量超越 GPT 与 Gemini

法国人工智能初创公司Mistral AI发布了最新文档内容识别模型OCR 4，该模型支持多达170种语言，在权威基准测试中表现卓越，输出质量超越GPT和Gemini。OCR 4专注于高效文档处理，提供边框定位、区域分类及置信度评分，支持多种下游任务如RAG语义分块和智能体结构化。定价为每千页4美元，批量折扣50%，标志着Mistral AI在文档智能领域与巨头展开竞争。

aibase

2026-06-26 13:48

Claude语音交互将升级，或支持多语言并推出通话式体验

Anthropic 正在为 Claude 语音模式推进重要升级，或将新增中文、粤语、日语等多语言支持，并引入“按下通话”等新交互方式。结合 iOS 端疑似电话图标变化，Claude 有望迈向更自然、接近通话式的 AI 语音体验。

aibase

2026-06-18 15:44

微信支付发布AI工具箱2.0：不仅支持听懂9国语言，Token消耗还减少一半

微信支付官方发布AI工具箱2.0，全面支持9国语言并进行原生语义适配，知识库扩容至全品类，新增技术与金融级研发专家，CLI动态排障+文档转Mermaid格式让Token消耗减少一半。助力全球开发者高效、安全接入支付服务，显著提升开发效率与成本控制。

aibase

2026-06-15 17:43

Hume AI开源TADA模型手机端可流畅运行700秒长音频

Hume AI开源了其最新TTS模型TADA，采用文本-声学双对齐架构，实现5倍速生成与零内容幻觉，支持多语言并在低功耗设备上运行长达700秒长音频。该模型还支持同步转录，提升语音交互与内容创作效率。

aibase

2026-03-12 14:49

谷歌AI虚拟形象支持24种语言打破语言障碍

谷歌宣布对其AI虚拟形象和AI配音功能进行重大升级，新增7种语言支持，现已覆盖24种语言。此次升级通过原生语音模型和多角色协同技术，使AI发音更自然、更具情感，大幅提升了企业培训、客户服务和全球化内容创作的效率与体验，推动跨语言沟通进入无障碍时代。

aibase

2026-02-25 11:02

Mistral 发布全新语音转文字 AI 模型，主打极致低延迟

Mistral AI发布两款全新语音转文字模型Voxtral Mini Transcribe V2和Voxtral Realtime，主打极致低延迟与高性价比。实时模型延迟最低可配置为200毫秒，支持本地部署保障隐私；批量处理模型在词错率基准测试中表现优异，API价格低至每分钟0.003美元。两款模型均原生支持中文、英语等13种语言，适用于虚拟助手、呼叫中心等多种商业场景。

aibase

2026-02-11 16:57

Mistral AI发布Voxtral Transcribe 2语音模型，中文实时转录延迟低于0.2秒

Mistral AI发布Voxtral Transcribe 2语音模型系列，包括Voxtral Realtime实时转录模型和Voxtral Mini Transcribe V2批量处理模型。Realtime模型延迟低于0.2秒，支持音频即时转录，并已开源权重；Mini版在准确率上超越GPT-4o mini等竞品，支持3小时长音频处理。两款模型均支持中文等13种语言，定价具有竞争力，适用于实时对话、同声传译及批量转录场景。

aibase

2026-02-05 17:04

550

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

Meta推出革命性的Omnilingual ASR自动语音识别系统，支持1600种语言的语音转录，其中500种语言首次获得AI覆盖。该系统采用上下文学习技术，用户只需提供少量样本即可扩展识别能力，理论上可支持超过5400种语言。Meta同时开源了包含350种语言的大型数据集，帮助开发者为特定地区构建定制化语音识别模型，显著推进全球语言无障碍进程。

爱力方

2025-11-11 12:25

通知

尊敬的用户

user

TAG:多语言支持

Mistral AI 发布 OCR4 模型：支持 170 种语言，输出质量超越 GPT 与 Gemini

Claude语音交互将升级，或支持多语言并推出通话式体验

微信支付发布AI工具箱2.0：不仅支持听懂9国语言，Token消耗还减少一半

Hume AI开源TADA模型手机端可流畅运行700秒长音频

谷歌AI虚拟形象支持24种语言打破语言障碍

Mistral 发布全新语音转文字 AI 模型，主打极致低延迟

Mistral AI发布Voxtral Transcribe 2语音模型，中文实时转录延迟低于0.2秒

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

user

TAG:多语言支持

Mistral AI 发布 OCR4 模型：支持 170 种语言，输出质量超越 GPT 与 Gemini

Claude语音交互将升级，或支持多语言并推出通话式体验

微信支付发布AI工具箱2.0：不仅支持听懂9国语言，Token消耗还减少一半

Hume AI开源TADA模型 手机端可流畅运行700秒长音频

谷歌AI虚拟形象支持24种语言打破语言障碍

Mistral 发布全新语音转文字 AI 模型，主打极致低延迟

Mistral AI发布Voxtral Transcribe 2语音模型，中文实时转录延迟低于0.2秒

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资 首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红 芯片概念股冲高回落 短期风险需警惕

申昊科技拟设具身智能子公司 加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

Hume AI开源TADA模型手机端可流畅运行700秒长音频

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务