TAG:API

AI组队“拼单”新模式:OpenRouter发布Fusion API,主打性能与性价比双重优化

AI组队“拼单”新模式:OpenRouter发布Fusion API,主打性能与性价比双重优化

OpenRouter近日发布Fusion API,这是一项多模型协同服务,通过并行处理多个AI模型并整合结果,实现性能与成本的双重优化。基准测试显示,该方案在性能上超越了Claude Fable5等领先模型,同时成本可降低约一半,显著提升性价比。这为开发者提供了新的技术路径,有助于在AI大模型应用中优化资源配置并降低调用成本。

2026-06-16 18:13
83
0

DeepSeek 拟采用蜜雪冰城打法 打造中国版 Claude Code

DeepSeek 拟采用蜜雪冰城打法 打造中国版 Claude Code

DeepSeek 通过永久降价 V4‑Pro API,将输入缓存成本降至 0.025 元/百万 token,输出降至 6 元,并提供 500 并发,显著提升性价比,为开发者和企业提供更具竞争力的 AI 接口。

2026-06-10 13:55
0
0

亚马逊 SageMaker AI 推出兼容 OpenAI API 的实时推理端点

亚马逊 SageMaker AI 推出兼容 OpenAI API 的实时推理端点

亚马逊 SageMaker AI 近期推出兼容 OpenAI API 的实时推理端点,用户只需更改端点 URL 即可使用 OpenAI SDK、LangChain 等工具无缝调用模型,无需额外代码定制。该功能支持多模型托管、流式输出,并简化了 Bearer Token 认证流程,使现有应用程序能轻松集成,提供高效灵活的 AI 推理解决方案。

2026-05-21 17:46
0
0

Google 升级 Gemini API 文件搜索,多模态 RAG 能力增强

Google 升级 Gemini API 文件搜索,多模态 RAG 能力增强

Google 近期对 Gemini API 的文件搜索功能进行了重大升级,引入了多模态检索增强生成(RAG)能力。此次更新基于 Gemini Embedding2 模型,支持文本、图像和复杂文档的统一处理,使 AI 能够深度理解视觉元素如图表和设计图。开发者无需搭建复杂系统,即可实现完整的 RAG 工作流,显著提升客服机器人和文档分析等企业级应用的准确性。新增的自定义元数据过滤和页面级引用功能进一步优化了信息检索的效率和透明度,目前已向全球开发者开放。

2026-05-11 15:53
0
0

OpenAI 发布官方 CLI 工具 openai-cli:一行命令即可调用 Responses API 与全套 Agent 工具

OpenAI 发布官方 CLI 工具 openai-cli:一行命令即可调用 Responses API 与全套 Agent 工具

OpenAI 正式发布官方命令行工具 openai-cli,开发者可通过终端一行命令直接调用 Responses API 和全套 Agent 工具,如 Web 搜索、代码解释器等。该工具开源且安装简便,支持结构化输出和管道操作,简化多模态 AI 任务(如图像生成、语音转录)的接入,提升本地开发、自动化脚本和 DevOps 效率,填补了 OpenAI 工具链在命令行领域的空白。

2026-05-08 10:51
62
0

Chrome 正式发布 Prompt API,网页可直接调用 Gemini Nano 本地模型,浏览器原生 AI 时代来临

Chrome 正式发布 Prompt API,网页可直接调用 Gemini Nano 本地模型,浏览器原生 AI 时代来临

本文介绍 Chrome 正式推出 Prompt API,开发者可在网页中直接调用浏览器内置的 Gemini Nano 本地模型,实现离线推理、隐私保护与更低接入成本,并解析其核心优势、当前限制及对 Web AI 生态的行业意义。

2026-04-30 11:06
90
0

OpenAI语音API全面升级:转录精度提升 代理速度提升40%

OpenAI语音API全面升级:转录精度提升 代理速度提升40%

OpenAI 发布两项重要 API 更新,包括全新的实时模型 gpt-realtime-1.5 和引入 WebSocket 协议的 Responses API。新模型显著提升了数字、字母转录及语音指令执行的准确率,而架构改进则使复杂 AI 代理的运行速度大幅提升 20%-40%,全面优化了语音交互与任务处理性能。

2026-02-25 11:03
0
0

谷歌AI云业务半年翻倍,从烧钱换量转向质量盈利,企业落地仍存分歧

谷歌AI云业务半年翻倍,从烧钱换量转向质量盈利,企业落地仍存分歧

文章分析了谷歌Gemini API调用量半年内翻倍增长的现象,揭示了谷歌AI云业务从烧钱扩张转向质量盈利的战略转变。文章指出,虽然Gemini新版本提升了利润率并吸引了大量企业客户,但在具体业务场景落地时仍面临用户评价分化和产品易用性挑战。

2026-01-20 15:58
2
0

AI手机竞争格局显现:豆包加速布局,苹果谷歌为何保持谨慎?

AI手机竞争格局显现:豆包加速布局,苹果谷歌为何保持谨慎?

本文分析了AI手机领域的两大技术路线分野:以字节跳动豆包手机为代表的GUI路线,通过系统级权限实现跨应用操作,但面临隐私和生态阻力;苹果和谷歌则坚持API标准化路线,强调稳定性和隐私保护,但生态构建缓慢。文章探讨了这两种路线背后的商业逻辑、技术挑战及行业影响。

2025-12-20 19:41
14
0

谷歌开放新版深度研究代理API,开发者可首次接入

谷歌开放新版深度研究代理API,开发者可首次接入

谷歌正式向开发者开放更新版深度研究代理API,首次允许将先进的自主研究功能集成到第三方应用中。该代理基于Gemini 3 Pro优化,采用迭代式搜索方法,性能超越现有模型,并推出DeepSearchQA开源基准以评估复杂搜索任务。开发者现可接入PDF分析、可控报告等新功能,未来还将支持图表生成和数据源扩展。

2025-12-12 16:29
0
0

GPT-5.1-CodexMax上线 最强编码模型开放API接口

GPT-5.1-CodexMax上线 最强编码模型开放API接口

OpenAI宣布其最新最强的编码模型GPT-5.1-CodexMax现已全面接入响应API,开发者可立即将其整合到应用和工作流中。该模型在复杂任务分解、代码生成质量和自主执行方面表现卓越,旨在降低高性能AI编程能力的门槛,为各类产品提供智能编程助手体验。

2025-12-05 10:16
21
0

xAI 拓展开发者服务,模型对创始人偏见引发合规性审视

xAI 拓展开发者服务,模型对创始人偏见引发合规性审视

马斯克的AI公司xAI发布Grok4.1Fast API,包含推理和非推理两个新模型,增强了上下文处理和工具调用能力。然而该模型因对马斯克的过度赞美引发公众质疑,用户发现Grok对马斯克的评价明显优于其他名人,暴露了模型的偏见问题。这一争议影响了xAI关于AI准确性和可信度的宣传,尽管马斯克称这是对抗性提示导致的问题。

爱力方 2025-11-21 16:42
34
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/