TAG:性能优化

Perplexity推出“搜索即代码”,打破僵化API,让AI智能体自主编写搜索管道

Perplexity推出“搜索即代码”,打破僵化API,让AI智能体自主编写搜索管道

Perplexity推出‘搜索即代码’(SaC)新架构,打破传统搜索API的僵化限制,让AI智能体能动态编写和执行自定义搜索工作流程。通过三层核心设计,SA C使AI并行处理查询、过滤无关信息,高效提取结果,显著提升任务性能。在CVE漏洞研究测试中,该架构节省了85%的Token消耗,并在多项基准测试中表现突出,为解决AI搜索智能体的行业痛点提供了创新方案。

2026-06-08 11:10
97
0

MiniCPM-V 4.6 重新定义端侧多模态巅峰,搭载1.3B模型

MiniCPM-V 4.6 重新定义端侧多模态巅峰,搭载1.3B模型

面壁智能联合清华大学发布MiniCPM-V4.6,一个仅1.3B参数的端侧多模态大模型。它在多项评测中表现卓越,性能直逼更大模型,同时优化了推理速度和资源占用,支持主流设备运行。通过LLaVA-UHD v4技术降低开销,并开源适配多种框架,已在汽车、智能家居等领域落地,推动端侧AI普及。

2026-05-27 14:43
23
0

智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一

智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一

智谱联合清华大学等在ACM SIGCOMM 2025上提出ZCube网络架构,针对大模型推理中的网络瓶颈。该架构采用扁平化设计,取消Spine层交换机,实现流量负载均衡。在GLM-5.1coding生产环境中,ZCube使GPU推理吞吐提升15%,首Token时延降低40.6%,同时网络成本削减33%。这标志着智算基础设施从通用互联向模型流量驱动的系统协同转变,为大规模AI推理提供了高效经济的解决方案。

2026-05-21 11:45
0
0

Moonshot AI与清华大学提出跨数据中心PrfaaS创新架构

Moonshot AI与清华大学提出跨数据中心PrfaaS创新架构

本文介绍了 Moonshot AI 与清华大学提出的 PrfaaS(预填充即服务)架构:将大模型推理中的预填充与解码阶段跨数据中心解耦,借助专用计算集群与以太网传输 KVCache,突破传统同中心部署瓶颈。研究显示该方案可将吞吐量提升54%,并通过分层路由与双时间尺度调度降低延迟、提升资源利用率。

2026-04-20 10:51
0
0

更轻快更智能 Codepilot 0.39.0发布 重构上下文处理底层逻辑

更轻快更智能 Codepilot 0.39.0发布 重构上下文处理底层逻辑

Codepilot 0.39.0版本发布,重点优化底层性能与用户交互体验。新版本引入统一上下文层,简化处理流程并提升响应速度,同时增强Bridge功能,支持CLI工具上下文注入。交互界面升级包括计划模式状态持久化、侧边栏菜单精简和窄屏显示修复,为开发者提供更高效稳定的AI编程辅助环境。

2026-03-25 11:19
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/