TAG:推理引擎

小型推理引擎DeepSeek V4 Flash 发布

小型推理引擎DeepSeek V4 Flash 发布

DeepSeek V4 Flash 是一款专为 Metal 平台设计的小型推理引擎,颠覆传统本地推理体验。它通过精简参数和独特思考模式,实现高效快速推理,处理复杂问题时间最短可达其他模型的五分之一。支持高达一百万个令牌的上下文窗口,硬件兼容性强,可在 MacBook 上运行,并提供完整解决方案包括 HTTP API 和 GGUF 模型。尽管处于 Alpha 阶段,但其优化性能和应用前景令人期待。

2026-05-08 18:58
0
0

AI推理的“新王”驾到?当xLLM-Core,用20毫秒的延迟,向vLLM发起挑战

AI推理的“新王”驾到?当xLLM-Core,用20毫秒的延迟,向vLLM发起挑战

xLLM社区将于12月6日举办首届线下Meetup,重磅发布自研开源推理引擎xLLM-Core。该引擎支持MoE、文生图、文生视频全场景,通过统一计算图和Mooncake缓存方案实现P99延迟低于20ms,较vLLM性能提升42%,吞吐量提升2.1倍。现场将分享京东双11实战案例,展示峰值每秒40k请求处理能力,并发布Apache 2.0开源版本。

爱力方 2025-11-25 16:39
106
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/