TAG:推理引擎
小型推理引擎DeepSeek V4 Flash 发布
DeepSeek V4 Flash 是一款专为 Metal 平台设计的小型推理引擎,颠覆传统本地推理体验。它通过精简参数和独特思考模式,实现高效快速推理,处理复杂问题时间最短可达其他模型的五分之一。支持高达一百万个令牌的上下文窗口,硬件兼容性强,可在 MacBook 上运行,并提供完整解决方案包括 HTTP API 和 GGUF 模型。尽管处于 Alpha 阶段,但其优化性能和应用前景令人期待。
AI推理的“新王”驾到?当xLLM-Core,用20毫秒的延迟,向vLLM发起挑战
xLLM社区将于12月6日举办首届线下Meetup,重磅发布自研开源推理引擎xLLM-Core。该引擎支持MoE、文生图、文生视频全场景,通过统一计算图和Mooncake缓存方案实现P99延迟低于20ms,较vLLM性能提升42%,吞吐量提升2.1倍。现场将分享京东双11实战案例,展示峰值每秒40k请求处理能力,并发布Apache 2.0开源版本。
基流科技清华90后创始人3年带领公司闯港股 成中国最大AI包工头
2026-05-13
0 浏览
中国AI用电量暴增,算电协同概念梳理
2026-05-13
0 浏览
手术机器人行业的竞争窗口正在收窄,留给新入局者的时机不多。
2026-05-13
0 浏览
马化腾反思一年前对AI的乐观预期 腾讯坚持正确发展路径避免盲目竞争
2026-05-13
0 浏览
数据基建,具身智能的下一场竞争
2026-05-13
0 浏览
百度AI认知三年跃迁:从人人都是开发者到人人都是超级个体
2026-05-13
0 浏览
德国官员表示期待中国车企赴德合作生产汽车
2026-05-13
0 浏览
AI人才争夺战升温,月之暗面与DeepSeek的反大厂化之路
2026-05-13
0 浏览
软银从OpenAI投资中获利450亿美元
2026-05-13
0 浏览
谷歌正抢先布局移动端AI:Gemini将植入Android 迎战苹果大更新
2026-05-13
0 浏览