TAG:开源模型
Step 3.7 Flash重磅发布:Agent效率新时代到来
Step3.7Flash开源模型正式发布,专为Agent时代设计,解决效率、可靠性和多模态执行痛点。它在多项基准测试中领先,如ClawEval-1.1排名第一,提供高速推理(400TPS)和低成本部署。模型能理解视觉内容,自主完成代码生成和工具调用,工具调用成功率高达98%以上。同时,兼容主流Agent框架,支持本地运行,为开发者构建高效、可靠的智能工作流提供强大支持。
DeepSeek V4降价75%并保留永久折扣,登顶全球AI性价比榜首
DeepSeek公司近日宣布其旗舰AI模型DeepSeek-V4-Pro永久降价75%,将限时优惠转为永久定价。这一举措使其在权威评估中登顶全球AI性价比榜首,成本仅为OpenAI GPT-5.5的十二分之一。同时,模型性能保持世界前沿,智能体和代码构建能力突出,展示了高性价比与顶尖技术的结合,引领AI普惠风暴。
地平线HoloMotion-1开源4亿参数小脑模型,释放信号:人形机器人竞争焦点正从大脑向肢体协同迁移
地平线开源了HoloMotion-1模型,这是一个4亿参数的‘小脑’大模型,专注于人形机器人的全身运动控制。该模型能从人类视频、动作捕捉数据和遥操作指令中学习动作,实现精准的肢体协同。这标志着人形机器人技术竞争正从‘大脑’智能向‘肢体’执行迁移,为开发者提供了关键工具,加速机器人落地应用。
重构图像生成范式 智象未来原生全模态大模型HiDream-O1-Image登顶AA榜开源首发
智象未来发布的HiDream-O1-Image模型,以8B参数规模登顶Artificial Analysis文生图榜单开源第一。该模型采用原生全模态架构,摒弃传统VAE和独立文本编码器,通过像素级统一Transformer实现端到端生成,减少模态转换损耗。创新性地引入基于Gemma 4的推理智能体,在生成前进行思维链推理,提升指令遵循能力,打破开源图像生成领域稳定格局,推动多模态基础模型发展。
李开复:开源模型是实现AI主权的更优路径
创新工场董事长李开复深入探讨“AI主权”概念,指出开源模型是大多数国家实现技术自主的更优路径。他强调,基于开源进行本地化训练能以低成本适配本土文化与法律,避免盲目追求昂贵的闭源方案。文章还分析了中美AI竞争,认为中国在工程效率和硬件制造上具有结构性优势,未来AI生态将呈现闭源与开源并存的格局。
月之暗面Kimi创始人于人民日报撰文:推动中国大模型成为全球创新基石
月之暗面Kimi创始人杨植麟在人民日报刊文,阐述中国大模型技术的迅猛发展及其作为全球创新基座的潜力。文章强调中国在人工智能领域的用户基数、应用场景和自研模型优势,通过开源生态和技术创新(如重构Transformer架构)提升性能、降低成本,推动全球AI进步。作者呼吁开放合作与持续钻研,为世界提供普惠技术,贡献中国力量。
时代杂志评选2026年十大最具影响力AI公司 字节、阿里、智谱上榜
《时代》杂志评选出2026年十大最具影响力AI公司,字节跳动、阿里巴巴和智谱作为中国公司成功入选。文章详细介绍了这三家公司在AI领域的突破,如字节跳动的AI助手'豆包'实现大规模普及,阿里巴巴的开源模型'千问'系列成为全球热门,智谱基于国产算力平台参与前沿竞争。榜单还包括OpenAI、Anthropic等国际科技巨头,凸显了中国AI在全球舞台上的崛起和影响力,展示了开源模型和自主技术的重要性。
DeepSeek V4中文大模型评测:再创国内第一佳绩
SuperCLUE最新评测显示,DeepSeek-V4-Pro以70.98分重回国内中文大模型第一,Flash版以68.82分位列第二。文章从六大能力维度解析其优势,并对比Pro与Flash在性能、成本和适用场景上的差异,同时指出其在代码与复杂指令上的提升空间,为企业与个人选型提供参考。
DeepSeek-V4预览版正式发布:1M超长上下文能力面向全员普惠
DeepSeek正式发布并开源DeepSeek-V4预览版,标志着1M超长上下文进入普惠时代。该系列分为Pro与Flash双版本,通过创新的DSA机制大幅降低长文本处理成本。模型在Agent协作、代码生成及逻辑推理性能上表现卓越,支持动态调节思考强度,不仅在性能上直逼顶级闭源模型,更通过技术突破加速了AGI的普及进程。
腾讯发布最新开源语言模型 Hy3 Preview,聚焦智能时代应用趋势
腾讯正式发布混元系列最新开源模型 Hy3 Preview,总参数量达295亿并支持256K超长上下文。该模型在复杂推理、指令遵循和代码处理等核心能力上显著提升,已广泛应用于元宝、QQ、腾讯文档等产品。此外,腾讯云同步推出了极具竞争力的API价格体系和定制化套餐,旨在通过高性能、高性价比的AI方案,助力开发者和企业在多样化场景下实现智能化升级。
阿里通义千问正式开源Qwen3.6-27B,编程能力实现“以小博大”表现
阿里云正式开源270亿参数模型Qwen3.6-27B,其编程能力实现跨级飞跃,在多项基准测试中超越了15倍规模的MoE模型。该模型原生支持图像、视频等多模态输入,并深度适配主流编程助手与开发者工作流。通过降低部署门槛与提升推理效率,Qwen3.6-27B旨在为开发者提供更精准的编码辅助与视觉推理体验。
NVIDIA推出全球首个开源量子AI模型 量子纠错技术提升三倍
本文介绍NVIDIA推出的全球首个开源量子AI模型“NVIDIA Ising”,该模型包含校准与解码两大模块,可大幅缩短量子处理器校准时长,将量子纠错速度提升2.5倍、准确率提升3倍,目前已被多家科研机构与企业采用,为量子计算落地及混合量子-经典系统构建提供有力支持。
从平面修图到空间重塑:京东开源图像模型JoyAI-Image-Edit重新定义AI编辑
京东探索研究院正式开源JoyAI-Image-Edit图像模型,引领AI修图迈向“空间智能”新阶段。该模型通过深度建模三维空间,实现了对相机视角、物体位移及缩放的精准控制,并全面兼容15类通用编辑需求。其出色的几何一致性与物理规律理解力,为电商生产、创意设计及具身智能等领域提供了强大的底层技术支撑。
谷歌Gemma 4全面开源 小模型展现超强AI能力
谷歌近日重磅开源Gemma4系列模型,标志着人工智能领域的重要突破。该系列模型以其小参数量却展现出超强AI能力而引人注目,其中一款仅3.8亿参数便能超越体量20倍的大模型,让强大AI轻松部署至手机和轻薄本。Gemma4通过底层架构创新,提升计算效率,并特别优化移动设备和物联网终端应用。它在多项行业标准测试中表现卓越,涵盖文本生成、数学推导和代码编写。Gemma4采用Apache2.0许可证,支持灵活部署,为开发者构建智能应用提供了开放高效的环境。
谷歌发布开源模型Gemma4 采用Apache许可证助力开发者
谷歌正式发布了其新一代开源AI模型Gemma4,标志着其在开源策略上的重大转变。该模型采用业界公认的Apache 2.0许可证,赋予开发者更大的自由度,可无顾虑地使用、修改和分发,尤其利于商业化应用。Gemma4在技术架构上实现了性能飞跃,能够处理更复杂的开发任务。同时,其与现有开发者生态系统(如Android)的高度兼容性,极大降低了技术门槛,使得中小型企业也能轻松部署高质量的AI解决方案,彻底释放开发者生产力。