TAG:多模态

阿里确认通义千问已集成至Apple智能，苹果端侧大模型将于7月完成备案

阿里巴巴确认通义千问大模型将集成至Apple智能。苹果端侧大模型已于7月完成备案，国内合作方包括阿里和百度。此次合作将为中国大陆iOS、iPadOS、macOS和visionOS用户带来系统原生级本土化AI体验，助力端侧AI从独立App向原生生态转移。

aibase

2026-07-16 10:50

商汤开源SenseNova-Vision统一视觉大模型，可单模型覆盖四大核心视觉任务

文章介绍了商汤全面开源SenseNova-Vision统一视觉大模型，强调其以单模型覆盖目标检测、分割、深度估计和多视角3D重建四大核心视觉任务，并在多项权威评测中领先同类通用模型及部分专家模型，同时同步开源5000万条视觉指令数据集。

aibase

2026-07-13 14:20

970

国产大模型再迎重大消息：Kimi K3传本月发布，参数规模直指2.5万亿

国产大模型Kimi K3即将于本月发布，参数规模预计高达2.5万亿，超越DeepSeek V4 Pro和文心5.0，成为国产最大参数模型。该模型将集成1M超长上下文窗口与多模态能力，被视为挑战全球顶级水平的关键。文章还介绍了7月大模型市场的竞争格局，包括谷歌Gemini 3.5 Pro和Grok v9的动态，为开发者和企业提供高性能工具选择。

aibase

2026-07-02 10:20

1181

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频豆包2.1 Pro对标Opus 4.6

在2026年字节跳动火山引擎大会上，公司发布了多款AI重磅产品，其中Seedance 2.5视频生成模型实现一次性直出30秒完整视频的突破，降低了制作成本并提升叙事连贯性。同时，豆包2.1 Pro模型性能对标Opus 4.6，支持长视频理解和多模态处理。此外，Seeddream5.0图像模型与之协同，形成多模态创作闭环。这些发布加速AI在内容生产领域的应用，有望推动工业级视频生产效率跃升。

aibase

2026-06-23 11:33

Qwen3.7-Plus正式发布，支持编程与GUI双模式，11小时即可自主开发应用

阿里正式发布多模态大模型Qwen3.7-Plus，该模型融合GUI与CLI交互，实现从前端原型到软件工程的自动化开发。其在视觉模型榜单表现顶尖，能自主开发真实APP，如11小时闭环开发英语学习应用，展示高保真复刻和无人运维等颠覆性应用，为生产力自动化奠定基础。

aibase

2026-06-02 10:31

国产AI大模型MiniMax M3正式发布，超越GPT-5.5

国产AI大模型MiniMax M3正式发布，具备编程能力、100万超长上下文支持以及原生多模态能力，是国内首个开源模型。在权威评测中，MiniMax M3超越GPT-5.5，表现接近顶尖模型。其采用全新稀疏注意力架构，大幅减少计算量并提升处理速度，API已开放，模型权重和报告将在10天内开源，推动AI技术发展。

aibase

2026-06-01 18:01

Step 3.7 Flash重磅发布：Agent效率新时代到来

Step3.7Flash开源模型正式发布，专为Agent时代设计，解决效率、可靠性和多模态执行痛点。它在多项基准测试中领先，如ClawEval-1.1排名第一，提供高速推理（400TPS）和低成本部署。模型能理解视觉内容，自主完成代码生成和工具调用，工具调用成功率高达98%以上。同时，兼容主流Agent框架，支持本地运行，为开发者构建高效、可靠的智能工作流提供强大支持。

aibase

2026-05-29 15:24

阶跃星辰开源 Step 3.7 Flash 大模型速度翻倍

阶跃星辰正式开源Step 3.7 Flash大模型，专为智能体生产化落地设计。该模型采用稀疏混合专家架构，参数量达196B，生成速度最高每秒400 Tokens，显著提升效率并减少延迟。具备原生多模态理解能力，可解析UI、图表等视觉信息，并增强联网搜索功能。在智能体工作流中表现出高工具调用稳定性和生态兼容性，降低开发门槛，助力复杂任务高效执行。

aibase

2026-05-29 10:24

字节跳动开源Lance 3B：实现图像与视频理解与生成

字节跳动开源了Lance 3B模型，这是一个仅30亿参数的轻量级原生统一多模态大模型。它打破了理解模型与生成模型之间的技术壁垒，能同时处理图像和视频的理解、生成与编辑任务。采用Apache2.0协议，训练高效，性能超越更大模型，有望推动AI短剧、智能体等领域的应用发展，降低多模态AI部署成本。

aibase

2026-05-22 16:26

重构图像生成范式智象未来原生全模态大模型HiDream-O1-Image登顶AA榜开源首发

智象未来发布的HiDream-O1-Image模型，以8B参数规模登顶Artificial Analysis文生图榜单开源第一。该模型采用原生全模态架构，摒弃传统VAE和独立文本编码器，通过像素级统一Transformer实现端到端生成，减少模态转换损耗。创新性地引入基于Gemma 4的推理智能体，在生成前进行思维链推理，提升指令遵循能力，打破开源图像生成领域稳定格局，推动多模态基础模型发展。

资讯中国

2026-05-18 14:23

面壁智能推出MiniCPM-V 4.6，低内存高效率的人工智能新选择

面壁智能联合清华大学及OpenBMB开源社区发布了新一代端侧多模态大模型MiniCPM-V 4.6。该模型仅需1.3B参数和6G内存，即可在终端设备上高效运行，支持自然语言处理、图像识别和音频处理等多模态任务，适用于智能家居、机器人等场景。作为开源模型，它促进了技术共享，为人工智能应用提供了低内存高效率的新选择，推动创新并让更多用户享受AI便利。

aibase

2026-05-13 14:24

MiniMax 启动「10x Team」计划，悬赏全球顶尖专家加速国产大模型研发

MiniMax 启动「10x Team」全球人才合作计划，面向顶尖行业专家与开发者开放多模态等核心资源，共同定义行业痛点与评测体系，推动大模型从通用能力走向垂直深度应用，实现行业效率十倍提升，反映国产大模型竞争转向产业落地。

aibase

2026-05-12 11:11

国产大模型Qwen3.6-35B-A3B正式开源，聚焦高效率与多模态思考能力提升

国产大模型Qwen3.6-35B-A3B正式开源，该模型采用创新的MoE架构，实现350亿总参数下仅需激活30亿参数的极致推理效率。其在编程、Agent任务及多模态思考方面表现优异，尤其在空间分析和复杂逻辑处理上极具优势，且已深度兼容主流Agent框架，是开发者本地部署高性能AI底座的理想选择。

aibase

2026-04-20 17:02

小红书开源训练引擎Relax，拓展AI训练基础设施布局

小红书AI平台团队开源大模型强化学习训练引擎Relax，面向全模态与Agentic场景，支持文本、图像、音频、视频统一接入。其模态感知并行与端到端异步流水机制提升训练效率与扩展性。此次开源体现小红书AI工程积累，并借技术贡献布局开发者生态。

aibase

2026-04-15 15:04

MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI，打破接口壁垒

MiniMax 推出专为 AI Agent 设计的开源命令行工具 MMX-CLI，旨在解决多模态接口适配繁琐的痛点。该工具支持在主流开发环境中一键调度编程、视频生成、语音合成等全模态能力。通过输出隔离、语义化状态码及异步任务控制等深度优化，MMX-CLI 显著提升了 Agent 在非交互环境下的运行稳定性与自动化效率，助力开发者轻松构建复杂的 AI 自动化工作流。

aibase

2026-04-10 12:15

通知

尊敬的用户

user

TAG:多模态

阿里确认通义千问已集成至Apple智能，苹果端侧大模型将于7月完成备案

商汤开源SenseNova-Vision统一视觉大模型，可单模型覆盖四大核心视觉任务

国产大模型再迎重大消息：Kimi K3传本月发布，参数规模直指2.5万亿

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频豆包2.1 Pro对标Opus 4.6

Qwen3.7-Plus正式发布，支持编程与GUI双模式，11小时即可自主开发应用

国产AI大模型MiniMax M3正式发布，超越GPT-5.5

Step 3.7 Flash重磅发布：Agent效率新时代到来

阶跃星辰开源 Step 3.7 Flash 大模型速度翻倍

字节跳动开源Lance 3B：实现图像与视频理解与生成

重构图像生成范式智象未来原生全模态大模型HiDream-O1-Image登顶AA榜开源首发

面壁智能推出MiniCPM-V 4.6，低内存高效率的人工智能新选择

MiniMax 启动「10x Team」计划，悬赏全球顶尖专家加速国产大模型研发

国产大模型Qwen3.6-35B-A3B正式开源，聚焦高效率与多模态思考能力提升

小红书开源训练引擎Relax，拓展AI训练基础设施布局

MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI，打破接口壁垒

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

user

TAG:多模态

阿里确认通义千问已集成至Apple智能，苹果端侧大模型将于7月完成备案

商汤开源SenseNova-Vision统一视觉大模型，可单模型覆盖四大核心视觉任务

国产大模型再迎重大消息：Kimi K3传本月发布，参数规模直指2.5万亿

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频 豆包2.1 Pro对标Opus 4.6

Qwen3.7-Plus正式发布，支持编程与GUI双模式，11小时即可自主开发应用

国产AI大模型MiniMax M3正式发布，超越GPT-5.5

Step 3.7 Flash重磅发布：Agent效率新时代到来

阶跃星辰开源 Step 3.7 Flash 大模型 速度翻倍

字节跳动开源Lance 3B：实现图像与视频理解与生成

重构图像生成范式 智象未来原生全模态大模型HiDream-O1-Image登顶AA榜开源首发

面壁智能推出MiniCPM-V 4.6，低内存高效率的人工智能新选择

MiniMax 启动「10x Team」计划，悬赏全球顶尖专家加速国产大模型研发

国产大模型Qwen3.6-35B-A3B正式开源，聚焦高效率与多模态思考能力提升

小红书开源训练引擎Relax，拓展AI训练基础设施布局

MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI，打破接口壁垒

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资 首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红 芯片概念股冲高回落 短期风险需警惕

申昊科技拟设具身智能子公司 加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频豆包2.1 Pro对标Opus 4.6

阶跃星辰开源 Step 3.7 Flash 大模型速度翻倍

重构图像生成范式智象未来原生全模态大模型HiDream-O1-Image登顶AA榜开源首发

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务