TAG:AI图像生成
苹果AI迎来重大强化 Image Playground将在OS27中实现大幅提升
苹果的Image Playground AI功能在OS27系统中将迎来史诗级强化。通过升级的Apple Foundation模型和集成谷歌Gemini处理器,图像生成能力将大幅提升,摆脱以往表现不佳的困境。该功能将深度嵌入备忘录等系统应用,并增强Genmoji的主动性。苹果坚守隐私安全底线,拒绝深度伪造,确保本地或私有云处理,同时引入第三方模型API,为用户更多选择,但提醒隐私风险。这标志着苹果AI在实用性和道德标准上的重要进步。
谷歌发布全新Google Pics应用,AI助力图像设计与编辑
谷歌在2026年I/O开发者大会上发布了全新的Google Pics应用,这是一款AI驱动的图像生成与设计工具。用户可以通过文字或语音指令快速生成活动邀请函、海报等视觉内容,并支持灵活的局部编辑,如修改图片元素和文字,提高设计效率。应用以网页形式上线,未来计划推出移动应用并整合到Workspace中,为用户提供更便捷的设计体验。
阶跃星辰发布图像生成编辑模型 Step Image Edit 2,银河通用机器人发布跨本体“隐式世界-动作基础模型”
本文聚焦AI与出行领域最新动态:阶跃星辰发布轻量高效的图像生成编辑模型Step Image Edit 2,银河通用机器人推出跨本体动作基础模型LDA;同时梳理滴滴、哈啰在“五一”假期出行需求预测与服务升级上的新变化,展现技术创新与消费趋势。
谷歌Gemini深度集成Google Photos,支持从相册生成个性化AI图像
谷歌近日为AI助手Gemini推出重磅更新,通过深度集成Google Photos,用户可利用相册中的真实影像生成高度个性化的AI图像。该功能由Nano Banana2模型驱动,旨在提升“个人智能”体验。尽管这一创新带来了更便捷的创作方式,但也引发了关于私域数据安全的讨论。对此,谷歌强调该功能采用自愿加入机制,且私人照片不会用于模型训练,力求在技术创新与隐私保护间取得平衡。
谷歌 Gemini 接入个人相册,AI 生成图像迈向真正个性化
谷歌宣布Gemini接入个人相册,在用户授权Personal Intelligence后可整合Google应用数据,并直接调用Google Photos中的照片进行创作。结合Nano Banana,用户无需手动上传素材,即可生成与家人场景相关的个性化图像,标志AI图像生成从通用化迈向真正个人化。
谷歌 Gemini 推出基于 Nano Banana 技术的交互式可视化图像生成新功能
谷歌 Gemini 推出基于 Nano Banana 技术的交互式可视化功能,标志着 AI 生成内容从静态图像向动态交互模拟的重要跨越。用户可通过该功能生成可操作的数字程序,实时调节参数或拆解机械结构,直观理解复杂逻辑。该功能目前面向 Gemini Pro 用户开放,在在线教育、工程模拟及科普领域具有极高的应用价值。
告别 AI 标准脸:阿里发布 Wan2.7-Image,开启“千人千面”新时代
阿里大模型团队发布Wan2.7-Image图像生成与编辑模型,突破AI生成图像的标准化限制,实现千人千面的个性化创作。该模型支持精准捏脸、色彩控制、3K Token超长文本渲染及交互式编辑功能,大幅提升创作自由度与专业内容生产效率。
告别AI标准脸!阿里Wan2.7-Image发布:能写A4纸论文,还能像素级“捏脸”
阿里发布Wan2.7-Image图像生成与编辑大模型,突破传统AI生图局限,实现个性化虚拟角色捏脸、调色盘功能及印刷级文字渲染。支持交互式编辑和多主体一致性,广泛应用于短剧制作、电商广告等领域。
小红书复旦联手开源AI图像排版工具InstanceAssemble
小红书与复旦大学联合开源InstanceAssemble技术,通过创新的实例拼装注意力机制,实现了AI图像生成中对物体位置的精准排版控制。该技术适配主流模型仅需极低额外参数,解决了布局控制生成中的对齐不准和语义脱节问题,并开源了代码、模型及基准测试集,为设计、广告等行业提供强大工具。
Qwen-Image-i2L革新图像生成,零门槛LoRA训练轻松上手
阿里通义实验室推出的Qwen-Image-i2L是一款革命性开源工具,能将单张图片快速转化为可微调的LoRA模型,实现零门槛个性化风格迁移。无需海量数据或昂贵算力,用户上传一张图即可生成轻量级风格模块,无缝集成到Stable Diffusion等模型,大幅降低AI艺术创作门槛。工具提供四种优化变体,适用于艺术、设计、商业等多场景,推动AI图像生成从通用走向即时定制。
阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union,6B参数性能超越Flux
阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,这是一个仅6亿参数的高效ControlNet扩展,支持姿态、边缘、深度等多条件精确控制,显著提升图像生成的创意与精准度。模型轻量高效,硬件要求低,适用于电商设计、影视特效等专业场景,已在Hugging Face平台开源并支持商用。
字节发布Seedream 4.5 图像生成实现多图一致性
字节跳动Seed团队发布Seedream 4.5,重点突破多图场景一致性和美学指令遵循两大核心能力。新版本解决了AI图像生成中角色、服饰、光影在多图中不一致的痛点,实现了批量生成的高度统一,同时在复杂风格描述下精准控制画面质感,为电商、IP设计等商业场景提供强大支持。
“开放”战胜“封闭”!Flux.2免费开源闪电战,开启AI绘图新纪元
Flux.2开源模型震撼发布,提供4MP高质量图像生成仅需8秒和0.003美元成本,相比谷歌3000美元的Nano Banana Pro具有压倒性价格优势。该模型包含四个版本,分别针对速度、灵活性、轻量化和边缘计算优化,支持像素级精细控制和多模态输入,为独立创作者和开发者提供了顶级AI生图工具,彻底改变了行业成本结构。
当你的眼睛不再可信:谷歌Nano Banana Pro生成的“CEO”,是如何骗过全世界的?
谷歌Nano Banana Pro AI图像生成工具近日引发轰动,其生成的硅谷八巨头合影逼真到肉眼无法分辨,甚至出现被宿管阿姨驱散的搞笑场景。这款工具在LMArena榜单上屠榜登顶,不仅能生成名人图像,还能通过经纬度坐标还原历史事件场景,标志着AI生图技术进入全新阶段。
AI绘图的“强迫症”时刻:Nano Banana 2发布,一场关于细节的终极革命
Nano Banana2 AI图像模型实现精准细节渲染突破,能够忠实执行高精度语义指令,如准确绘制时钟指针角度和液体张力效果。通过五步工作流程模拟设计师思维,支持人机协同调整构图与文本元素,将AI绘图从随机生成带入可控精修时代,为创意工作者提供专业级设计工具。