TAG:AI图像生成
谷歌 Gemini 推出基于 Nano Banana 技术的交互式可视化图像生成新功能
谷歌 Gemini 推出基于 Nano Banana 技术的交互式可视化功能,标志着 AI 生成内容从静态图像向动态交互模拟的重要跨越。用户可通过该功能生成可操作的数字程序,实时调节参数或拆解机械结构,直观理解复杂逻辑。该功能目前面向 Gemini Pro 用户开放,在在线教育、工程模拟及科普领域具有极高的应用价值。
告别 AI 标准脸:阿里发布 Wan2.7-Image,开启“千人千面”新时代
阿里大模型团队发布Wan2.7-Image图像生成与编辑模型,突破AI生成图像的标准化限制,实现千人千面的个性化创作。该模型支持精准捏脸、色彩控制、3K Token超长文本渲染及交互式编辑功能,大幅提升创作自由度与专业内容生产效率。
告别AI标准脸!阿里Wan2.7-Image发布:能写A4纸论文,还能像素级“捏脸”
阿里发布Wan2.7-Image图像生成与编辑大模型,突破传统AI生图局限,实现个性化虚拟角色捏脸、调色盘功能及印刷级文字渲染。支持交互式编辑和多主体一致性,广泛应用于短剧制作、电商广告等领域。
小红书复旦联手开源AI图像排版工具InstanceAssemble
小红书与复旦大学联合开源InstanceAssemble技术,通过创新的实例拼装注意力机制,实现了AI图像生成中对物体位置的精准排版控制。该技术适配主流模型仅需极低额外参数,解决了布局控制生成中的对齐不准和语义脱节问题,并开源了代码、模型及基准测试集,为设计、广告等行业提供强大工具。
Qwen-Image-i2L革新图像生成,零门槛LoRA训练轻松上手
阿里通义实验室推出的Qwen-Image-i2L是一款革命性开源工具,能将单张图片快速转化为可微调的LoRA模型,实现零门槛个性化风格迁移。无需海量数据或昂贵算力,用户上传一张图即可生成轻量级风格模块,无缝集成到Stable Diffusion等模型,大幅降低AI艺术创作门槛。工具提供四种优化变体,适用于艺术、设计、商业等多场景,推动AI图像生成从通用走向即时定制。
阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union,6B参数性能超越Flux
阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,这是一个仅6亿参数的高效ControlNet扩展,支持姿态、边缘、深度等多条件精确控制,显著提升图像生成的创意与精准度。模型轻量高效,硬件要求低,适用于电商设计、影视特效等专业场景,已在Hugging Face平台开源并支持商用。
字节发布Seedream 4.5 图像生成实现多图一致性
字节跳动Seed团队发布Seedream 4.5,重点突破多图场景一致性和美学指令遵循两大核心能力。新版本解决了AI图像生成中角色、服饰、光影在多图中不一致的痛点,实现了批量生成的高度统一,同时在复杂风格描述下精准控制画面质感,为电商、IP设计等商业场景提供强大支持。
“开放”战胜“封闭”!Flux.2免费开源闪电战,开启AI绘图新纪元
Flux.2开源模型震撼发布,提供4MP高质量图像生成仅需8秒和0.003美元成本,相比谷歌3000美元的Nano Banana Pro具有压倒性价格优势。该模型包含四个版本,分别针对速度、灵活性、轻量化和边缘计算优化,支持像素级精细控制和多模态输入,为独立创作者和开发者提供了顶级AI生图工具,彻底改变了行业成本结构。
当你的眼睛不再可信:谷歌Nano Banana Pro生成的“CEO”,是如何骗过全世界的?
谷歌Nano Banana Pro AI图像生成工具近日引发轰动,其生成的硅谷八巨头合影逼真到肉眼无法分辨,甚至出现被宿管阿姨驱散的搞笑场景。这款工具在LMArena榜单上屠榜登顶,不仅能生成名人图像,还能通过经纬度坐标还原历史事件场景,标志着AI生图技术进入全新阶段。
AI绘图的“强迫症”时刻:Nano Banana 2发布,一场关于细节的终极革命
Nano Banana2 AI图像模型实现精准细节渲染突破,能够忠实执行高精度语义指令,如准确绘制时钟指针角度和液体张力效果。通过五步工作流程模拟设计师思维,支持人机协同调整构图与文本元素,将AI绘图从随机生成带入可控精修时代,为创意工作者提供专业级设计工具。