Flux
Flux 是 Black Forest Labs 推出的顶尖 AI 图像生成模型,提供开源的 Schnell、Dev 版本和商业 Pro 版本,可生成高度逼真、高保真的图像。
Flux 是由 Black Forest Labs(Stable Diffusion 原班人马)开发的顶尖文本生成图像 AI 模型系列。2024 年发布,在提示词遵循度、视觉保真度和构图准确性方面树立了新标杆,媲美乃至超越 Midjourney、Adobe Firefly 等主流商业工具。
Flux 模型系列包含三个主要版本。Flux.1 Schnell 是针对快速迭代和本地部署优化的最快模型,采用 Apache 2.0 开源许可。Flux.1 Dev 是引导蒸馏(guidance-distilled)模型,输出质量优于 Schnell,面向非商业研究和个人使用开放。Flux.1 Pro 是旗舰商业模型,提供最高质量输出,可通过 API 访问。
Flux 最受称道的能力之一是图像内文字渲染——这是扩散模型长期以来的难题。Flux 能以前所未有的清晰度将可读文字、标识和标签准确嵌入生成图像中,对图形设计、营销物料制作极具价值。
Flux 在 Replicate、fal.ai、Together AI、Freepik 等主流平台广泛部署,与 ComfyUI 无缝集成。围绕 Flux 已形成丰富的 LoRA 微调、ControlNet 适配和工作流扩展生态,足以媲美成熟的 Stable Diffusion 生态系统。对于开发者,Schnell 和 Dev 权重公开可用,支持自部署、自定义微调和集成到私有应用中。
主要功能
- 三档模型:Flux.1 Schnell(开源·快速)、Flux.1 Dev(开源·高质量)、Flux.1 Pro(商业·最佳质量)
- 业界领先的图像内文字渲染——标牌、标签和文字生成精度前所未有
- 卓越的提示词遵循度,能将复杂多元素描述精准转化为图像
- Schnell 和 Dev 开源权重可供自部署和自定义微调
- 与 ComfyUI、Automatic1111 及主流 AI 图像生成流程原生集成
- 通过 Replicate、fal.ai、Together AI、Freepik 提供 API 访问,开发者接入便捷
- 高分辨率图像生成,具备卓越的照片级真实细节和色彩准确性
- 活跃的 LoRA 微调社区,风格涵盖动漫到产品摄影
- Flux.1 Schnell 针对实时生成和快速原型优化,推理速度极快
- 支持 ControlNet 和 IP-Adapter,实现精确的构图、姿势和风格控制
常见问题
Flux 是免费的吗?
Flux.1 Schnell 在 Apache 2.0 许可下完全免费开源,允许商业和个人使用。Flux.1 Dev 面向非商业研究和个人使用开放。Flux.1 Pro 是付费商业模型,可通过 Replicate、fal.ai 等平台按图片生成计费使用 API。许多平台提供免费试用积分供新用户上手体验。
Flux 与 Midjourney 和 Stable Diffusion 相比如何?
Flux 被广泛认为在提示词遵循度和照片级真实感方面与 Midjourney v6 相当甚至超越,同时具备 Stable Diffusion 的开放性。相比 Stable Diffusion XL,其文字渲染、构图和人体解剖准确度显著提升。与 Midjourney 不同,Flux 的开源版本可自部署和微调,是追求质量与控制平衡的专业人士的首选。
Flux 可以用于商业项目吗?
可以,但条件因模型版本而异。Flux.1 Schnell 采用 Apache 2.0,允许商业使用。Flux.1 Dev 限非商业用途。通过官方 API 使用的 Flux.1 Pro 许可证包含商业使用权。请务必查阅 Black Forest Labs 最新条款及您所在部署平台的服务条款,以获取最新授权信息。
如何在本地运行 Flux?
Flux.1 Schnell 和 Dev 可通过 ComfyUI 或 Hugging Face 的 diffusers 库在本地运行。Schnell 需要至少 8GB 显存的 GPU,Dev 需要 12GB 以上。社区提供了显存需求大幅降低的量化版本。从 Hugging Face 下载模型权重,安装 ComfyUI 或 diffusers,加载 Flux 工作流即可开始使用。
为什么 Flux 的文字渲染比其他图像模型更出色?
Flux 采用基于 Transformer 的架构(而非传统 U-Net),能更整体地处理文本 token,以更高保真度理解和再现排版元素。该模型在训练时特别注重图像内文字准确性,这一架构优势使其在渲染多词标牌、产品标签甚至 Logo 时,远比 SDXL、DALL-E 3 或早期模型更加精准。
替代工具
Image Generation的其他工具
Artbreeder
Image GenerationArtbreeder 是独特的 AI 图像协作创作平台,通过混合和"繁殖"现有图像生成新的视觉作品,以其独特的创作方式著称。
BlueWillow
Image GenerationBlueWillow 是免费的 AI 图像生成工具,通过 Discord 运行,无需付费即可创作 AI 艺术图像,适合初学者入门。
Craiyon
Image GenerationCraiyon 是无需账号即可在浏览器中使用的免费 AI 图像生成工具,因其独特的梦幻风格而深受用户喜爱。
DALL-E
Image GenerationDALL-E 是 OpenAI 的开创性文字转图像 AI 系列,将自然语言描述转化为精确图像,在图像内文字渲染和 ChatGPT 集成方面处于行业领先地位。
DreamStudio
Image GenerationDreamStudio 是 Stability AI 官方推出的 Stable Diffusion 网页界面,提供最新模型访问和专业级精细参数控制。
Leonardo AI
Image GenerationCanva 旗下 AI 视觉生成平台,专精游戏素材、概念艺术和写实图像,支持自定义 LoRA 模型训练、视频生成和 3D 贴图输出