Flux
FluxはBlack Forest Labsによる最先端のAI画像生成モデルで、オープンソースのSchnell・Devと商用のProモデルを提供し、フォトリアルで高品質な画像生成を実現します。
FluxはオリジナルのStable Diffusion技術を生み出したチームであるBlack Forest Labsが開発した最先端のテキストから画像へのAIモデルファミリーです。2024年にリリースされ、プロンプト遵守、視覚的忠実度、構図の正確さにおいてMidjourneyやAdobe Fireflyなどの商用ツールに匹敵または凌駕する新しい基準を打ち立てました。
Fluxモデルファミリーは3つの主要バリアントで構成されています。Flux.1 Schnellは高速反復とローカル展開に最適化された最速モデルで、Apache 2.0ライセンスでオープンソース提供。Flux.1 Devはより高品質な出力を提供するガイダンス蒸留(guidance-distilled)モデルで非商用研究と個人使用に開放されています。Flux.1 Proは最高品質を提供するフラッグシップ商用モデルです。
Fluxの最も注目される機能の一つは画像内テキストレンダリングです。拡散モデルにとって歴史的に困難だった課題を克服し、前例のない明瞭さで読める文字を画像に埋め込めます。Replicate、fal.ai、ComfyUIなど主要プラットフォームで幅広く活用されています。
主な機能
- 3つのモデルティア: Flux.1 Schnell(オープン・高速)、Flux.1 Dev(オープン・高品質)、Flux.1 Pro(商用・最高品質)
- 業界最高水準の画像内テキストレンダリング — 看板、ラベル、文字を前例のない精度で生成
- 複雑な多要素の説明を正確に画像に変換する優れたプロンプト遵守性
- SchnellとDevのオープンソースウェイト公開によるセルフホスティングとカスタムファインチューニング
- ComfyUI、Automatic1111、主要AI画像生成パイプラインとのネイティブ統合
- Replicate、fal.ai、Together AI、FreepikのAPIで簡単な開発者連携
- 卓越したフォトリアルな細部と色精度を持つ高解像度画像生成
- アニメから製品写真まで多様なスタイルの活発なLoRAファインチューニングコミュニティ
- リアルタイム生成と高速プロトタイピングに最適化されたFlux.1 Schnellの高速推論
- 精密な構図・ポーズ・スタイル制御のためのControlNetとIP-Adapterサポート
よくある質問
Fluxは無料で使えますか?
Flux.1 SchnellはApache 2.0ライセンスの下で完全に無料オープンソースとして提供されており、商用・個人使用が可能です。Flux.1 Devは非商用研究と個人使用に開放されています。Flux.1 Proは有料商用モデルで、Replicate、fal.aiなどのプラットフォームを通じて画像生成ごとの課金でAPIアクセスが可能です。多くのプラットフォームが無料トライアルクレジットを提供しています。
FluxはMidjourneyやStable Diffusionと比べてどうですか?
FluxはプロンプトへのMidjourney v6と同等またはそれ以上の遵守性とフォトリアリズムを持ちながら、Stable Diffusionのオープン性を兼ね備えていると広く評価されています。Stable Diffusion XLに対してはテキストレンダリング、構図、人体解剖学的正確さが大幅に向上。Midjourneyと異なりオープンソース版はセルフホスティングとファインチューニングが可能です。
Fluxを商用プロジェクトに使用できますか?
モデルバリアントによって条件が異なります。Flux.1 SchnellはApache 2.0により商用利用が許可されています。Flux.1 Devは非商用利用に限定されています。公式API経由のFlux.1 Proはライセンスに商用利用権が含まれています。最新のライセンス情報はBlack Forest Labsの現在の利用規約とデプロイプラットフォームの利用規約を確認してください。
Fluxをローカルで実行するにはどうすればよいですか?
Flux.1 SchnellとDevはComfyUIまたはHugging Faceのdiffusersライブラリ経由でローカル実行できます。SchnellはVRAM 8GB以上、Devは12GB以上のGPUが必要です。VRAM要件を大幅に削減した量子化バージョンも利用可能です。Hugging Faceからモデルウェイトをダウンロードし、ComfyUIまたはdiffusersをインストールしてFluxワークフローを読み込むだけです。
FluxのテキストレンダリングがほかのAI画像モデルより優れている理由は何ですか?
Fluxは従来のU-NetではなくTransformerベースのアーキテクチャを採用しており、テキストトークンをより総体的に処理することで、タイポグラフィ要素を遥かに高い忠実度で理解・再現できます。画像内テキスト精度に特化した訓練により、SDXL、DALL-E 3や旧世代モデルよりも複数単語のサイン・ラベルをはるかに正確にレンダリングできます。
代替ツール
Image Generationの他のツール
アートブリーダー
Image Generation遺伝的アルゴリズムで画像を育種・混合する協力的AIアートツール
ブルーウィロー
Image Generation最良の結果のためのマルチモデルルーティングを使用したDiscordベースの無料AI画像ジェネレーター
クレヨン
Image Generationアカウント不要でどのブラウザでもアクセスできる無料AI画像ジェネレーター
DALL-E
Image Generation自然言語の説明から詳細な画像を生成するOpenAIの先駆的なテキスト→画像AIファミリー。業界最高のテキストレンダリング精度とChatGPT統合が特徴。
ドリームスタジオ
Image GenerationStability AIからの高度なコントロールを持つ公式Stable Diffusionウェブインターフェース
Leonardo AI
Image GenerationCanvaに買収されたAI生成ビジュアルプラットフォーム。カスタムLoRAモデルトレーニング、ビデオ生成、3Dテクスチャ出力でゲームアセット、コンセプトアート、写真リアルな画像に特化。