【ComfyUI】高性能最新モデルFlux.1 [schell]の詳しい使い方
![【ComfyUI】高性能最新モデルFlux.1 [schell]の詳しい使い方のメイン画像](/_next/image?url=https%3A%2F%2Fdca.data-hub-center.com%2Fcontent%2Fuploads%2F2024%2F08%2Feye_catch_comfyui-how-use-high-performance-flux-schell-model_ja-v2.jpg&w=3840&q=80)
今回は「Flux.1」を紹介したいと思います。🔗Black Forlest Labsが開発したFlux.1は、Stability AIが発表した🔗Stabule Diffusion 3やFal AIの🔗Auraflowの対抗馬として発表されました。モデルはクローズドウェイトでAPIのみで使用できる[pro]バージョンとオープンウェイトで非商用利用が可能(Black Forlest Labsへの問い合わせで切り替え可能)な[dev]バージョン、そして今回紹介するオープンウェイトのApache2.0ライセンスで使用可能な高速版の[schnell]バージョンと3つのモデルがあります。SDXLモデルの約2倍の12Billionパラメータベースで開発されていて、現在開発されているローカル環境で使用できる画像生成AIモデルの中でも最高峰のモデルと言えるでしょう。

玄人志向 NVIDIA GeForce RTX4060 搭載 グラフィックボード GDDR6 8GB 搭載モデル 【国内正規品】 GG-RTX4060-E8GB/SF
ASIN:B0CG69V3H6

玄人志向 NVIDIA RTX3050 搭載 グラフィックボード GDDR6 6GB 搭載モデル 【国内正規品】 GG-RTX3050-E6GB/EX/DF/DVI
ASIN:B0DN638LY8

GIGABYTE NVIDIA GeForce RTX4060Ti 搭載 グラフィックボード GDDR6 16GB【国内正規代理店品】 GV-N406TWF2OC-16GD
ASIN:B0CYYHMKMW

玄人志向 NVIDIA RTX4070 搭載 グラフィックボード GDDR6X 12GB 搭載モデル 【国内正規品】 GG-RTX4070-E12GB/DF2
ASIN:B0D7G75P4N

GIGABYTE NVIDIA GeForce RTX4060 搭載 グラフィックボード GDDR6 8GB【国内正規代理店品】 GV-N4060D6-8GD
ASIN:B0CS2B592J

MSI GeForce RTX 4070Ti SUPER 16G VENTUS 2X OC/A PCIe4.0 約3スロット厚・2ファン搭載 省スペース グラフィックスカード VD8792
ASIN:B0CSN6KW5P

MSI GeForce RTX 4070 SUPER 12G VENTUS 2X OC/A PCIe4.0 2スロット・2ファン搭載 省スペース グラフィックスカード VD8751
ASIN:B0CRZ67KXX
FLUX.1 [schnell]の特徴
FLUX.1 [schnell]は現在運用されているAI画像生成モデルのなかではMidjournery-V6.0に近い性能と言われています。下の表は🔗Artificial Analysisが公表している100,000人以上のユーザーより集めたスコアの品質を示す🔗ELOスコアを元に作られています。グラフを見るとBlack Forlest LabsのフラッグシップモデルのFlux.1 [pro]やFlux.1 [dev]はStability AIのフラッグシップモデルのStable Image Ultraを超えています。(表はSD3-Ultraと表示されているが、恐らくStable Image Ultraの事だと思います。)

下記のスパイダーチャートは、プロンプトの再現性、サイズ/アスペクトの多様性、タイポグラフィ、アウトプットの多様性、そしてビジュアル・クオリティベンチマーク表です。今回紹介するFLUX.1 [schnell]のスコアもアウトプットの多様性が少し劣るが全体のスコアが高めなのが解ります。

- パラメーターベース:12 Billionのパラメータベース
- テキストエンコーダー:Open AI CLIP ViT-L/14 & Google T5 XXL
- 高速な1~4ステップで高品質ないAIイラストを生成(schnell版のみ)
- SDXLと比べさらにプロンプトの理解力が向上
FLUX.1 [schnell]の推奨スペック
FLUX.1 [schnell]の推奨スペックはかなり高くモデルの容量が23.8GあるのですべてのデータをGPUメモリに読み込むには24GのGPUメモリが理想となってきます。(溢れた分は共有メモリも使うのですべてが収まらなくても使えます。)しかし、🔗FP8モデルや🔗プルーンドモデルを使用したり、メモリを解放しながら使えば16GのGPUメモリでも動作可能です。
FLUX.1 [schnell]のインストール方法
FLUX.1 [schnell]を使用する前にComfyUIが古いと使えない標準ノードがありますので最新版にアップデートしましょう。(v0.0.4以上推奨)
インストール方法は🔗ComfyUIの公式ドキュメントを参考に執筆しています。
モデルのダウンロード
FLUX.1 [schnell]をインストールするにはベースモデル、テキストエンコーダーなどをインストールする必要があります。順を追ってみていきましょう。
- モデルのダウンロード:black-forest-labsのHuggingFaceよりベースモデルの
flux1-schnell.safetensors
をComfyUI/models/unet
ディレクトリにダウンロードします。 - VAEのダウンロード:コチラも公式のHuggingFaceより
ae.safetensors
をComfyUI/models/vae
ディレクトリにダウンロードしましょう。 - テキストエンコーダーのダウンロード:ComfyUIのHuggingFaceよりflux用のテキストエンコーダーの
clip_l.safetensors
とt5xxl_fp16.safetensors
またはt5xxl_fp8_e4m3fn.safetensors
ComfyUI/models/
にダウンロードします。PCメモリが32G以上の方はt5xx_fp16をつかいましょう。
ベーシックワークフローのダウンロード
公式のワークフローもしくは少し手を入れたDCAIのワークフローをダウンロードして読み込みます。
公式版は🔗ComfyUIの公式ドキュメントのFlux Schnellにあるボトルの画像を読み込む事で見ることができます。
DCAI版はPatreonで公開していますので参考にしてください。
FLUX.1 [schnell]のベーシックワークフローの解説
DCAIのベーシックワークフローを元に解説します。公式のワークフローに1点だけ新たにノードを追加しているだけなので、公式のワークフローにも対応しています。
Load Diffusion Modelモデルを読み込むノード。通常のLoadCheckpointModelでは読み込めないので注意しましょう。
- unet_name:モデルを選択します。今回は
flux-schelell.safetensors
を選択します。 - weight_dtype:デフォルト(FP16)でも問題ありませんが、生成時間がかかるので
fp8_e4m3fn
又はfp8_e5ms
を使用します。
公式のワークフローには使われていないノードです。Stable Diffusion 3で使われているタイムステップスケジューリングシフトのFlux版になります。(ComfyUI v0.0.4よりさらに細かく設定できる様になりました。)
FLUX.1 [schnell]で使う場合はmax_shiftは0.0~2.0辺りで設定しましょう。また、base_shiftは反映されないので0または、デフォルトの0.5で使いましょう。場合によってはこのノードをバイパスした方が良い結果が得られる場合も在ります。
width / heightはシフト範囲を設定します。
DualCLIPLoaderテキストエンコーダーモデルを読み込みます。clip_nameにt5xxl_fp16
とclip_l
を選択しましょう。(PCメモリ不足の場合はfp16の代わりにt5xxl_fp8_e4m3fn
を使います。)
FluxはSD3と同様SamplerCustomAdvancedに対応する為にBasicGuiderを使います。
SamplerCustomAdvanced次世代モデル向けサンプラーノード。パラメーターが外部化したことによりより細かな調整が可能となっています。
ComfyUIでの使用時に注意していただきたいのがModelSamplingFluxのbase_shiftとFluxGuidanceのguidanceの値です。これらの値はFLUX.1 [dev]では反映しますが、FLUX.1 [schnell]では反映されません。
深堀はしていませんが、FLUX.1 [schnell]はTimestep-distilledで、FLUX.1 [dev]はGuidance-distilledなので、この違いの影響だと思われます。
サンプリングの設定
- sampler:euler
- scheduler:simple
- steps:4
解像度の設定
解像度は0.1~2.0メガピクセルまで対応しています。今回は1メガピクセルで19: 13の1216 x 832で生成しています。
FLUX.1 [schnell]ベーシックワークフローをカスタムしてみる
ベーシックワークフローを使ってみると生成イラストの品質が十分ではないと感じませんでしたか?ココからは品質を向上させるためにアップスケールを導入、そしてLow-GPUの為にメモリ開放の導入方法を紹介します。ワークフローはPatreonで公開しています。
必須カスタムノード
Webで調べていくとワークフロー例がいくつか見つかりますが、DCAIでは難しくならない様に必要最低限のカスタムノードでサンプルを作っています。今回はGPUメモリを解放しながら生成していくプロセスにしたいので下記のカスタムノードを使います。
- ComfyUI Layer Style:LayerUtility:Purge VRAMノードを使います。LayerColor: ColorAdapter:アップスケール後の色味の誤差を補正します。
- ntdviet/comfyui-ext:LatentGarbageCollectorノードを使います。
ComfyUIのカスタムノードのインストール方法が分からない方は下記の記事を参考にしてください。

カスタム手順
- VAE Decodeの変更:まずはベーシックワークフローのSamplerCustomAdvanced後のVAE Decodeを「VAE Decode (Tiled)」に変更してメモリ不足対策をします。tile_sizeは768に上げていますが、メモリが少ない場合はデフォルトの512でも問題ありません。
- Upscale Image (using Model)で拡大:Upscale Image (using Model)で拡大します。モデルはLoad Upscale Modelから読み込みます。
- 拡大した画像を希望のサイズに縮小:今回は4倍に拡大するモデルをつかったので「Upscale Image By」30%に縮小します。
- サイズ調整した画像を元にi2iを使い再生成:SamplerCustomAdvanced(2回目)はnoiseとsamplerは1回目の値を共有します。拡大プロンプトを使いたいので「BasicGuider」に新たなプロンプト(CONDITIONING)を繋ぎます。チュートリアルとして「CLIPTextEncodeFlux」を使います。clip_lとt5xxlに同じプロンプトを入力したいのでConvert Widget to Inputで外部化し、Primitiveノードで入力しています。guidanceはFLUX.1 [schnell]では使えないのでデフォルトのままで問題ありません。「BasicScheduler」はschedulerをsgm_uniformを使ってstepsは1回目と同じ4でdenoizeは0.20に設定します。
- 生成されたデータをメモリから解放:「LatentGarbageCollector」と「LayerUtility: Purge VRAM」でデータを解放します。
- カラーコレクション:拡大後の画像が色あせていたので「LayerColor: ColorAdapter」を使って補正をします。
以上のプロセスでアップスケールで品質が良くなったと思われますが、いかがでしょうか?
ワークフローの最終結果
FLUX.1 [schnell] FP8チェックポイント版について
FP8チェックポイント版はチェックポイントモデルとして使えるのでミドルスペックのGPUでも問題なく使えるでしょう。
FLUX.1 [schnell] FP8チェックポイント版の使い方
下記のリンクよりモデルComfyUI/models/checkpoints/
にダウンロードします。ComfyUIのデフォルトワークフローにチェックポイントモデルを読み込みKSamplerを推奨設定のstapsが1~4でCFGの値を1.0を入れれば使うことができます。※エラーが出る場合はComfyUIを最新版にアップデートしましょう。
A1111 WebUI (v1.10.1)で試してみましたがエラーでて使えませんでした。また、試してはいませんが🔗StableSwarmUIや🔗Forgeなら動作するみたいです。
まとめ
今回はFLUX.1 [schnell]の紹介記事でした。まだまだ登場して間もないのでこれからが楽しみなモデルだと思いました。また開発のBlack Forlest Labsも次はTEXT TO VIDEO関係のモデルを開発しているようなのでコチラも注目していきたいです。FLUX.1 [schnell]関係が充実してきた時に関係記事を書きたいを思っています。

【最新第13世代 Core i9 HX & RTX 4090搭載・ウルトラハイエンド】MSIゲーミングノートPC RaiderGE78HX i9HX RTX4090/17型 WQXGA/240Hz/32GB/2TB/Windows11/Raider-GE78HX-13VI-2803JP
ASIN:B0BVBM5T8F

【Amazon.co.jp限定】 ASUS ゲーミングノートPC TUF Gaming A15 FA507NVR 15.6型 RTX 4060 Ryzen 7 7435HS メモリ16GB SSD1TB リフレッシュレート144Hz RGB イルミネートキーボード Windows 11 動画編集 Xbox Game Pass 3ヶ月利用権付き FA507NVR-R74R4060T
ASIN:B0CWVCYZC5

ASUS ゲーミングデスクトップPC ROG Strix G13CHR GeForce RTX 4060 Ti インテル Core i7 14700F メモリ32GB SSD1TB Windows11 動画編集 エクストリームダークグレー G13CHR-714F1T324060T
ASIN:B0D32ZCYPJ

ASTROMEDA アストロメダ PALWORLD 【ハイエンドモデル】 ゲーミングPC ホワイト corei7-14700KF/GeForce-RTX4080super(ブラック)/DDR5-RGBメモリ32GB(メモリ2枚搭載)/SSD1TB(M.2 NVMe)/Windows11 デスクトップPC
ASIN:B0DJVMBQ9C

【最新第13世代 Core i9 HX & RTX 4080搭載・ウルトラハイエンド】MSIゲーミングノートPC RaiderGE78HX i9HX RTX4080/17型 WQXGA/240Hz/32GB/1TB/Windows11/Raider-GE78HX-13VH-1103JP
ASIN:B0BVBCNBLN

MSI ゲーミングデスクトップPC Trident X2 14NUG7-440JP Windows 11 Pro/インテル Core i7-14700KF/NVIDIA GeForce RTX 4080 SUPER/DDR5 32GB/SSD 1TB/タッチパネル搭載/メーカー2年保証
ASIN:B0D9L3LD2V

【Amazon.co.jp限定】【NVIDIA最新RTX4060搭載・薄型軽量スケルトン】MSIゲーミングノートPC Cyborg15 1.98kg メモリ16GB/SSD512GB/15.6インチ FHD 144Hz/Core i5-12450H/RTX 4060/Windows11/Cyborg-15-A12VF-2202JP
ASIN:B0D224QN47

mouse 【 RTX4070 SUPER 搭載 / 3年保証】 ゲーミングPC デスクトップ G-Tune DG (Core i7 14700F RTX4070 SUPER 64GBメモリ 1TB SSD Windows 11 水冷CPUクーラー ゲーム 動画編集) DGI7G7SB6SJW103AZ
ASIN:B0D227W4SL

ASUS ゲーミングデスクトップPC ROG Strix G13CHR GeForce RTX 4070 インテル Core i7 14700F メモリ32GB SSD1TB Windows11 動画編集 エクストリームダークグレー G13CHR-714F1T324070
ASIN:B0D32WP1CD

ASUS ゲーミングノートPC ROG Flow X13 13.4インチ GeForce RTX 4070 Ryzen 9 7940HS メモリ32GB SSD1TB リフレッシュレート165Hz キーボードバックライト Windows11 動画編集 オフブラック GV302XI-R9R4070
ASIN:B0BXX9SVRM