DCAI
Loading Light/Dark Toggl

StableDiffusion webUI SDXLモデルの使い方の基本

⏱️7min read
📅 2024年5月14日
🔄 2024年11月15日
カテゴリー:📂 生成AI初級
StableDiffusion webUI SDXLモデルの使い方の基本のメイン画像
Supported by

今回はSDXLモデルについて説明してきたいと思います。この記事の執筆時に世間ではStableDiffusionV3の発表で盛り上がっていますがその前のバージョンにあたるのがSDXLモデルです。

PR
🔍Graphics Cardsfrom Amazon
1
玄人志向 NVIDIA GeForce RTX4060 搭載 グラフィックボード GDDR6 8GB 搭載モデル 【国内正規品】 GG-RTX4060-E8GB/SFの商品画像

玄人志向 NVIDIA GeForce RTX4060 搭載 グラフィックボード GDDR6 8GB 搭載モデル 【国内正規品】 GG-RTX4060-E8GB/SF

¥50,303

¥42,409

値引き¥7,894 (16%)

ASIN:B0CG69V3H6

2
MSI GeForce RTX 3060 VENTUS 2X 12G OC グラフィックスボード VD7553の商品画像

MSI GeForce RTX 3060 VENTUS 2X 12G OC グラフィックスボード VD7553

¥45,424

¥40,980

値引き¥4,444 (10%)

ASIN:B08WPRMVWB

3
ASUSTek NVIDIA RTX3060 搭載 Axial-techファンと2スロット設計 DUAL-RTX3060-O12G-V2の商品画像

ASUSTek NVIDIA RTX3060 搭載 Axial-techファンと2スロット設計 DUAL-RTX3060-O12G-V2

¥46,627

ASIN:B097P6C9HJ

4
MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 8G OC グラフィックスボード VD8517の商品画像

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 8G OC グラフィックスボード VD8517

¥70,505

¥63,736

値引き¥6,769 (10%)

ASIN:B0C5B4XNWR

5
MSI GeForce RTX 4070 SUPER 12G VENTUS 2X OC/A PCIe4.0 2スロット・2ファン搭載 省スペース グラフィックスカード VD8751の商品画像

MSI GeForce RTX 4070 SUPER 12G VENTUS 2X OC/A PCIe4.0 2スロット・2ファン搭載 省スペース グラフィックスカード VD8751

¥108,188

¥97,800

値引き¥10,388 (10%)

ASIN:B0CRZ67KXX

6
GIGABYTE NVIDIA RTX3050 搭載 グラフィックボード GDDR6 6GB【国内正規代理店品】 GV-N3050OC-6GLの商品画像

GIGABYTE NVIDIA RTX3050 搭載 グラフィックボード GDDR6 6GB【国内正規代理店品】 GV-N3050OC-6GL

¥33,839

¥27,800

値引き¥6,039 (18%)

ASIN:B0CVSGRV4G

7
GIGABYTE NVIDIA GeForce RTX4060 搭載 グラフィックボード GDDR6 8GB【国内正規代理店品】 GV-N4060D6-8GDの商品画像

GIGABYTE NVIDIA GeForce RTX4060 搭載 グラフィックボード GDDR6 8GB【国内正規代理店品】 GV-N4060D6-8GD

¥44,364

ASIN:B0CS2B592J

8
玄人志向 NVIDIA GeForce RTX3060 搭載 グラフィックボード GDDR6 12GB GALAKURO GAMINGシリーズ 【国内正規代理店品】 GG-RTX3060-E12GB/OC/DFの商品画像

玄人志向 NVIDIA GeForce RTX3060 搭載 グラフィックボード GDDR6 12GB GALAKURO GAMINGシリーズ 【国内正規代理店品】 GG-RTX3060-E12GB/OC/DF

¥52,000

ASIN:B08XMC4QJ1

9
MSI GeForce RTX 4070 VENTUS 2X E 12G OC 2ファン コンパクトサイズ グラフィックスカード VD8664の商品画像

MSI GeForce RTX 4070 VENTUS 2X E 12G OC 2ファン コンパクトサイズ グラフィックスカード VD8664

¥93,919

ASIN:B0CHVP7QGC

10
ASUS GeForce RTX 3050 LP BRK OC Edition 6GB GDDR6 ビデオカード / RTX3050-O6G-LP-BRK 国内正規流通品の商品画像

ASUS GeForce RTX 3050 LP BRK OC Edition 6GB GDDR6 ビデオカード / RTX3050-O6G-LP-BRK 国内正規流通品

¥30,800

ASIN:B0CXPBVJD3

最終更新日:2024年11月28日 0:18 ※表示の価格情報は古い場合があります。

SD1.5モデルとの違い

Stable DiffusionのSD1.5とSDXLの主な違いは以下の通りです。

SD1.5

  • 学習ベースの解像度:512×512ドット
  • テキストエンコーダー:Open AI CLIP ViT-L/14
  • パラメーターベース:3.5 Billionのパラメーターベース
  • 主な特徴:
    • SD1.5は、比較的低い解像度で画像生成を行います。プロンプトの記述方法が直感的であり、扱いやすい一方で、生成される画像の細部には限界があります。
    • SDXLと比べると少ないメモリでAIイラストの生成が可能。
    • SD1.5の公開モデルが多くそれらをうまく使えば多彩な表現が可能
    • 「masterpiece」等の品質の修飾語プロンプトに慣れているユーザーが多い。

SDXL

  • 学習ベースの解像度:1,024×1,024ドット
  • テキストエンコーダー:OpenClip model (ViT-G/14) & OpenAI proprietary CLIP ViT-L.
  • パラメーターベース:6.6 Billionのパラメーターベース(リファインを含めた場合)
  • 主な特徴:
    • ベースとリファイナーを合わせて6.6Bパラメーターベースと大幅に拡大し、より複雑なデータの処理が可能。
    • 最大1,024×1,024のサイズ出力が可能となり精密なAIイラストの生成可能。
    • 「ベース」と「リファイン」の生成ステージが2段階になり、より高品質なAIイラストを生成可能。(ベースステージのみの使用も可能。)
    • 画像生成の精度が高く、複雑なプロンプトを組まずに高品質な画像を生成できる。
    • SD1.5よりも高速に作業し、画質を損なうことなく画像生成にかかる時間を短縮します。
    • カスタムLoraやチェックポイントモデルの学習スピードの向上

推奨スペック

SDXLモデルを使ってAIイラスト生成するにはGPUメモリが最低でも8GBは必要になります。

公式では「xformers」の使用を推奨しています。

「Automatic1111 Stable DIffusion Web UI」の起動設定をご自身のVRAMの容量により以下の様に変更することをオススメします。

Nvidia (12gb+) --xformers
Nvidia (8gb) --medvram-sdxl --xformers
Nvidia (4gb) --lowvram --xformers

xformers適応方法

ファイルエクスプローラーで\stable-diffusion-webui\を開きます。

webui-user.batを右クリックしてメモ帳又はお好きなテキストエディターで編集します。

set COMMANDLINE_ARGS=と記述されている行を探しましょう。

set COMMANDLINE_ARGS=の後に先ほど説明したコマンドライン引数を入力します。

たとえばご自身のVRAMが8gbの場合はset COMMANDLINE_ARGS= --medvram-sdxl --xformersとなります。

保存してWebUIを起動します。

起動時のコマンドプロンプトを確認して下記の様になっていれば正常に適応されています。

SDXLモデルのダウンロード

まずは「stability.ai」が公開しているモデルを使ってみましょう。

SDXL-base-1.0 SDXL-refiner-1.0 SDXL-VAE

また、SDXL 1.0のオススメチェックポイントを紹介していますのでご参考ください。

SDXLモデルの使い方

ダウンロードしたモデルはSD1.5と同じ様に、チェックポイントモデルとリファイナーモデルは\stable-diffusion-webui\models\Stable-diffusionにVAEは\stable-diffusion-webui\models\VAEにそれぞれ移動します。

ブラウザに戻り左上のチェックポイントモデルの選択タブの横の「🔄」ボタンを押します。更新が完了するとタブより先ほどフォルダーに移動したチェックポイントモデルが表示されるので選択して読み込みます。VAEもSD1.5と同様に選択してください。

Refinerの活用方法

SDXLモデルにセカンドステージを組み込む際には、Refiner機能が必要となります。注意:WebUIバージョン1.5.2以前では対応していません。 したがって、バージョン1.6.0以上へのアップデート、またはimg2img機能を利用してリファイナーモデルを適用することをオススメします。

使用方法:
  • パラメーターエリアにある「Refiner」オプションを有効にします。
  • 「Checkpoint」でリファイナーモデルを選択します。
  • 「Switch at」の値は、モデルを切り替えるタイミングを指定します。この値は0から1の範囲で設定可能です。たとえば、0.5を設定した場合、プロセスの中間点でリファイナーモデルへと切り替わります。

解像度について

SDXLモデルは最大1024×1024まで出力が可能なので以下の解像度を使いましょう。

  • 1:1:1024 x 1024
  • 9:7:1152 x 896
  • 19:13:1216 x 832
  • 7:4:1344 x 768
  • 12:5:1536 x 640

SDXLモデルで生成してみる

以下の設定で生成してみましょう。

プロンプト
A cat in armor stands on a hillside,
Medival fantasy, award winning water color, full body,
ネガティブプロンプト
worst quality, ugly, deformed,bad anatomy,
パラメーター
Sampling steps: 30
Sampling method: DPM++ 2M
Schedule type: Karras
CFG Scale: 7
Clip skip: 2
Refiner: on
Model: sd_xl_refiner_1.0.safetensors
Switch at: 0.8
Width: 1344
Height: 768
VAE: sdxl_vae.safetensors
SDXLモデルのサンプル画像
Seed: 1742520817
画像を開く

いかがでしょうか?男前な猫騎士が生成されたと思います。Seed値を使用することで、類似したイラストを作成することが可能ですが、Web UIのバージョンによっては、生成されるイラストに違いが出ることがあります。また、award winning water colorの「water color」部分でスタイルが指定されているのでさまざまなスタイルを試してみましょう。

anime artwork, 
concept art, 
cinematic film still, 
comic, 
line art drawing, 
photographic, 
art deco style, 
art nouveau style, 
cubist artwork, 
hyperrealistic art, 
pop Art style, 
surrealist art, 
vaporwave style, 
イラストスタイル cinematic film still のサンプル画像
cinematic film still
画像を開く
イラストスタイル art nouveau style のサンプル画像
art nouveau style
画像を開く
イラストスタイル vaporwave style のサンプル画像
vaporwave style
画像を開く

テキストの生成

まだ成功率も低くLoraモデルの補助なく使うのは実用性はありませんが看板等の文字(英語のみ)を表示させることができます。

プロンプト
A cat in armor stands on a hillside,
(holding a sign that says “ (CAT) ”:1.8),  
Medival fantasy, fantasy-core, Award-Winning, anime artwork, dramatic, key visual, vibrant, studio anime, highly detailed, full body,
ネガティブプロンプト
worst quality, ugly, deformed,bad anatomy,
パラメーター
Sampling steps: 30
Sampling DPM++ 2M Karras
CFG Scale: 7
Clip skip: 2
Width: 1344
Height: 768
VAE: sdxl_vae.safetensors
Refiner: on
Model: sd_xl_refiner_1.0.safetensors
Switch at: 0.7
Seed: 3632954274
ADetailer: on
Hires. Fix: on
Upscaler: R-ESRGAN 4x+
Hires steps: 10
Denoising strength: 0.5
Upscale by: 1.5

まとめ

今回は、SDXLモデルの基本操作についてご説明しました。Refinerを使用しない場合、SD1.5とほぼ同様に操作可能です。適切なスペックを備えたPCをお持ちの方は、ぜひ試してみてください。また、「masterpiece」のような品質を示す修飾語を使用することを推奨していませんが、出力の品質にも影響を与えることができるので試してみるのも良いでしょう。プロンプトの理解力が向上したことで、自然言語処理がさらに使いやすくなったと感じられるではないでしょうか。

PR
🔍Monitorsfrom Amazon
1
【Amazon.co.jp 限定】アイ・オー・データ IODATA モニター 23.8インチ ブラック ADSパネル 非光沢 省電力 (HDMI/アナログRGB/スピーカー付/VESA対応/土日サポート/日本メーカー/無輝点保証) EX-A241DBの商品画像

【Amazon.co.jp 限定】アイ・オー・データ IODATA モニター 23.8インチ ブラック ADSパネル 非光沢 省電力 (HDMI/アナログRGB/スピーカー付/VESA対応/土日サポート/日本メーカー/無輝点保証) EX-A241DB

¥14,800

¥12,580

値引き¥2,220 (15%)

ASIN:B0CPXQQLL2

2
【Amazon.co.jp限定】アイリスオーヤマ モニター 24インチ スピーカー内蔵 VAパネル HDMI VGA 角度調整可能 FHD 1920x1080 100Hz 14ms ブルーライト軽減 フレームレス VESA対応 DT-GF233R-Bの商品画像

【Amazon.co.jp限定】アイリスオーヤマ モニター 24インチ スピーカー内蔵 VAパネル HDMI VGA 角度調整可能 FHD 1920x1080 100Hz 14ms ブルーライト軽減 フレームレス VESA対応 DT-GF233R-B

¥13,800

¥11,700

値引き¥2,100 (15%)

ASIN:B0CYPWXXWM

3
【Amazon.co.jp限定】ASUS フレームレス モニター VZ249HR 23.8インチ/フルHD/IPS/薄さ7mm/ブルーライト軽減/フリッカーフリー/HDMI,D-sub/スピーカー/3年保証の商品画像

【Amazon.co.jp限定】ASUS フレームレス モニター VZ249HR 23.8インチ/フルHD/IPS/薄さ7mm/ブルーライト軽減/フリッカーフリー/HDMI,D-sub/スピーカー/3年保証

¥13,980

ASIN:B07LH1ZDSL

4
PHILIPS 液晶ディスプレイ PCモニター 272E2FE/11 (27インチ/5年保証/FHD/IPS/D-Sub 15,HDMI,Display Port/昇降・高さ調節/チルト/4面フレームレス/FreeSync(HDMI,DP)ちらつき防止/ブルーライト軽減)の商品画像

PHILIPS 液晶ディスプレイ PCモニター 272E2FE/11 (27インチ/5年保証/FHD/IPS/D-Sub 15,HDMI,Display Port/昇降・高さ調節/チルト/4面フレームレス/FreeSync(HDMI,DP)ちらつき防止/ブルーライト軽減)

¥18,800

ASIN:B08PTSY9PL

5
【Amazon.co.jp限定】MSI モニター PRO MP2412 23.8インチ/フルHD/VAパネル/100Hz/1ms/ブルーライトカット/アンチフリッカー/HDMI/DP/VESA対応/メーカー3年保証の商品画像

【Amazon.co.jp限定】MSI モニター PRO MP2412 23.8インチ/フルHD/VAパネル/100Hz/1ms/ブルーライトカット/アンチフリッカー/HDMI/DP/VESA対応/メーカー3年保証

¥14,800

¥9,980

値引き¥4,820 (33%)

ASIN:B0CDBS93QZ

6
PHILIPS モニターディスプレイ 271E1D/11 (27インチ/IPS Technology/FHD/5年保証/HDMI/D-Sub/DVI-D/フレームレス)の商品画像

PHILIPS モニターディスプレイ 271E1D/11 (27インチ/IPS Technology/FHD/5年保証/HDMI/D-Sub/DVI-D/フレームレス)

¥17,800

ASIN:B07V5BHZLW

7
【Amazon.co.jp限定】Dell ハイスペック 23.8インチ ホワイトモニター(5年保証/FHD/IPS,非光沢/縦横回転,高さ調整/5Wx2スピーカー/HDMIx2) S2425HS-Aの商品画像

【Amazon.co.jp限定】Dell ハイスペック 23.8インチ ホワイトモニター(5年保証/FHD/IPS,非光沢/縦横回転,高さ調整/5Wx2スピーカー/HDMIx2) S2425HS-A

¥20,800

¥15,600

値引き¥5,200 (25%)

ASIN:B0CXXC87JK

8
Dell SE2222H 21.45インチ モニター ディスプレイ (3年間交換保証/FHD/VA 非光沢/HDMI D-Sub15ピン/傾き調整)の商品画像

Dell SE2222H 21.45インチ モニター ディスプレイ (3年間交換保証/FHD/VA 非光沢/HDMI D-Sub15ピン/傾き調整)

¥14,600

ASIN:B095749V5V

9
日本エイサー 【Amazon.co.jp限定】Acer モニター 23.8インチ フルHD VA 非光沢 100Hz 1ms HDMI ミニD-Sub15 VESAマウント対応 スピーカー内蔵 AMD FreeSync KA242YHbmixの商品画像

日本エイサー 【Amazon.co.jp限定】Acer モニター 23.8インチ フルHD VA 非光沢 100Hz 1ms HDMI ミニD-Sub15 VESAマウント対応 スピーカー内蔵 AMD FreeSync KA242YHbmix

¥13,980

¥11,800

値引き¥2,180 (16%)

ASIN:B0BW3PJ2TL

10
HP モニター V27ie G5 27インチ フルHD 75Hz 5ms IPSパネル 非光沢 HDMI DisplayPort VGA AMD FreeSync 角度調整ブルーライトカット 薄型ベゼル(型番:6D8H3AA-AAAB)の商品画像

HP モニター V27ie G5 27インチ フルHD 75Hz 5ms IPSパネル 非光沢 HDMI DisplayPort VGA AMD FreeSync 角度調整ブルーライトカット 薄型ベゼル(型番:6D8H3AA-AAAB)

¥16,001

¥15,150

値引き¥851 (5%)

ASIN:B0CFXKRGN8

最終更新日:2024年11月28日 0:18 ※表示の価格情報は古い場合があります。
Supported by