Negative Embedding (Textual Inversion) を使って高品質な画像を生成する
Negative Embedding (Textual Inversion)とは
Negative Embedding (Textual Inversion)とは、言葉の意味をコンピューターが理解するための技術の一つです。普通、コンピューターは言葉を数値の集まり、つまりベクトルとして理解します。このベクトルは、その言葉が持つ意味や関連性を表しています。
例えば、「犬」という言葉があるとします。コンピューターは「犬」をあるベクトルで表し、それによって「犬」が動物であること、ペットであることなどの情報を理解します。しかし、Negative Embeddingでは、この「犬」のベクトルを逆転させます。すると、コンピューターは「犬」の反対や対立する概念を探し始めます。つまり、「犬」ではないもの、例えば「猫」や「鳥」などの他の動物を見つけることができるのです。
この技術は、特に言葉の意味を深く理解する必要がある場面で役立ちます。たとえば、文章を分析して、その中の対立するアイデアや感情を見つけ出すときなどです。ただし、この方法はまだ完全ではなく、コンピューターが間違った関連性を見つけることもあります。ですので、使用する際には注意が必要です。
初心者の方には、このような複雑な技術を理解するのは難しいかもしれませんが、要するに、Negative Embedding (Textual Inversion)は、言葉の意味を逆転させて、新しい視点や関連性を見つけるためのツールだと考えていただければと思います。興味深い技術ですので、さらに学びたい場合は、Word2Vec
やGloVe
などの単語埋め込みモデルについて調べてみると良いでしょう。これらは、言葉の意味をベクトルとして表現するための基本的なツールです。
Negative Embedding (Textual Inversion)のインストール方法
ダウンロードしてきたファイルを\stable-diffusion-webui\embeddings
フォルダーに移動します。
- Web UIのブラウザーを開き生成パラメーターエリアの「Textual Inversion」を開きます。
- 右にある更新ボタンを押すと一覧にファイルが表示されます。
チェックポイントモデルがSD1.5を選択している場合、表示されるモデルはSD1.5に適したものだけです。他のモデル(SDXL)は表示されませんので、ご注意ください。
Negative Embedding (Textual Inversion)の使い方
まずは「Textual Inversion」のページを開きます。ネガティブプロンプトを適用したい場合は、ネガティブプロンプト入力欄の挿入したい位置をクリックし、一覧から適応させたいNegative Embeddingを選択すればネガティブプロンプト入力欄に名前が表示されます。
適応を解除したい場合はもう一度Negative Embeddingを選択すれば解除できます。
Negative Embedding (Textual Inversion)のウェイト調整
Negative Embeddingのウェイト(強度)を調整するには、以下の手順を実行します。
- ネガティブプロンプト入力欄の名前を選択します。
Ctrl
キーを押しながら↑
または↓
キー(矢印キー)を押すことで、ウェイトの増減が可能です。
(EasyNegative:1.2)
上記の例では、「EasyNegative」が1.2倍のウェイトで適用されることを意味します。
Negative Embedding (Textual Inversion)のUIの使い方
\stable-diffusion-webui\embeddings
フォルダー内をさらにフォルダで分別している場合はこのボタンを有効するとツリービューに切り替え出来ます。
Negative Embedding (Textual Inversion)モデルのメタデータの編集方法
基本的にはメタデータは何も入れなくても問題ありません。ただしモデルが増えていくとどういったモデルなのかが分からなくなるのでモデルの説明などをメタデータとして保存します。
一覧より編集したいモデルにマウスを持っていくと右上にマークが出てきますのでクリックするとメタデータ編集画面が開きます。
- Descriptionメタデータの説明を入れていきます。
- サムネイルメタデータのサムネイルが表示されます。
- Notesメタデータのメモなどを入れていきます。
- Replace previewメタデータのサムネイルを更新したいときに使います。
メタデータのサムネイルの更新方法
txt2imgでモデルを使った画像をポートレート(SD1.5→ 512x768/ SDXL→ 768x1344)で生成します。
サムネイルにしたい画像が生成されたら、「Textual Inversion」ページのモデル編集画面を開きます。
「Replace preview」を押せば先ほど生成した画像と差し替えられます。
サムネイルを消したい場合は\stable-diffusion-webui\embeddings
フォルダーにモデル名.preview.png
がありますのでPNG画像を削除すれば初期状態にもどります。
まとめ
今回はNegative Embedding (Textual Inversion)について説明させていただきました。Negative Embeddingを使用することでテキスト生成の品質が向上するため、ぜひ試してみてください。また、チェックポイントモデルとの相性も考慮しながら、適切なモデルを選択してください。
おすすめのモデルについては、別途記事としてまとめていく予定ですので、そちらもご参照いただければ幸いです。最後までお読みいただき、ありがとうございました。