オリジナルキャラクターLoRAの作り方【データセット編】学習画像の制作とキャプション

⏱️18min read

📅 2025年3月28日

🔄 2025年4月8日

カテゴリー：📂 AIイラスト上級

タグ：🏷️ AUTOMATIC1111 🏷️ ComfyUI 🏷️ image2image 🏷️ LoRA

オリジナルキャラクターLoRAの作り方【データセット編】学習画像の制作とキャプションのメイン画像

📄目次

学習元オリジナルキャラクターの制作
1. VRoid Studioのインストール
2. VRoid Studioを使ったキャラクター制作
学習元画像の制作
1. 撮影設定
2. キャラクターの撮影
ComfyUIを使ってイメージスタイルをカスタム＆画像のキャプション作成
A1111 WebUIを使った画像のキャプション生成・編集
1. 拡張機能WebUI WD 1.4 Taggerを使ったキャプション生成
2. 拡張機能WebUI Dataset Tag Editorを使ったキャプション編集
キャプションタグについて
タグ編集時の不要なタグの選び方
キャプションの品質を上げる
おまけ：ファイル名の一括変換方法（Windows）
1. PowerRenameのインストール方法
2. PowerRenameの使い方
まとめ

Supported by

今回は学習元となるオリジナルキャラクターのデータセットの作り方を紹介します。データセットとは、学習元画像とその画像のキャプションがまとまったファイル群になります。データセットの作り方は色々な方法がありますが、今回はpixivが無料で公開している3Dキャラクターメイキングソフト「VRoid Studio」で画像を作りComfyUIとA1111 WebUIを使って整えていきます。

【Ver.4.0対応】CLIP STUDIO PAINT(クリスタ) EX 12ヶ月ライセンス 1デバイスパッケージ版| iPad / Android / Windows / macOS / iPhone 対応 | ｜【総ページ数360ページのスタートアップガイド付属】

Amazonで見る

🔗Amazonリンク

Image of 【Adobe公式】Creative Cloud フォトプラン（Photoshop + Lightroom ）| 生成AI Firefly搭載写真画像編集ソフト（最新）| 12ヵ月 | オンラインコード版 Win / Mac / iPad / アプリ対応 | 8K 4K 画像写真イラストデザインフォントアドビフォトショ

【Adobe公式】Creative Cloud フォトプラン（Photoshop + Lightroom ）| 生成AI Firefly搭載写真画像編集ソフト（最新）| 12ヵ月 | オンラインコード版 Win / Mac / iPad / アプリ対応 | 8K 4K 画像写真イラストデザインフォントアドビフォトショ

Amazonで見る

🔗Amazonリンク

学習元オリジナルキャラクターの制作

学習元オリジナルキャラクターの制作に無料の「VRoid Studio」を使ってキャラクターを制作します。紹介する方法は3DCGソフトの「🔗Cinema4D」や、無料の「🔗Blender」、スカルプトソフトの「🔗ZBlush」や、無料の「🔗ZBrushCoreMini」、最後に衣装モデリングソフトの「🔗Marvelous Designer」や「🔗CLO」等を使って、習得に時間が掛かりますが本格的にキャラクター制作をすることも可能です。

VRoid Studioのインストール

詳しく説明はしませんが、まずは「VRoid Studio」をダウンロードしてインストールしましょう。

VRoid Studio

https://vroid.com/studio

🔗外部リンク

VRoid Studioのページに行き、インストーラーをダウンロードして実行しましょう。特別な設定はありませんので簡単にインストールできます。

VRoid Studioを使ったキャラクター制作

インストールが完了したら、「VRoid Studio」を起動しましょう。

例ではプリセットを組み合わせて、キャラクターを作っています。

UIの上部の編集ページの切り替えと、左にプリセットが並んでいるので、自由に選択してキャラクターを作ります。

VRoid Studioの詳しい使い方は、ここでは紹介しないので、公式ドキュメントのリンクを置いておきます。

VRoid Studio 正式版のヘルプ

https://vroid.pixiv.help/hc/ja/categories/900000339606-VRoid-Studio-%E6%AD%A3%E5%BC%8F%E7%89%88

🔗外部リンク

VRoid Studioでの注意点は「ルック」ページにあるアウトライン設定です。後ほど撮影する時に、綺麗な線を出力できるなら使用しても問題ありませんが、ギザギザがでるようなら問題になるので（生成画像にギザギザが出る）、アウトラインをすべて0に設定します。

気に入ったキャラクターが完成したら、モデルを保存しましょう。

学習元画像の制作

完成したキャラクターを、撮影モードで画像化します。右上のカメラアイコンボタンより、撮影モードに切り替えましょう。

LoRA学習でキャラクターを学習したい場合は、キャラクターをさまざまなアングルで撮影する必要があります。

撮影設定

撮影モードに切り替えたら、まずはキャプチャー設定をしましょう。左のメニューから、それぞれの設定に切り替えできます。

背景

デフォルトのグレー背景を使って撮影しています。グレー背景は、キャプションで「black background」と認識されますが、使う予定がないのなら問題ありません。（LoRA適用時に黒背景を使うならgray backgroundに置き換えましょう。）また、白背景、黒背景、透過背景でも学習することは可能です。キャラクターの世界観が決まっている場合は世界観に合った背景を読み込むのも良いでしょう。ただし、背景画像を使う場合はすべて同じ背景にならないように注意しましょう。

照明

照明もデフォルトのまま撮影します。手間は掛かりますが、色々な方向からの影で撮影すると影部分の生成が良くなるみたいです。しかし、かなりの手間が掛かるのと、影に暖色が入っていて白い物の影がピンクになっているので、1つの方向のみの撮影にしました。

風

使いません。

ポストエフェクト

撮影画像をできるだけ高品質で書き出したいので「アンチエイリアス」にチェックをいれて高負荷を選択します。これをしないと髪などの細かい部分が学習に悪影響します。

撮影サイズ

学習元画像は1024×1024または512×512で学習するのですが、できるだけシャープにしておきたいので2048x2048で撮影して後の工程で縮小します。

キャラクターの撮影

キャラクターを色々な角度から撮影するのですが、いくつか注意点があります。

撮影枚数：キャラクターLoRAの学習に必要な画像数は、拡大する必要のない鮮明な画像が10～50枚くらいあれば学習できます。今回は50枚としました。
ポーズ：ポーズは一つのポーズだけで学習すると、そのポーズしかしない場合があるので、すべて違うポーズにする必要はありませんが、適度に変更してきましょう。ただし「VRoid Studio」では、スカートを着ている場合はしゃがむ等のポーズで足が貫通してしまいます。学習元画像としておかしくなるようなポーズは避けましょう。また、撮影時はポーズを一時停止しながら撮影すると狙ったポーズを撮影しやすくなります。
表情：表情についても同じで、すべて同じ表情で学習させると、その表情しかしなくなる場合があるので、適度に表情を変えながら撮影します。また、撮影時に半目閉じとかにならないように「まばたきをする」のチェックを外しておきましょう。
撮影アングル：人物を前・横・後・ナナメから撮影します。
ズーム：人物の全体・上半身・下半身・顔の接写を撮影します。とくにキャラクターを学習したいので重要な顔部分や衣装は少し多めに撮影します。
手について：手についてはこの3Dモデルはあまり細かく作りこまれていないので、学習させない為にできるだけ撮影しないようにしましょう。
衣装について：1パターンのみの衣装の設定なので注意する箇所はありませんが、複数衣装を考えている場合は、衣装によって保存するフォルダーを分けた方が、後ほど作業しやすくなります。

注意点を意識しながら撮影していきましょう。撮影はスクリーン右下にある青いカメラボタンで撮影できます。

Supported by

ComfyUIを使ってイメージスタイルをカスタム＆画像のキャプション作成

学習元画像のイメージスタイル（3DのVtuberモデルでよく見るフラットな3DCG）は学習せずに、キャラクターの特徴のみを学習した汎用性の高いLoRAを作りたいと思います。image to imageを使って、学習元のイメージスタイルを複数にして、スタイルの固定化を防ぎます。

イメージスタイルを変えずにこのまま学習させるとスタイルが強く残ってしまいます。キャプションにcgや3dcgタグ等を使ってスタイルを学習させ、生成時に設定したタグをネガティブプロンプトに入れる方法もありますが、完全にスタイルを取り除くのは難しいでしょう。

スタイルも含めて学習させたい場合はこの項目は飛ばして「⏬4. A1111 WebUIを使った画像のキャプション生成・編集」に移りましょう。

ワークフローの紹介

紹介するワークフローは、複数のインプット画像から好きなモデル（SD1.5またはSDXL）を使ってimg2imgで描き、同時にキャプションも作成するワークフローです。

ワークフローはPatreonで公開していますが、有料サポーター様のみ閲覧・ダウンロードが可能となっています。また、オマケとして前の項目で紹介したVRoid Studioで書き出したインプット画像もダウンロードできます。

ComfyUI Image Tagger & Style Switcher Workflow | Digital Creative AI | PATREON

https://www.patreon.com/posts/125348350

🔗外部リンク

ワークフローがダウンロード出来なくでも、解説を見ればご自身でも構成できるので、このままお進みください。

ワークフローの為のカスタムノードの準備

ワークフローでは以下のカスタムノードを使用します。あらかじめインストールしておきましょう。

🔗ComfyUI_LayerStyle：img2imgで生成した画像とキャプションの保存に使います。
🔗ComfyUI-WD14-Tagger：画像からキャプション/プロンプトタグを生成する時に使います。。
🔗ComfyUI-Custom-Scripts：生成されたプロンプトを編集するのに使います。
🔗Chaosaiart-Nodes：インプット画像をバッチ処理するのに使います。

カスタムノードのインストール方法が分からない方は、下記の記事を参考にしてください。

【AIイラスト】ComfyUI お勧めカスタムノードの紹介

🔗あわせて読みたい

ワークフローの解説

Image Batch Loader

🔶 Restart & Active Frame：バッチ処理の制御ノード。バッチ処理を新たに開始したい時は、Versionを変更しフレームをリセットしましょう。
🔶 Load Image Batch：バッチ処理をする画像を読み込みます。インプット画像のフォルダーを指定しましょう。
🔶 Info Display：バッチ処理の情報を確認します。

Test Style

Load Image：スタイルのテスト用に使う画像を指定します。
🔶 Any Switch：テスト画像とインプット画像を切り替えます。0＝バッチモード / 1＝テスト＆修正モード

Load Models

Load Checkpoint：チェックポイントモデルを読み込みます。今回は「Animagine XL 4.0」を使用しています。
LoraLoaderModelOnly：LoRAを読み込みます。デフォルトではバイパスしています。

Scale image

Upscale Image：インプット画像を1024ピクセルに拡大・縮小します。
VAE Encode：pixelデータからlatentデータにエンコードします。

Prompts

WD14 Tagger 🐍：インプット画像からキャプションを生成します。
String Function 🐍：生成したキャプションに任意のタグを追加して、ポジティブプロンプトを作成します。
CLIP Text Encode (Prompt)：ポジティブプロンプト。textを外部化してString Function 🐍で作成したプロンプトを読み込みます。
CLIP Text Encode (Prompt)：ネガティブプロンプト。通常のネガティブプロンプトを入力します。

Sampler

KSampler：steps/cfgは「Animagine XL 4.0」の推奨値を使っています。denoiseを使ってインプット画像からどれだけ異なるかを設定します。
VAE Decode：latentデータからpixelデータにデコードします。

Caption

String Function 🐍：キャプションの学習時に設定するインスタンス（学習するLoRAの固有名詞）とクラス（学習するLoRAの一般名称）を設定します。※例ではクラスの1girlがWD14 Tagger 🐍でも生成されるのでダブってしますが、後ほどキャプション編集をするので問題ありません。

Save image & caption

LayerUtility: Image Tagger Save：生成された画像とキャプション（txtファイル）を指定した場所に保存します。

Preview

Preview Image：インプット・アウトプットをプレビューします。

ワークフローの使い方

ワークフローを使って、インプット画像から2種類のイメージスタイルの学習元画像を生成します。

img2img生成モデルの選択

img2img生成モデルを選択します。例では「Animagine XL 4.0 – V4 Opt」を使用しています。イメージスタイルは、チェックポイントモデルである程度決まってきます。色々と試してみましょう。

Animagine XL 4.0-V4 Opt | Civit AI

https://civitai.com/models/1188071?modelVersionId=1408658

🔗外部リンク

SD1.5モデルを使いたい場合は、Upscale Imageのwidthを768または512に変更しましょう。

LoRAの選択（オプション）

チェックポイントモデルだけで異なったイメージスタイルを生成できない場合は、イメージスタイルLoRAを使うことも可能です。

インプット画像ディレクトリの指定

Image Batch Loaderグループの「🔶 Load Image Batch」にあるpathにインプット画像のディレクトリを指定します。例ではComfyUI\input\train_imagesとしてComfyUIのインプットフィルダーにtrain_imagesフォルダーを作り、画像を配置しています。

このディレクトリ指定は、パスをテキストで直接入力する必要があります。

簡単な方法としては、Windowsの場合はファイルエクスプローラーでフォルダーを開き、アドレスバーを右クリックするとメニューが出てきます。「アドレスをコピー」をクリックするとパスがコピーされるので、pathに貼り付けましょう。

WD14 Tagger 🐍の設定

デフォルトのまま使用しても問題ありません。例では少しキャプションが簡素だったので、thresholdを0.35から0.30に下げています。

キャプションの設定

Captionグループの「String Function 🐍」にあるtext_aにインスタンスタグとクラスタグを指定します。

インスタンスタグは学習ベースモデルが学習していないタグを指定するのですが、レアトークン（tokinizerで1トークンになる3文字以下でレアな単語）の使用を🔗Dreamboothの論文が推奨しています。例：sks

img2imgのプロンプト作成

WD14 Taggerで生成されたキャプションの前後にタグを追加します。例では「Animagine XL 4.0」推奨の品質タグを後ろに追加しています。

ネガティブプロンプトの入力

img2imgで使うネガティブプロンプトを指定します。例では「Animagine XL 4.0」推奨のネガティブプロンプトに加えて、唇を生成しないようにlipsを入力しています。

サンプラーの設定

steps/cfg/sampler/schedulerはお好みで設定してください。denoiseはこのワークフローの設定で重要な値で、インプット画像からどれだけ異なるかの設定になります。この値が大きすぎると、キャラクターの要素が、かけ離れてしまいます。しかし、小さすぎると、ほとんどインプット画像と変わらないので0.25~0.50の間で設定しましょう。

イラストスタイルのテスト

チェックポイントモデルやLoRAそしてプロンプトを使って、イラストスタイルを決めます。

テストする場合は「LayerUtility: Image Tagger Save」を、ミュートもしくはバイパスします。「Test Style」グループの「🔶 Any Switch」にあるnrを1に変更して、「Load image」にテストしたい画像を読み込みます。

バッチ処理（1回目）

ComfyUIのBatch Countをインプット画像の枚数と同じ値に指定します。続いて「🔶 Restart & Active Frame」のVersionを新しいバージョンにします。また、テストをしていた場合は「🔶 Any Switch」にあるnrを0に戻しましょう。

設定が終われば「Queue」ボタンで、バッチ生成を開始します。生成されたデータは「LayerUtility: Image Tagger Save」のcustom_pathで指定した場所に保存されます。ファイル名はfilename_prefixで指定します。

2回目のイラストスタイルの設定

キャラクターLoRA学習で、イラストスタイルを固定せず汎用性の高いLoRAにしたい場合は、複数のイラストスタイルを学習した方が良いので、1回目とは違ったイラストスタイルでもう一度生成します。スタイルのテストをする時はBatch Countを1に戻すのを忘れないようにしましょう。

例として、Promptsグループの「String Function 🐍」のtext_aに(realistic:1.4)「CLIP Text Encode (Prompt)」（ネガティブプロンプト）にflat color, animeを追加しました。

バッチ処理（2回目）

Batch Countをインプット画像の枚数と同じ値に指定します。続いて「🔶 Restart & Active Frame」のVersionを新しいバージョンにします。

設定が終われば「Queue」ボタンでバッチ生成を開始します。1回目に続いて00000051番からファイルが保存されます。

生成画像の修正

すべての画像が生成されたら生成画像をチェックしていきましょう。画像が不鮮明だったり意図していない画像が生成されている場合は、イラストスタイルのテスト時と同様に「LayerUtility: Image Tagger Save」をミュートにして、「🔶 Any Switch」にあるnrとComfyuIのBatch Countを1に変更し、「Load image」に修正したい画像を読み込みます。

Samplerやプロンプトを調整しながら画像を生成します。

満足のいく画像が生成されたら、Preview(Output)の画像を右クリックからSave Imageを選択して、修正元画像を上書きしましょう。

さらに品質を上げたい場合は「🔗Gimp」「🔗CLIP STUDIO PAINT」「🔗Affinity Photo 2」「🔗Adobe Photoshop」を使ってレタッチしましょう。レタッチにはペンタブがあれば作業効率も上がるのでおススメします。

データセット完成

修正がすべて終わればデータセットの完成です。下記の様にあまり大きく差はありませんが、インプット画像から2通りのスタイルになりました。（もっと差を出したい場合は、チェックポイントモデルを変えてみましょう。）

データセット画像サンプル — アニメ調とリアル調。2枚ともdenoise:0.40でインプット画像を保持しながらスタイルが変わっています。

例では元画像を使わずに2パターンのイラストスタイルを作成しましたが、1回目のバッチでサンプラーをバイパスしてインプット画像のままキャプションを付け、2回目でimg2imgする方法もあります。学習したLoRAを使用時に、キャラクターのディテールが再現できない場合は、この方法を試してみましょう。

以上でカスタムされた画像とキャプションが書き出されました。続いて書き出されたキャプションをA1111 WebUIを使って編集していきましょう。

Supported by

A1111 WebUIを使った画像のキャプション生成・編集

ココからはA1111 WebUIを使って、画像のキャプション生成・編集をします。ComfyUIを使ってキャプションを生成した方は「⏬4-2. 拡張機能WebUI Dataset Tag Editorを使ったキャプション編集」から進めましょう。

拡張機能WebUI WD 1.4 Taggerを使ったキャプション生成

キャプション生成には、A1111 WebUIの拡張機能（エクステンション）のstable-diffusion-webui-wd14-taggerを使います。

Tagger for Automatic1111’s WebUI · GitHub

https://github.com/picobyte/stable-diffusion-webui-wd14-tagger

🔗外部リンク

インストール方法が分からない方は、下記の記事を参考にしてください。

A1111 StableDiffusion webUI 拡張機能の使い方とおすすめ紹介

🔗あわせて読みたい

インストールが完了したら画像フォルダーからキャプションを生成しましょう。

Taggerページに移動

エクステンションがインストールできたら、UIのページ切り替えタブに「Tagger」が出てくるので、クッリクしてページを切り替えます。

画像フォルダーの指定

開いたページの左上にSingle processとBatch directoryの切り替えタブがあるので、Batch directoryに切り替えます。

input directoryにVRoid Studioで撮影した画像フォルダーを指定します。あまり使うことはありませんが、生成されたキャプションファイルを別のフォルダーに保存したい場合は、Output directoryに保存先を指定します。

ComfyUIのワークフローの使い方でも説明しましたが、イメージスタイルのカスタムをスキップしている方の為にもう一度説明します。このフォルダー指定はパスを直接入力する必要があります。簡単な方法としては、Windowsの場合はファイルエクスプローラーでフォルダーを開き、アドレスバーを右クリックすると、メニューが出てきます。「アドレスをコピー」をクリックするとパスがコピーされるので、input directoryに貼り付けましょう。

すべての画像に共通したインスタンスタグとクラスタグの設定

Additional tagsにインスタンスタグ（学習するLoRAの固有名詞：学習ベースモデル学習していないタグ）とクラスタグ（学習するLoRAの一般名称：学習ベースモデルがすでに学習しているタグ）を指定します。例としてdcai-girl, 1girlと設定しています。※例では生成したほとんどのキャプションファイルに「1girl」が生成されるので、後のキャプション編集で、二重につけられたタグを削除します。

キャプションタグの生成

「Interrogate」ボタンを押して生成を開始します。しばらくすると、UIの左部に生成結果が表示されます。

以上でデータセットフォルダーにキャプションファイルが追加されました。このまま学習データセットとして使うことは可能ですが、より良いLoRAを作りたい方は、生成されたキャプションタグを編集しましょう。

拡張機能WebUI Dataset Tag Editorを使ったキャプション編集

キャプション編集にはstable-diffusion-webui-dataset-tag-editorを使います。先ほどと同じ方法でインストールしましょう。

Dataset Tag Editor · GitHub

https://github.com/toshiaki1729/stable-diffusion-webui-dataset-tag-editor

🔗外部リンク

エクステンションがインストールできたら、キャプションタグを編集していきましょう。今回は基本的な使い方のみ説明します。

Dataset Tag Editorページに移動

UIのページ切り替えタブに「Dataset Tag Editor」が出てくるので、クッリクしてページを切り替えます。

データセットフォルダーの指定

Dataset directoryにデータセットフォルダーのパスを指定します。Caption File Extは.txtのまま使いますが、.captionで作られた場合は.captionに変更します。

データセットの読み込み

データセットフォルダーを指定したら、右にある「Load」ボタンで読み込みます。

不要なタグの除去

UIの右側のページタブより「Batch Edit Captions」を開き、ページ内のタブより「Remove」を選択します。

UIの右下のSelect Tagsに、キャプションのタグ一覧が表示されているので、不要なタグを選択します。選択したら「Remove selected tags」ボタンで除去します。※不要タグの選び方は、後ほど詳しく解説していますので、そちらを参考に削除していきましょう。

二重につけられたタグの除去

Removeページの「Remove duplicate tags」ボタンで除去します。例では「1girl」が重複しているのでこのボタンで除去しましょう。また、タグを書き換えたり直接編集した場合は、最後にこのボタンを使うことをおススメします。

タグ書き換え

「Batch Edit Captions」ページの「Search and Replace」を開き、下段のSearch and Replace for all images displayedエリアを使って書き換えます。

Search Textに書き換え元タグを入力し、Replace Textに書き換えたいタグを入力します。キャプション全体を書き換えたい場合はSearch and Replace inをEntire Captionに選択します。

最後に「Search and Replace」ボタンで書き換えを実行します。

キャプションの直接編集

キャプションを手動で編集する場合はUIの右側のページタブより「Edit Caption of Selected Image」を開き、左の画像一覧からクリックで編集したい画像を呼び出します。

編集したい画像を選択中に「Copy and Overwrite」ボタンで下部のEdit Captionにキャプションが読み込まれるので、直接編集します。キャプションに足りていないタグがあれば追加します。

編集が終われば「Apply changes to selected image」ボタンで上書きします。※このEdit Captionが空白の時にこのボタンを押すと、選択した画像のキャプションが消えてしまうので注意しましょう。

このページで各画像のキャプションタグが確認できます。「Caption of Selected Image」の右側にトークン数が表示されているので確認しましょう。これは、Kohya ss GUIの設定時に「Max Token Length」の項目で75 / 150 / 225から選択する必要がある為です。すべての学習画像の最大トークン数を確認しておきましょう。225トークン以上の場合は225トークン以降のタグは読み込まれないので注意しましょう。

タグの確認

タグを確認する場合はUIの右側のページタブより「Filter by Tags」を開き、Filter Images by Tagsからタグを選択します。UIの左側に選択したタグが使われている画像の確認ができます。

編集したキャプションの保存

キャプションの編集が完了したら「Save all changes」ボタンで既存のファイルを上書きします。デフォルトでは、Buckup original textが有効になっているので、元のファイルは.000と言う拡張子で保存されています。（バックアップファイルがすでに存在する場合は拡張子が.001の様に繰り上がっていきます。）バックアップファイルを読み込みたい場合はCaption File Extに希望するバックアップの拡張子を入力します。例：.000

Supported by

キャプションタグについて

キャプションタグは、LoRA学習の中で非常に重要な要素の1つです。

学習させたい特徴を正確に反映するタグ群を設定しましょう。とくにキャラクターを学習させたい場合は、背景のタグを簡潔にするのが望ましいです。

また、LoRA適用時に調整したいタグを明記しておくことも重要になります。

例では、animal earを学習すればLoRA適用時にanimal earタグを指定することで耳が生成されます。しかし、キャプションにanimal earを含めずに学習すると、代表するインスタンスタグのdcai-girl等に影響を受けやすくなり、耳を生成したくない場合にdcai-girlのタグがあると影響されて耳が生成されてしまう場合があります。

また、animal earタグと関連付けられていない画像（例：ウサギ耳）などはプロンプトに記述しない限り生成される可能性は低くなります。

以上のことを考えながらタグを編集してみましょう。

タグ編集時の不要なタグの選び方

不要なタグを選出するのは、慣れるまで何が不要か分からないと思うので今回の例をつかって不要タグの選び方を説明します。

まずはキャプションに使われたタグ一覧を見てみましょう。

この中から以下のタグが不要となりました。

では、選択されたタグがなぜ不要なのかを見ていきましょう。

:d / ;\)：顔文字は使わない為。
alternate costume：代替え衣装のタグの為。
black bow / bow：首のアクセサリーのリボン。black bowtie / bowtieにまとめたい為。
brown hair / red hair：orange hairにまとめたい為。
capelet：ケープレットは着ていない為。
corset：コルセットはdressにまとめたい為。
erune：恐らくグラブルのエルーン族のタグなので、残しておくとエルーン族の影響が出る可能性がある為。
frilled skirt / frills：フリルスカートは変更する予定がなく、skirtにまとめる為。
high heel boots / high heels：ハイヒールは履いてない為。
horse ears / horse girl：恐らくウマ娘のタグなので残しておくとウマ娘の影響が出る可能性がある為。
virtual youtuber：アニメ調の3DCGの画像によく付くタグなので残しておいても良いのですが、キャプションを簡素にする為。
white background：誤検出。白背景は使っていない為。

これらのタグを一括で削除したいのですが、brown hairなど他のタグにまとめたい場合は、まとめたいタグ（orange hair）に書き換えてから、「Remove duplicate tags」で削除します。こうすることで、髪色が記入されていないキャプションになることを防いでいます。

キャプションの品質を上げる

不要なキャプションが削除できたら次は抜けているタグを追加していきましょう。

キャプションから抜けているタグがあるので画像を見ながら抜けているタグを追加します。

たとえば、animal earsが入っていないキャプションがあります。この様な場合は「Search and Replace」を使って編集します。

「Batch Edit Captions」ページの「Search and Replace」を開き、Search Textにanimal earsに関係していて、正しくすべてにキャプションされているshort hair,と入力し、Replace Textにshort hair, animal earsと入力します。

Search and Replace inをEntire Captionに選択してから、「Search and Replace」ボタンで書き換えを実行します。これでanimal earsが正しくキャプションに挿入されました。また、背景キャプションがblack backgroundになっているので、汎用性を高める為にgray backgroundに書き換えましょう。

その他に下記のタグが抜けていたので「Edit Caption of Selected Image」を使って直接追加していきましょう。

thigh strap,
white thighhighs,
belt,

続いて衣装のdressとskirtを後ほど色を変えられるようにblue dressまたはblack skirtを追加します。追加方法は「Edit Caption of Selected Image」で抜けているdress,、skirt,を手動で入力して、「Search and Replace」でdressとskirtをanimal earsの例と同じ様に書き換えましょう。

手動でキャプション100枚分を編集するのは大変なので前半の50ファイルを編集し、完成後1～50のtxtファイルを仮のフォルダーにコピーします。ファイル名を51～100に書き換え後、元のフォルダーに戻して既存のファイルを上書きします。

おまけ：ファイル名の一括変換方法（Windows）

データセットを制作している時にファイル名を一括で変更したい場合があります。一番簡単な方法はファイルエクスプローラーで変更したいファイルをすべて選択して、F2ボタンで名前を変更すればname (1) name (2)...と変更できますが、この方法では番号が1からしか付けられません。そこで紹介する強力なツール「Microsoft PowerRename」を使えば細かくファイル名を設定できます。

PowerRename ユーティリティ · Microsoft Learn

https://learn.microsoft.com/ja-jp/windows/powertoys/powerrename

🔗外部リンク

PowerRenameのインストール方法

PowerRenameは「Microsoft PowerToys」の機能の1つなので、下記のマイクロソフトストアリンクよりインストールします。

Microsoft PowerToys · Microsoft Store

https://apps.microsoft.com/detail/xp89dcgq3k6vld?hl=ja-jp&gl=JP

🔗外部リンク

PowerRenameの使い方

使い方はシンプルです。変更したいファイルすべてを選択した状態で右クリックメニューを出します。

「PowerRenameで名前を変更」をクリックすると、PowerRenameが起動します。

このアプリは検索対象欄に入力した文字を置換え欄の文字と差し替えることができます。

たとえば正規表現を使用にチェックをいれて、検索欄に下記の様に入力します。

(.*).png

これで「.png」の拡張子のファイル名すべてを対象にした変更の準備ができました。

次に、置き換え候補欄に下記の様に入力します。※.pngも置換え対象なので拡張子の入力を忘れないように注意しましょう。

dcai-train_${increment=1,padding=8,start=51}.png

これでUIの右にあるプレビューに「dcai-train_00000001.png」から「dcai-train_00000051.png」に変更されているのが確認できます。問題が無ければ「適用」ボタンで置換えが実行されます。※間違えて適用した場合は、ファイルエクスプローラーに戻り、Ctrl + zで取消しましょう。

置き換えの変数パターンについて少し説明します。

${}：0から始まるシンプルなカウンター。
${increment=X}：Xの数づつ繰り上がるカウンター。
${padding=X}：数がX桁に指定されたカウンター。
${start=X}：初期値のXから始まるカウンター

上記のパターンを組み合わせて${increment=1,padding=8,start=51}と記入し、変数が51から始まり1ずつ繰り上がる8桁の数字に置き換えられます。さらに細かく設定したい場合は公式ドキュメントを読んでみましょう。

PowerRename ユーティリティ · Microsoft Learn

https://learn.microsoft.com/ja-jp/windows/powertoys/powerrename

🔗外部リンク

まとめ

今回はVRoid Studioを使って、学習元画像を制作するプロセスを紹介しました。データセットを手間と時間をかけて作成するのは上質なLoRA学習には欠かせません。紹介したComfyUIのワークフローを使えば元のイラストスタイルを変更できるので3DCGのCG感を取り除きたい時に重宝するでしょう。作成したデータセットはPatreonで有料公開しています。次回は、このデータセットを使ってSD1.5モデルのLoRAを制作する記事になりますので。ご自身でオリジナルのデータセットを作っておくか、データセットをダウンロードしておきましょう。

ワコムペンタブ One by Wacom Medium Chromebook 対応ペン入力専用モデル Mサイズ板タブ CTL-672/K0-C ワコム直営店限定モデル

Amazonで見る

🔗Amazonリンク

XPPen ペンタブレット Decoシリーズ板タブスマホ対応絵描きペイントソフト付きイラストコンテスト記念版 Deco01V2 Android

Amazonで見る

🔗Amazonリンク

カテゴリー：📂 AIイラスト上級

タグ：🏷️ AUTOMATIC1111 🏷️ ComfyUI 🏷️ image2image 🏷️ LoRA

Supported by