[Stable Diffusion] プロンプトのテスト

警告

当記事にはAIによって生成された画像が多数掲載されています。


なんとなく参考サイトのものを使っていたけど、自分で検証してみようと思う
チェックポイントは 7th anime v3 B、Seedは 123456789 固定にする

性別:1 girl, 1 boy

追加で「high school uniform」を指定している

指定することでちゃんと性別を操作できる

ちなみに 1 femboy (男の娘) にするとこんな感じになる

人数:1 girl, 2 girls, 3 girls

こちらも High school uniform のみを追加指定

人数指定も機能する
3人指定のときはこの構図が多い気がする

4 girls にすると 3girls の背景に一人映り込む感じに

靴下系:socks, thighhighs, pantyhose

結構な確率でニーソ履かせるなと思ったのでこちらの指定をしてみる
全身が必要なので 1 girl, full body, high school uniform も追加指定

pantyhose だけ ネガティブプロンプトに nsfw を追加指定
ちゃんと変更できる

色指定

◯◯ hair で指定、1 girl のみ追加

black, white, red の順で指定

試しに yamabuki hair (山吹色、黄色っぽいやつ) を指定したら緑になった
背景からすると草、あるいは植物としての色にした、ということだろうか

色装飾:dark, light

1girl, red hair を改変する

dark, light の順で指定
過度すぎない調整が入る

bright はこんな感じ、元の赤より明るいが、lightのように白くならない

deep はこんな感じ、こちらも赤みをそのままに暗くなっている

shiny は bright と同じ感じに

他、blacky, whity とか、光らせる目的で lighting, shining, flashing などを指定したが特に効果はなかった

材質指定

1 girl, shield をベースにする

wooden

iron・・・いやシールドはどこに

iron shield に equip shiled を追加指定
以後も equie shield は継続していく

steel、ironより硬そう
ちなみに steel(スチール) は iron(鉄) を carbon(炭素) で更に精錬したもの、鉄より硬い

glass、水晶として見せることが可能か?

rusted(朽ちた)、状態ではあるが指定できそう、だがなぜそんなに大きくなった

platinum、それっぽい

他 gundanium (ガンダニウム、ガンダムの世界の材質) など架空のものを指定すると無視される

材質:衣類

癖がでにくい衣類はどこかと考えて、glove にした
1 girl, ◯◯ glove とする

leather (革)、それっぽい

rubber (ゴム)

shiny rubber (テカテカとしたゴム) にするとそれっぽい感じになる

nylon

cotton (綿)

他 work (軍手) は反映されなかった

絵のクオリティ

さて、最もなんとなく指定していたプロンプト郡
1 girl, high school uniform で指定する

best quality
構図に影響を及ぼさず、クオリティだけを変化させてくる

masterpiece (傑作)
構図が変わる

detailed (細かい)、大変なことになったので bad face をネガティブプロンプトに追加
構図が変わるのみで masterpiece とほぼ同じ?

low quality

512×512 だけど 8k portrait

4k portrait にすると構図は同じだが若干 8k より下がる?

beautiful face

beautiful eyes

プロンプトに上記までのうちlow quality、4k portrait を除いてすべて指定
ネガティブプロンプトにlow quality、4k portrait を指定
face にするとアップにされがち

解像度による差

縦長とか横長とか
プロンプトは先の全マシを使う

縦長

横長

拡張機能:Tiled Diffusion & VAE

VRAMをうまくしてくれたりする拡張機能
入れると差はあるのか
ちなみに先の生成速度は 21.1秒

スペックは Core i7-10875H、RTX 2060 (VRAM合計14GB) 、メモリ 16GB のゲーミングノートPC
メインPCでやると出力処理で PCの全能力が専有されて困ったので、
ノートPCをサーバー化している

Tiled Diffusion 生成20.9秒

Tiled VAE 生成 21.5秒

Tiled Diffusion & VAE 21.6秒

時間は短縮されなかったが、VRAM不足は解消してくれるのは確か
結果にも差は無い
VRAM不足で悩んでいる場合は導入して良いと思う

Sampling method

「解像度による差」の横長の設定を使う、これは「DPM++ 2M Karras」で出したもの

よく採用されている印象の DDIM

Heun

DPM fast、なんだかサイケになってしまった

Seed値を固定にして Sampling method を変更することである程度の調整は考えられそう

Sampling steps

なんとなく絵の詳細さを決めるんだろうなと思っているが、実際に検証する
「解像度による差」の横長の設定を使う、これは Sampling Steps 20で出したもの

Sampling Steps 10、生成12秒
絵柄も変わってくるか、肩がなんかすごい

Sampling Steps 30、生成29.4秒
20の絵柄に近づく、特にチョーカーが細かくなった

40、生成 38.2秒

50、生成 47秒
30の雰囲気に戻ったのと、もうあまり差は感じられないのと

60、56.1秒
もうわからん

150、2分14.6秒
30と並べられてもぱっと見どっちが良いかは好みになりそう

10は明らかに少ないが、51以上は過大な印象
30~50 の間が良さそう
ただ、風景画とかになるとこの検証はまた結果が変わってきそう


今回はここまで
技術屋なのでこういう検証は楽しい

今回の「割といい感じに出たやつ」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Share via
Copy link