GeForce GTX 1050 Ti で Stable Diffusion web UI

※当サイトでは広告を掲載しています

アイキャッチ[Stable Diffusion]

先日使い始めたStable Diffusion web UIですが、やはりNVIDIA GeForce GTX 1050 Ti 4GBでは画像1枚生成するのに時間がかかります。

512x512サイズの画像そのままの状態で、平均すると33秒前後くらい。1024x1024にアップスケールすると、そこにプラスして3分~3分30秒の間くらい。

さて、この画像サイズを変化させていくと、GTX1050Tiではどこまで生成できるのか。参考までに試してみました。

今回試した環境

OSWindows 11 Pro 22H2
CPUIntel Core i5-11400
RAM32GB(DDR4-3200 16GBx2)
SSDSamsung SSD 980 Pro 500GB(システム用)
HDDWesternDigital WD40EFRX 4TB(データ用)
GPUNVIDIA GeForce GTX 1050 Ti 4GB

Stable Diffusionの設定

CheckpointdarkSushi25D25D_v40
SamplingMethod:DDIM、Steps:25
Hires. fixLatent (nearest-exact)、Upscale:2、Steps:25、Denoising:0.6
CFG7

画像を生成してみる

以下のサイズで20回ずつ画像を生成して、最低値と最高値を除いた18回分の平均を出してみました。

512x512(1:1)31秒+Upscale:2分52秒計3分23秒
600x450(4:3)32秒+Upscale:3分02秒計3分34秒
640x360(16:9)30秒+Upscale:2分24秒計2分54秒
640x400(16:10)31秒+Upscale:2分49秒計3分20秒
640x480(4:3)39秒+Upscale:3分44秒計4分23秒
620x465(4:3)37秒+Upscale:3分21秒計3分58秒

640x480は、アップスケールの進捗率80%あたりで、およそ2~3割くらいの割合でメモリ不足エラーが発生します。起動時のパラメータを --medvram から --lowvram にしてもダメで、--xformers は有っても無くても変化なし。--always-batch-cond-uncond もつけてみたけど状況は改善せず。

ちなみに、各画像サイズのピクセル数を計算してみると…。

512x512:262,144ピクセル → 1,048,576ピクセル
600x450:270,000ピクセル → 1,080,000ピクセル
640x360:230,400ピクセル → 921,600ピクセル
640x400:256,000ピクセル → 1,024,000ピクセル
640x480:307,200ピクセル → 1,228,800ピクセル
620x465:288,300ピクセル → 1,153,200ピクセル

なんとなく、ざっくりと考えて、GTX1050Tiではアップスケール後のピクセル数110万~120万あたりにメモリ容量の限界点があるのか…も?

さいごに

ということで、アップスケールでの倍率を2倍に固定した状態で作成できる最大解像度を探してみたところ、GeForce GTX 1050 Tiでは元画像のピクセル数で約28万以内に抑えれば大丈夫そうだ、ということが分かりました。

もちろん、モデルデータ(checkpoint)によっても多少の変動はあると思いますが、

…と、ここまでいろいろ調べておきながら、実は新しいグラボ「GeForce RTX 3050」を購入してしまいました。本当は、今どき定番のRTX 3060にしたかったのですが、残念ながら今の電源では容量が足りないので、ひとつ下のグレードで。

この記事を書いている時点では、まだRTX 3050に差し替えていないので、この後さっそく交換してみたいと思います。どれくらい速くなるんだろう…わくわく。

初稿:2023年9月21日

コメント

タイトルとURLをコピーしました