先日使い始めたStable Diffusion web UIですが、やはりNVIDIA GeForce GTX 1050 Ti 4GBでは画像1枚生成するのに時間がかかります。
512x512サイズの画像そのままの状態で、平均すると33秒前後くらい。1024x1024にアップスケールすると、そこにプラスして3分~3分30秒の間くらい。
さて、この画像サイズを変化させていくと、GTX1050Tiではどこまで生成できるのか。参考までに試してみました。
今回試した環境
OS | Windows 11 Pro 22H2 |
---|---|
CPU | Intel Core i5-11400 |
RAM | 32GB(DDR4-3200 16GBx2) |
SSD | Samsung SSD 980 Pro 500GB(システム用) |
HDD | WesternDigital WD40EFRX 4TB(データ用) |
GPU | NVIDIA GeForce GTX 1050 Ti 4GB |
Stable Diffusionの設定
Checkpoint | darkSushi25D25D_v40 |
---|---|
Sampling | Method:DDIM、Steps:25 |
Hires. fix | Latent (nearest-exact)、Upscale:2、Steps:25、Denoising:0.6 |
CFG | 7 |
画像を生成してみる
以下のサイズで20回ずつ画像を生成して、最低値と最高値を除いた18回分の平均を出してみました。
512x512(1:1) | 31秒+Upscale:2分52秒 | 計3分23秒 |
600x450(4:3) | 32秒+Upscale:3分02秒 | 計3分34秒 |
640x360(16:9) | 30秒+Upscale:2分24秒 | 計2分54秒 |
640x400(16:10) | 31秒+Upscale:2分49秒 | 計3分20秒 |
640x480(4:3) | 39秒+Upscale:3分44秒 | 計4分23秒 |
620x465(4:3) | 37秒+Upscale:3分21秒 | 計3分58秒 |
640x480は、アップスケールの進捗率80%あたりで、およそ2~3割くらいの割合でメモリ不足エラーが発生します。起動時のパラメータを --medvram から --lowvram にしてもダメで、--xformers は有っても無くても変化なし。--always-batch-cond-uncond もつけてみたけど状況は改善せず。
ちなみに、各画像サイズのピクセル数を計算してみると…。
512x512:262,144ピクセル → 1,048,576ピクセル
600x450:270,000ピクセル → 1,080,000ピクセル
640x360:230,400ピクセル → 921,600ピクセル
640x400:256,000ピクセル → 1,024,000ピクセル
640x480:307,200ピクセル → 1,228,800ピクセル
620x465:288,300ピクセル → 1,153,200ピクセル
なんとなく、ざっくりと考えて、GTX1050Tiではアップスケール後のピクセル数110万~120万あたりにメモリ容量の限界点があるのか…も?
さいごに
ということで、アップスケールでの倍率を2倍に固定した状態で作成できる最大解像度を探してみたところ、GeForce GTX 1050 Tiでは元画像のピクセル数で約28万以内に抑えれば大丈夫そうだ、ということが分かりました。
もちろん、モデルデータ(checkpoint)によっても多少の変動はあると思いますが、
…と、ここまでいろいろ調べておきながら、実は新しいグラボ「GeForce RTX 3050」を購入してしまいました。本当は、今どき定番のRTX 3060にしたかったのですが、残念ながら今の電源では容量が足りないので、ひとつ下のグレードで。
この記事を書いている時点では、まだRTX 3050に差し替えていないので、この後さっそく交換してみたいと思います。どれくらい速くなるんだろう…わくわく。
コメント