stable-diffusion-webui を試す

Stable diffustion は素晴らしいですが、基本的には CLI で指示を出します。

コマンドを入力して、画像を作成する。
Server で動かしていると、作成された画像を確認するために、いちいち FTP やら SCP などをするハメになるわけで、面倒くさいです。

とりあえず python flask で、Prompt → 画像表示までの UI を自作したのですが、
2022年ともなれば、
「だれか便利なUI作って公開していないかしら？」と、考え出すわけです。

ありました。

https://github.com/hlky/stable-diffusion-webui/

なにやらすごそうなので、とにかく動かしてみます。

つまづきどころ

k-diffusion のインストール

特に指示が無いのですが、k-diffusion が必要です。
インストールしましょう。

webui.py の設置場所

Windows向けの bat ファイルを見ながら Ubuntu での配置を想定するのですが、 webui.py は、プロジェクトのルートに配置します。

load_RealESRGAN の引数

device = と指定がありますが、そのような引数は渡せません。

# instance = RealESRGANer(scale=2, model_path=model_path, model=RealESRGAN_models[model_name], pre_pad=0, half=not opt.no_half, device=torch.device(f'cuda:{opt.gpu}'))
instance = RealESRGANer(scale=2, model_path=model_path, model=RealESRGAN_models[model_name], pre_pad=0, half=not opt.no_half )

動きました。