Stable diffustion は素晴らしいですが、基本的には CLI で指示を出します。
コマンドを入力して、画像を作成する。
Server で動かしていると、作成された画像を確認するために、いちいち FTP やら SCP などをするハメになるわけで、面倒くさいです。
とりあえず python flask で、Prompt → 画像表示までの UI を自作したのですが、
2022年ともなれば、
「だれか便利なUI作って公開していないかしら?」と、考え出すわけです。
ありました。
https://github.com/hlky/stable-diffusion-webui/
なにやらすごそうなので、とにかく動かしてみます。
つまづきどころ
k-diffusion のインストール
特に指示が無いのですが、k-diffusion が必要です。
インストールしましょう。
webui.py の設置場所
Windows向けの bat ファイルを見ながら Ubuntu での配置を想定するのですが、 webui.py は、プロジェクトのルートに配置します。
load_RealESRGAN の引数
device = と指定がありますが、そのような引数は渡せません。
# instance = RealESRGANer(scale=2, model_path=model_path, model=RealESRGAN_models[model_name], pre_pad=0, half=not opt.no_half, device=torch.device(f'cuda:{opt.gpu}'))
instance = RealESRGANer(scale=2, model_path=model_path, model=RealESRGAN_models[model_name], pre_pad=0, half=not opt.no_half )
動きました。