loog

stable-diffusion を実装してみた

August 24, 2022

Midjourney に引き続き、話題の stable-diffusion を実装してみました。

stable-diffusion

https://github.com/CompVis/stable-diffusion

Midjouney は Discord のサービスとして提供されていますが、stable-diffusion はオープンソースソフトウェアとして提供されており、学習済みモデルも公開されています。

学習済みモデル

https://huggingface.co/

実装方法

公式 Github の readme の通りにやればできます。

ただし、私のマシンでは、n_samples を下げないと、GPUが out of memory 起こしてしまいました。

使ってみた

The mount fuji by hokusai

cyberpunk butterfly flying high above the mount fuji by hokusai

解像度

GPUメモリーのサイズによって、作成できる画像のサイズにも制限が生まれます。

Out of memory なっちゃいます。

ポルノ対策

生成された画像に対して、有害画像かどうかの判定をする処理が組み込まれています。

簡単にスキップできるのが考えものですが、ある意味なくても良い機能をきちんと実装して配布しているのは素晴らしいと思います。

ライセンス

CreativeML Open RAIL-M license. となっています。

https://huggingface.co/spaces/CompVis/stable-diffusion-license