Core ML Stable DiffusionでStableDiffusionモデルがどの程度対応しているか確認してみました。
実行環境はM1 Mac mini 16GB RAMです。
–model-version | 実行可否 | デフォルト 解像度 | 備考 |
CompVis/stable-diffusion-v1-4 | 可 | 512×512 | |
unwayml/stable-diffusion-v1-5 | 可 | 512×512 | |
stabilityai/stable-diffusion-2-base | 可 | 512×512 | [Espresso::overflow_error]とログが出る 画像生成自体は可能 |
stabilityai/stable-diffusion-2-1-base | 可 | 512×512 | [Espresso::overflow_error]とログが出る 画像生成自体は可能 |
stabilityai/stable-diffusion-2-1 | 不可 | 768×768 |
つい先日2.1の学習済みモデルが出ていたので2.1まで確認しました。
2.x系モデルは通常のものがデフォルト解像度 768×768となっており、
baseが1.x系と同じデフォルト解像度 512×512です。
StableDiffusion以外のものも1つ試したのですが、
必要なファイルがあればデフォルト解像度 512×512であれば大丈夫そうでした。
FAQにはマルチ解像度対応には変換時に対応が必要な事と、一部ファイルが解像度依存と書いてあるので、その辺りが関係してそうな印象を受けます。
コメント
[…] 【Swift】Core ML Stable DiffusionのStableDiffusionモデルの対応状況Core ML Stable Diffusio… […]