【Swift】Core ML Stable DiffusionのStableDiffusionモデルの対応状況

Core ML Stable DiffusionでStableDiffusionモデルがどの程度対応しているか確認してみました。

実行環境はM1 Mac mini 16GB RAMです。

–model-version実行可否デフォルト
解像度
備考
CompVis/stable-diffusion-v1-4512×512
unwayml/stable-diffusion-v1-5512×512
stabilityai/stable-diffusion-2-base512×512[Espresso::overflow_error]とログが出る
画像生成自体は可能
stabilityai/stable-diffusion-2-1-base512×512[Espresso::overflow_error]とログが出る
画像生成自体は可能
stabilityai/stable-diffusion-2-1不可768×768

つい先日2.1の学習済みモデルが出ていたので2.1まで確認しました。

2.x系モデルは通常のものがデフォルト解像度 768×768となっており、
baseが1.x系と同じデフォルト解像度 512×512です。

StableDiffusion以外のものも1つ試したのですが、
必要なファイルがあればデフォルト解像度 512×512であれば大丈夫そうでした。

FAQにはマルチ解像度対応には変換時に対応が必要な事と、一部ファイルが解像度依存と書いてあるので、その辺りが関係してそうな印象を受けます。

コメント

  1. […] 【Swift】Core ML Stable DiffusionのStableDiffusionモデルの対応状況Core ML Stable Diffusio… […]

タイトルとURLをコピーしました