画像生成AIの世界で、いま最も注目されているモデルの一つが「Stable Diffusion XL(SDXL)」です。従来のSD 1.5と比べて画質・構図・テキスト描画のすべてが大幅に進化し、多くのクリエイターが乗り換えを進めています。
一方で、VRAMの要求が高くなったことで「自分のPCで動くのか」と不安に感じる方も少なくありません。また、SD1.5用のLoRAやモデルが使えないなど、移行にあたって押さえておくべきポイントもあります。
この記事では、SDXLの基本的な特徴から導入手順、使いこなすためのコツ、後継モデルFluxとの比較まで、これからSDXLを始める方に必要な情報をまとめて解説します。
🤖 ナビ助のおすすめ!
Stable Diffusion XL(SDXL)とは
SDXLは、Stability AIが2023年にリリースした画像生成AIモデルです。正式名称は「Stable Diffusion XL 1.0」で、従来のStable Diffusion 1.5(SD1.5)やSD 2.1の後継にあたります。
SDXLの特徴
- デフォルト解像度が1024×1024(SD1.5は512×512)
- 2段階生成(Baseモデル+Refinerモデル)による高品質な出力
- テキスト描画が可能(看板やロゴの文字も生成できる)
- プロンプトの理解力が向上(複雑な指示にも対応)
- パラメータ数が約35億(SD1.5は約8.6億)
パラメータ数がSD1.5の約4倍に増えたことで、画像の精細さや構図の正確性が飛躍的に向上しています。

SDXLとSD1.5の違い|比較表
SDXLとSD1.5の具体的な違いを比較表にまとめました。乗り換えを検討する際の参考にしてください。
| 比較項目 | SD 1.5 | SDXL 1.0 |
|---|---|---|
| デフォルト解像度 | 512×512 | 1024×1024 |
| パラメータ数 | 約8.6億 | 約35億 |
| 必要VRAM | 4GB〜 | 8GB〜(推奨12GB) |
| 生成速度(1枚) | 数秒〜十数秒 | 十数秒〜数十秒 |
| テキスト描画 | 苦手 | ある程度対応 |
| 構図の正確性 | やや不安定 | 大幅に改善 |
| 手・指の描画 | よく崩れる | 改善(完璧ではない) |
| 対応LoRA・モデル | 非常に豊富 | 増加中(SD1.5には及ばない) |
| Refiner | なし | あり(ディテール向上) |
最大の注意点は、SD1.5用のLoRAやモデルはSDXLでは使えないという点です。アーキテクチャが異なるため互換性がなく、SDXL専用のリソースを用意する必要があります。
SDXLの使い方|3つの方法
方法1:AUTOMATIC1111(WebUI)で使う
最も定番の方法です。すでにSD1.5で使い慣れている方であれば、モデルを差し替えるだけで移行できます。
- SDXLのモデルファイル(.safetensors)をHugging Faceからダウンロード
models/Stable-diffusionフォルダに配置- WebUIを起動して、左上のCheckpointドロップダウンからSDXLを選択
- 解像度を1024×1024に設定して生成
SDXLはVRAM 8GB以上を推奨します。6GBでも動く場合がありますが、生成速度がかなり遅くなります。
方法2:ComfyUIで使う
ノードベースのUIで、SDXLのBase+Refinerパイプラインを視覚的に組めるのが魅力です。ワークフローのカスタマイズ性が高いため、本格的に使い込むならComfyUIがおすすめです。ComfyUI公式GitHubからインストールできます。
- ComfyUIをインストール
- SDXLのBaseモデルとRefinerモデルを配置
- デフォルトのSDXLワークフローを読み込み
- プロンプトを入力して生成
方法3:クラウドサービスで使う
高性能GPUを持っていない場合は、クラウドサービスが有力な選択肢になります。
- Stability AIの公式API:従量課金で利用可能
- Google Colab:無料枠でも動作(ただし制限あり)
- Civitai:ブラウザ上でSDXLモデルを試せる
- Leonardo AI:SDXLベースのモデルが使える
SDXLを使うときのコツ
SDXLの性能を最大限に引き出すための実践的なコツを紹介します。
コツ1:解像度は1024×1024を基本にする
SDXLは1024×1024で学習されているため、この解像度が最も安定した結果を出します。768×768以下にすると画質の劣化が目立つことがあるため、基本は1024×1024を維持しましょう。
コツ2:Refinerを活用する
Refinerモデルは、Baseモデルの出力をさらに高品質化するための仕組みです。使うかどうかで、ディテールの精細さに大きな差が生まれます。ComfyUIなら切り替えタイミング(denoise値)を細かく調整できるため、より精度の高い仕上がりが期待できます。
コツ3:ネガティブプロンプトはシンプルにする
SD1.5では大量のネガティブプロンプトが必要でしたが、SDXLはモデル自体の品質が高いため、シンプルな指定で十分です。low quality, blurry, deformed程度の記述で問題ありません。
コツ4:SDXL対応LoRAを使う
SD1.5用のLoRAはSDXLでは使えません。CivitaiなどでSDXL対応のLoRAを探してください。記事執筆時点ではかなり充実してきており、選択肢に困ることは少なくなっています。

🤖 ナビ助のおすすめ!
SDXLとFlux、どちらを選ぶべきか
記事執筆時点では、SDXLの後継的な存在としてFluxも登場しています。両者の特徴を比較してみましょう。
| 比較項目 | SDXL | Flux |
|---|---|---|
| 画質 | 高い | 非常に高い |
| 必要VRAM | 8GB〜 | 12GB〜 |
| 対応LoRA | 豊富 | 増加中 |
| コミュニティ | 成熟 | 成長中 |
| テキスト描画 | ある程度 | かなり正確 |
最新の画質を追求するならFlux、安定した環境と豊富なLoRAを活用したいならSDXLという使い分けがおすすめです。新規で始める場合は、まずSDXLで基礎を固めてからFluxへ移行するのも良い選択です。
よくある質問(FAQ)
Q1. SDXLを動かすのに必要なPCスペックは?
VRAM 8GB以上のGPUが推奨です。NVIDIA RTX 3060(12GB)以上であれば快適に使用できます。AMD GPUでも動作しますが、NVIDIA GPUの方が安定性に優れています。
Q2. SD1.5のモデルやLoRAはSDXLで使える?
使えません。SDXLとSD1.5はアーキテクチャが異なるため互換性がありません。SDXLにはSDXL専用のモデル・LoRAを使用してください。
Q3. SDXLは商用利用できる?
はい、SDXL 1.0はオープンソースで、商用利用も許可されています。ただし、生成した画像の内容が法律やプラットフォーム規約に抵触しないかは利用者の責任で判断が必要です。
Q4. Macでも使える?
M1/M2/M3チップのMacでも動作しますが、NVIDIAのGPUと比べると生成速度はかなり遅くなります。本格的に使うならWindows+NVIDIA GPUの環境がベストです。
Q5. SDXLとSD3の違いは?
SD3はSDXLの次世代モデルで、さらに画質が向上しています。ただし、ライセンス条件が異なる場合があるため、商用利用する際は必ず最新のライセンスを確認してください。

まとめ:SDXLは画像生成AIのバランス型チャンピオン
Stable Diffusion XLは、画質・安定性・カスタマイズ性のバランスが取れた優秀なモデルです。
- SD1.5からの乗り換え:画質とプロンプト理解力が大幅に向上
- 使い方:AUTOMATIC1111、ComfyUI、クラウドサービスの3パターン
- 必要スペック:VRAM 8GB以上推奨
- 向いている人:高品質な画像を安定して生成したい方
SD1.5のままで満足している方も、一度SDXLの出力を体験してみてください。生成画像のクオリティの違いを実感できるはずです。
🤖 ナビ助のおすすめ!


