Stable Diffusion XL や Flux.1 などの画像ワークフローを自前インフラで回すなら、2026 年も開発者コミュニティの定番は ComfyUI です。ノードグラフをバージョン管理でき、カスタムノードのエコシステムも成熟しており、同一の GPU VPS 上でキューと API ラッパーを載せられます。本稿は comfyui hosting・stable diffusion vps・cheap gpu vps の検索意図向けに、GPU ホストが Midjourney/Replicate 等の按枚 API に勝つか、VRAM 選定、貼り付け可能な CUDA/Docker デプロイと受け入れ、GPU 月額と API 請求の対照をまとめます(vpszap の架空価格表は使いません。変数で埋める式だけ提示します)。
誰が GPU VPS で ComfyUI を回すべきか(素材の私有化、バッチ出画、自動化 vs 枚課金 API)
ComfyUI GPU サーバー のセルフホストが向くのは次のときです。(1) ブランド素材・人物参考・EC SKU 画像を境界外に出せない—プライベート出画と監査が必要;(2) 日次のポスター・バナー・A/B 画像セットなどバッチ自動化が主でキュー待ちは許容;(3) ControlNet・IP-Adapter・LoRA スタックを固定し、上流 API のサイレントなモデル差し替えを避けたい;(4) n8n や自社パイプラインが ComfyUI API を HTTP で叩き、月間枚数で按枚 API の請求が線形に増える。
Midjourney/Replicate/商用 API が勝つのは、月間枚数が数百枚未満、GPU ドライバとモデルライブラリを維持する人がいない、最新のクローズド審美モデルが必須のときです。境界条件:SD 1.5 の小解像度だけなら 12GB でも試せますが、Flux 全精度と複数 ControlNet はすぐ VRAM を食います—本稿は ComfyUI + NVIDIA GPU の画像ワークフローを主線とし、WordPress 型の GPU なし Linux VPS 入門ではありません。脚注:同機でプロンプト拡張に Ollama を載せる場合は 廉価 GPU VPS で Ollama を回す VRAM とコスト対照 を参照し、本文と混同しないでください。
VRAM とモデル対照表(SDXL、Flux、ControlNet、IP-Adapter の増分)
画像生成の VRAM 圧力は UNet/DiT の精度 + テキストエンコーダ + 解像度 + batch + 重ね合わせノード から来ます。下表は 2026 年コミュニティ常用ティア(単一 GPU、1024×1024 付近、batch=1)の経験レンジです。実測は nvidia-smi のピークで確認してください。Flux は SDXL よりパラメータが大きく、「SD 時代 8GB で足りる」は当てはまりません。
| ワークロード | 精度/形態 | 推奨 VRAM(単路) | 典型クラウド SKU | VRAM 不足時 |
|---|---|---|---|---|
| SDXL Base | FP16 | ≈ 8–10 GB | RTX 3060 12G、L4;4090 は余裕 | 解像度低下;SDXL Turbo;steps 削減 |
| SDXL + ControlNet | 単 CN | +3–5 GB | ≥ 16 GB 推奨 | 余分な CN を切る;並列ロードではなく直列 |
| Flux.1 Schnell | FP8/量子化 | ≈ 12–16 GB | RTX 4090 24G | GGUF/NF4;解像度低下 |
| Flux.1 Dev | FP16 | ≈ 22–24 GB+ | RTX 4090 24G(上限)、A100 40G | Schnell へ;FP8 T5;CPU offload |
| Flux Dev + IP-Adapter | 参考画像 | ≈ 24 GB+ | 4090/A100 | 参考画像縮小;軽量 adapter |
| 高並行キュー(2+ ジョブ) | — | ピーク +20–40% | A100、マルチ GPU 分割 | 単キュー直列;水平スケール |
RTX 4090 級の ComfyUI GPU VPS は多くのチームのスイートスポット:24GB で SDXL フルスタックと軽量 Flux(FP8/量子化)が快適。A100 級 Cloud GPU は Flux Dev 全精度、複数 ControlNet、日 200+ 枚の並列出画向け。降格順序:解像度 → steps → Schnell/SDXL → 量子化ウェイト → 重ね合わせノード停止 → キュー分割。
Docker と裸機:ComfyUI の 2 つのインストール経路
経路 A:裸機 Linux + NVIDIA ドライバ
- GPU 付きインスタンスを開通。ディスクは ≥ 200GB 推奨(checkpoints + LoRA は急増)。
- 受け入れ:
nvidia-smiで GPU 名・ドライバ・VRAM 総量を確認。 git clone https://github.com/comfyanonymous/ComfyUI.git && cd ComfyUI- venv + 依存:
pip install -r requirements.txt(リポジトリ記載に従う)。 - SDXL/Flux ウェイトを
models/checkpoints、VAE をmodels/vae、LoRA をmodels/lorasへ配置。 - 起動(社内ネットワークでのデバッグのみ):
python main.py --listen 0.0.0.0 --port 8188;本番は反代・TLS・認証必須。8188 を無防備に公開しない。 - カスタムノード:
cd custom_nodes && git clone <repo>、再起動後 import エラーをログで確認。
経路 B:Docker + NVIDIA Container Toolkit
nvidia-container-toolkitを導入しnvidia-ctk runtime configure --runtime=docker。- 例(イメージ名は採用 Dockerfile に合わせる):
docker run -d --gpus=all -p 8188:8188 -v /data/comfyui/models:/app/models -v /data/comfyui/output:/app/output --name comfyui <image> curl http://127.0.0.1:8188/system_statsで GPU 認識を確認。- ログ:
docker logs -f comfyui;OOM 時は VRAM ピークを先に確認。
ボリュームマウントと「プロセスは上がるが WebUI が 502」の層別排错は、OpenClaw Docker Compose デプロイのトラブルシュート の考え方を Linux GPU 上の ComfyUI に適用できます。
性能とコスト:秒/枚ベンチと按枚 API の損益分岐
簡易ベンチ(固定 prompt/解像度)
# 1) VRAM ベースライン
nvidia-smi --query-gpu=memory.used,utilization.gpu --format=csv -l 1
# 2) ComfyUI で同一 JSON ワークフローを 3 回連続、wall time(秒/枚)を記録
# 例:SDXL 1024×1024 steps=25;Flux Schnell steps=4(ノード定義に従う)
# 3) API 層(キュー封装済みの場合)
curl -s -X POST http://127.0.0.1:8188/prompt -H "Content-Type: application/json" \
-d '{"prompt":{...}}' # エクスポート JSON に合わせる
意思決定表に書く 3 点:コールドスタートの初枚時間、定常秒/枚、並行=2 で OOM するか。世界最速を主張する必要はなく、同一マシン内の再現比較が重要です。
月額コスト枠組み(単価は自社で代入)
G = GPU 月額(または $/GPU-hour × 730)、E = 電力・ストレージ雑費、S = 大容量ディスク(モデル庫)の按分。按枚 API 月額 ≈ N × C。N は月間出画枚数、C は $/枚(Midjourney サブスク、Replicate の秒/step 換算を枚あたりに直す)。
損益分岐(粗算):G + E + S < N × C かつ GPU 利用率がアイドル時間を賄えるなら Stable Diffusion クラウド GPU のセルフホストが有利;そうでなければ API、またはハイブリッド(探索は API、量産は ComfyUI)。
| シナリオ | 月間枚数(例) | 傾向 | メモ |
|---|---|---|---|
| 個人クリエイター | < 300 枚 | サブスク API または短期 GPU 試用 | 固定月額がアイドルしやすい |
| 小チーム・日 200 枚 | ≈ 6,000 枚/月 | 4090 1 台 + ComfyUI キューが有利になりやすい | 夜間バッチで稼働率を上げる |
| EC ポスター・パイプライン | 1 万+ 枚 | 水平スケール + オブジェクトストレージ | CDN と S を忘れずに |
| Flux Dev 全精度 + 多 CN | 中高 | A100 級 + 厳格な直列キュー | OOM と手動排障が同時に増える |
プレースホルダ(自社見積に置換):G = $300/月、N = 2,000 枚、API 換算 C ≈ $0.05/枚 なら API ≈ $100—現金だけなら API が安いが、素材の境内留めとワークフロー版固定は含まない。N = 8,000 枚 なら API ≈ $400 で gpu server for ai art のセルフホストが競合し始める—ドライバ・モデル庫・セキュリティグループの運用前提で。$/千枚:(G+E+S) / (N/1000) を API 見積と並べれば決策マトリクスができます。
本番強化:キュー、ディスク水位、systemd、再試行とログ
- キュー:外向きは単一入口、内部は直列または並行 1–2 に制限。大モデルを同時ロードして OOM しない。
- ディスク水位:
models/とoutput/の空き < 15% でアラート;Flux + SDXL の二重スタックは数百 GB になり得る。 - systemd:
Restart=on-failure;ComfyUI 更新前にcustom_nodesとワークフロー JSON をバックアップ。 - ログ:モデル名・解像度・steps・ノード版を記録;OOM は最後にロードした checkpoint と照合。
- 認証:反代で Basic Auth/OAuth;8188 を 0.0.0.0 無防備公開しない(ポートスキャンが多い)。
- 再試行:API 層はタイムアウトで 503 を返し再キュー。UI スレッドで無限待ちしない。
よくあるエラー対照表(CUDA、OOM、カスタムノード、モデルパス)
| 症状 | 想定原因 | 修正順 |
|---|---|---|
nvidia-smi に GPU なし | ドライバ未導入、GPU 未アタッチ | コンソールで GPU SKU 確認 → ドライバ再インストール → チケット |
| ComfyUI が CPU 表示 | PyTorch CUDA ビルド不一致、コンテナに GPU なし | GPU 版 torch 再インストール;--gpus=all 確認 |
| CUDA out of memory | Flux FP16、複数 CN、解像度過大 | 解像度 → 量子化 → CN 停止 → SDXL へ |
| Checkpoint not found | パス・ファイル名の大小文字 | models/checkpoints を合わせる;モデル一覧を更新 |
| カスタムノード import 失敗 | ComfyUI 版と非互換 | ディレクトリを逐次無効化;GitHub issue を確認 |
| 生成は遅いが GPU 0% | CPU 経路、VAE が CPU | system_stats;ウェイトが GPU に載っているか |
| インターネット公開 WebUI 悪用 | 8188 無認証公開 | SG 許可リスト + 反代認証 |
廉価 GPU VPS を無理に選ばないとき(境界条件)
- 月間枚数が少なく Linux を維持する人がいない—按枚 API で時間を買う。
- Flux Dev FP16 + 複数 ControlNet を並列—4090 1 枚では不足;最安 VPS に無理に載せない。
- 共有 vGPU で広告 VRAM と
nvidia-smiが不一致—受け入れ失敗なら SKU 変更。 - 閉源カスタムノードのライセンス不明—コンプライアンスと API 代替を併せて評価。
FAQ
- ComfyUI と Automatic1111 WebUI? ComfyUI は再現性と API 化に強い;WebUI は対話的試行向け。ホスティングでは ComfyUI が多い。
- rtx 4090 vps で Flux は? 量子化/Schnell なら多くは可;Dev FP16 は 24GB をフルに使い重ね合わせノードを抑える。
- gpu server for ai art の最低 VRAM? SDXL は実効 ≥ 12GB;Flux 本番は 24GB から。高並行は A100 を検討。
- AI 画像生成ホスティングの受け入れ?
nvidia-smi、固定ワークフローの秒/枚、キュー並行 OOM テストの 3 点を本番前に。 - cloud gpu と cheap gpu vps? 前者は GPU-hour 型、後者は月額単卡が多い。7×24 常駐か夜間バッチかで選ぶ。
内部リンク
GPU スタックの共通受け入れと LLM 側の按 Token 対照は 2026 廉価 GPU VPS で Ollama を回す記事;コンテナオーケストレーションのトラブルシュートは OpenClaw Docker Compose デプロイとトラブルシュート を参照。
解像度と日次出画量に合わせて vpszap GPU を選び、ComfyUI 受け入れ後に拡張
vpszap は AI Developer Infrastructure Platform(従来の GPU なし共有ホスティングではありません)。目標解像度・batch・Flux 全精度の要否で GPU VPS / Cloud GPU を選べます—RTX 4090 ティアは SDXL と軽量 Flux、更大 VRAM や高並行 ControlNet は A100 ティア。多リージョンでは ComfyUI WebUI/API をデザイナーまたは自動化パイプラインに近づけ、アップロードとポーリング遅延を下げます。開通後は本稿の nvidia-smi・固定ワークフロー秒/枚・キューテストを通してから並列インスタンスへ。料金とプラン、設定して注文、vpszap ホーム(GPU VPS/AI 画像生成ホスティング)。