为什么选ComfyUI而不是Midjourney
当大多数人还在每月花20美元订阅Midjourney时,AI绘画圈的老玩家已经悄悄转战ComfyUI了。原因很简单:ComfyUI免费、开源、可本地运行,最关键的是——它能让你真正理解AI绘画的底层逻辑,而不是把所有参数丢给一个黑盒。
我接触过的很多初学者对ComfyUI望而却步,觉得节点式界面太复杂。说实话,第一次打开ComfyUI看到满屏的节点连线,我也愣了五分钟。但只要搞懂了三个核心概念——模型加载、提示词输入、采样器输出——整个逻辑就通了。这篇文章就是帮你跳过那五分钟的迷茫期。
环境准备:Windows下的最低配置要求
ComfyUI本身非常轻量,占用不到200MB硬盘空间。真正吃资源的是模型文件。以下是我实测的配置建议:
| 硬件 | 最低要求 | 推荐配置 |
|---|---|---|
| 显卡 | NVIDIA 6GB显存(GTX 1060) | 12GB以上(RTX 3060 12G性价比之王) |
| 内存 | 8GB | 16GB |
| 硬盘 | 10GB可用空间 | 50GB以上SSD(模型加载速度差距明显) |
| Python | 3.10 | 3.10(必须用这个版本) |
注意:ComfyUI对AMD显卡的支持正在改善,但截至目前,NVIDIA依然是首选。如果你只有集成显卡,也可以跑,但生成一张图可能需要几分钟。
安装步骤:三步搞定
第一步:安装Python和Git
去Python官网下载3.10.x版本(不要装3.11或3.12,很多依赖库不兼容)。安装时勾选"Add Python to PATH"。Git安装直接下一步就行。
第二步:克隆ComfyUI
打开命令行,执行:
git clone https://github.com/comfyanonymous/ComfyUI.git cd ComfyUI pip install -r requirements.txt
如果下载速度慢,把requirements.txt里的源换成清华镜像即可。这一步等待时间取决于网络,通常3-5分钟。
第三步:下载模型并启动
去CivitAI下载一个Stable Diffusion模型(推荐"DreamShaper"或"Realistic Vision",7-8GB的safetensors格式)。把模型文件放到 ComfyUI/models/checkpoints/ 目录下。然后执行:
python main.py
浏览器打开 http://127.0.0.1:8188,看到ComfyUI界面就说明安装成功了。
理解节点工作流:三个核心节点
ComfyUI启动后默认加载一个"Text to Image"基础工作流,里面有五个节点。对初学者来说,只需要关注三个:
- Load Checkpoint:加载你下载的SD模型,所有参数都是从这里开始
- CLIP Text Encode:正面提示词和负面提示词的输入节点,分Positive和Negative两个
- KSampler:采样器,控制生成过程的核心参数
数据流向很直观:模型→提示词→采样器→图像输出。所有连线代表数据传递,粉色线是模型权重,黄色线是条件信息,蓝色线是图像数据。
生成你的第一张图:参数调优实战
在Positive提示词节点输入:
masterpiece, best quality, a cat sitting on a windowsill, sunlight, warm lighting, detailed fur, photorealistic
在Negative提示词节点输入:
low quality, blurry, deformed, watermark, text
然后在KSampler节点设置:
| 参数 | 推荐值 | 说明 |
|---|---|---|
| Steps | 20-30 | 步数太少细节不够,太多浪费时间且收益递减 |
| CFG Scale | 7 | 提示词引导强度,7是万能起点 |
| Sampler | euler_ancestral | 最适合新手的采样器,画面变化丰富 |
| Denoise | 1.0 | 从纯噪声开始生成时保持1.0 |
| 尺寸 | 512x768 | 竖构图适合人物和场景,512x512适合练习 |
点击"Queue Prompt"按钮,等待10-30秒(取决于你的显卡),第一张图就出来了。
新手最常踩的五个坑
基于我帮几十位朋友搭建ComfyUI的经验,以下问题出现频率最高:
1. 模型放错了目录:ComfyUI有多个models子目录,checkpoints才是放SD模型的地方。lora、controlnet、vae各有对应目录。模型放错位置,Load Checkpoint下拉框里不会出现。
2. 显存不足导致CUDA错误:如果生成时直接崩溃,把图片尺寸降到512x512,或者把batch size设为1。8GB显存跑512x768基本没问题,但1024以上的尺寸就需要12GB了。
3. 提示词写法不对:SD模型不理解自然语言。写"a beautiful cat with soft fur"远不如写"masterpiece, best quality, cat, soft fur, detailed"。逗号分隔的标签式写法效果更好。
4. 忘记生成随机种子:每次点Queue Prompt默认用新种子,所以同样的提示词每次结果都不同。想复现某张图,把Generate按钮旁的种子值复制下来,下次手动填入。
5. ControlNet安装失败:ControlNet是ComfyUI的杀手级功能,但安装需要额外步骤。先装ComfyUI-Manager,然后通过管理器一键安装ControlNet插件和模型,避免手动操作。
进阶:安装ComfyUI-Manager解锁生态
ComfyUI的强大之处在于社区生态。安装Manager后可以一键导入别人的工作流、安装自定义节点。安装方法:
cd ComfyUI/custom_nodes git clone https://github.com/ltdrdata/ComfyUI-Manager.git
重启ComfyUI后,界面上方会出现Manager按钮。通过它你可以:
- 一键安装数百个社区节点插件
- 导入别人分享的完整工作流JSON文件
- 管理已安装的节点更新和依赖
我强烈建议安装的节点:IPAdapter(图生图参考)、Segment Anything(智能抠图)、WD14 Tagger(反推提示词)。这三个组合起来基本覆盖了日常AI绘画的80%需求。
本地部署 vs 云端方案的选择建议
如果你没有NVIDIA显卡,还有两条路:
- ComfyUI Cloud:ComfyUI官方提供的云端方案,按GPU小时计费,适合偶尔用用
- 本地CPU模式:生成速度慢但完全免费,一张512图大约3-5分钟
我的建议是:如果你一周生成不超过10张图,先用免费方案练手。一旦确定AI绘画是你的长期需求,花2000多块买张二手RTX 3060 12G是最划算的投资,比一年的Midjourney订阅还便宜。
总结
ComfyUI的学习曲线确实比WebUI陡一些,但理解节点逻辑后,你会发现它的灵活性和可定制性远超其他方案。从简单的文生图开始,逐步添加ControlNet、LoRA、IPAdapter等节点,你的工作流会越来越强大。关键是不要被初始界面的复杂度吓退——先把默认工作流跑通,生成第一张图,信心就来了。
相关阅读:如果你对AI本地部署感兴趣,可以看看OpenClaw本地部署实战和OpenClaw多模态实战全攻略,两篇文章从不同角度讲解了AI工具的本地化部署思路。
版权声明
本文仅代表个人观点。
本文系AI辅助作者原创,未经许可,转载请保留原文链接。

发表评论