位置：AI门户网 > AI技术 > AI框架 > 开源AI绘图框架到底该怎么用？

开源AI绘图框架到底该怎么用？

来源：AI门户网时间：2026/3/27 15:05:05 共 3173 浏览

你听说过AI绘图，也刷到过那些让人惊叹的图片，是不是心里痒痒的，也想试试自己动手生成？但是一搜索“Stable Diffusion”、“ComfyUI”，满屏的代码和术语，瞬间就懵了。感觉这玩意儿是不是特别难，得是程序员才会？别急，我今天就想和你聊聊，一个完全不懂代码的新手小白，到底该怎么用这些开源的AI绘图工具。这就像很多人想学“新手如何快速涨粉”一样，看起来复杂，其实找准方法，入门没那么可怕。

第一步：别被吓到，先搞清楚“框架”是什么

咱们先把这个概念弄明白。你可以把AI绘图框架，想象成一个功能超级强大的“画图软件”。像Stable Diffusion WebUI、ComfyUI、Fooocus这些，都是这样的软件。它们本身不直接“生产”图片，而是提供了一个操作界面和运行环境。

那图片是怎么来的呢？靠的是“模型”。模型就像是这个软件里的“画笔”和“颜料库”，决定了你能画出什么风格的画。网上有很多别人训练好的模型，比如专门画二次元的、画真实风景的、设计服装的，你可以随便下载，放到框架里就能用。

所以，整个过程大概是：安装一个框架（软件） -> 下载你喜欢的模型（画笔） -> 在框架里输入文字描述 -> 生成图片。是不是感觉清晰一点了？

第二步：怎么选？三个主流框架的“白话”对比

市面上框架很多，咱们就挑三个最主流的，用大白话比比看。

Stable Diffusion WebUI（AUTOMATIC1111版）

这个可以说是最出名、用户最多的了。它的界面有点像传统的软件，各种功能按钮排布得比较清楚。

*优点：插件极其丰富，社区支持最好，教程海量，几乎你想实现的任何功能都能找到插件。

*缺点：界面选项太多，对新手可能有点眼花缭乱；安装配置稍微麻烦一丢丢。

*适合谁：有点探索精神，愿意花点时间学习，未来想深度折腾各种功能的新手。

ComfyUI

这个的界面就完全不一样了，是“节点式”的。所有功能都是一个一个小方块（节点），你需要用线把它们连起来，组成一个工作流程。

*优点：极其灵活自由，可以搭建非常复杂和定制化的流程；对电脑资源（显存）的利用效率更高，生成可能更快。

*缺点：学习曲线最陡峭，一开始看到满屏的线和方块，头真的会大。需要理解逻辑。

*适合谁：喜欢可视化编程逻辑，或者后期想精准控制生成每一步的进阶用户。

Fooocus

这个可以说是为“懒人”和“纯粹想快速出图”的人量身定做的。它的设计理念就是极简。

*优点：安装和使用最简单，几乎一键搞定。界面非常干净，参数很少，专注于“提示词->出图”这个核心体验。

*缺点：可自定义的高级功能少，不适合想精细调整参数的用户。

*适合谁：绝对的新手小白，不想任何折腾，装上就能开始玩，快速获得成就感的朋友。

看到这里，你可能要问了：说了这么多，到底哪个最适合我？我该从哪开始？

问得好，这绝对是核心问题。我的个人观点非常明确：如果你是零基础，纯粹想体验AI绘图的乐趣，不被技术细节劝退，那就无脑选Fooocus。它把你从复杂的安装、配置中解放出来，让你在五分钟内就能开始创作。先玩起来，感受到乐趣，比什么都重要。等你用Fooocus玩熟了，知道什么是提示词、什么是模型，再回头看WebUI或者ComfyUI，就会容易理解得多。这就好比你学车，先用自动挡找到驾驶的感觉，比一上来就学手动挡离合配合要顺畅。

第三步：手把手开始你的第一次生成

咱们就以大多数人会选择的Stable Diffusion WebUI为例，说下大概的步骤。别怕，现在有很多整合包，已经把最麻烦的步骤打包好了。

1.准备环境：你需要一台有独立显卡的电脑，NVIDIA的比较好，显存建议6GB以上。然后安装Python和Git（整合包通常自带或有一键脚本）。

2.获取框架：去GitHub找到AUTOMATIC1111的WebUI项目页面，或者直接搜索“Stable Diffusion WebUI 整合包”，下载别人打包好的，能省去大量配置时间。

3.下载模型：这是关键一步。去CivitAI这类模型网站，找你喜欢的风格，比如“XX动漫模型”、“真实感摄影模型”，下载`.safetensors`格式的文件。

4.放置模型：把下载好的模型文件，放到WebUI目录下的 `models/Stable-diffusion` 文件夹里。

5.启动运行：运行目录里的 `webui-user.bat` 文件，等它自动完成一系列加载。最后在命令行里看到一个本地网址（比如 `http://127.0.0.1:7860`）。

6.打开浏览器：把那个网址输入到浏览器地址栏，你就看到操作界面了。

7.选择模型：在界面左上角，下拉选择你刚才放进去的模型。

8.输入提示词：

*正向提示词：详细描述你想要的画面，比如“一个女孩，长发，在森林里，阳光透过树叶，唯美，大师级作品”。

*反向提示词：写你不想要的东西，比如“模糊，多手指，丑陋，畸变”。这能有效提升图片质量。

9.调整参数：新手可以先关注这几个：

*采样步数：20-30步左右效果和速度比较平衡。

*图片尺寸：按你模型推荐的来，比如512x512或768x768。

*提示词引导系数：一般在7-12之间，数值越高越听从你的提示词。

10.点击生成：然后，就是见证奇迹的时刻了！

一些避坑指南和真心话

玩的过程中，你肯定会遇到问题，这太正常了。

*显存不够报错：这是最常见的。在 `webui-user.bat` 的启动参数里可以添加 `--medvram` 或 `--lowvram` 来优化。

*图片脸崩、手崩：AI的老大难问题。试试在反向提示词里加强相关描述，或者使用专门的“负面嵌入”模型。

*不知道怎么写提示词：多去CivitAI等网站，看别人分享的成品图和他们的提示词，模仿着来。

*生成速度慢：除了升级硬件，可以尝试使用 `--xformers` 启动参数来加速。

最后，说点小编的观点吧。AI绘图开源框架的门槛，其实远没有看上去那么高。它现在的状态，有点像早期的智能手机，需要一点学习成本，但绝对在普通人可接受的范围内。关键就在于别想着一口吃成胖子，从最简单的Fooocus或者WebUI基础功能开始，把一次成功的生成作为第一个小目标。当第一张由你描述生成的图片出现时，那种创造的快乐会抵消掉所有前期摸索的烦躁。这个过程本身就是一种学习，一种和未来科技对话的方式。剩下的，就是保持好奇，多试，多玩，社区里总有热心的前辈分享过你遇到的每一个坑。