百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

手把手教你安装最强文生图工具ComfyUI

liuian 2024-12-06 17:22 43 浏览

ComfyUI 是一款专为稳定扩散(Stable Diffusion)设计、基于节点的高效用户界面,因其高度的可定制性,正逐渐成为广大用户的新宠。本文教你如何在 Windows 和 Mac 上安装 ComfyUI,并提供一些快速上手的小贴士。

1 ComfyUI简介

ComfyUI 是一款创新的图形用户界面(GUI),打破了传统稳定扩散界面的常规。ComfyUI 采用先进的基于节点的图像生成技术,支持构建更为复杂和个性化的工作流程。

ComfyUI 的优势

  • 轻量级:ComfyUI 仅加载必需内容,与一体化 GUI 相比,内存使用量更低,图像生成速度更快。
  • 灵活性:采用节点化设计,使构建复杂工作流程更加简单。例如,你可以轻松创建一个工作流程,生成两张不同CFG比例的图像,并直观比较它们的效果。
  • 透明直观:如果你熟悉稳定扩散技术,ComfyUI 会用直观的方式展示整个图像生成的每一个步骤,让你对每个环节都看得清清楚楚。
  • 工作流共享:无需编写繁琐的步骤说明,你可以直接保存并分享整个工作流程,让协作更加便捷。
  • 适合原型设计:开发者可以在实际部署前,快速构建和测试工作流程原型,提高开发效率。
  • 尖端特性:节点化系统让用户能够迅速接入和分享新功能,比传统GUI更加灵活和高效。

2 安装指南

在开始安装之前,有必要说明,除了本地安装,还有其他安装选项。对于偏好托管服务的用户,例如 Think Diffusion 这样的平台提供了在线托管的 ComfyUI 服务。如果你在本地安装上遇到难题,或者更倾向于使用云服务,这些在线解决方案会非常适合你。

2.1 Windows系统安装

步骤 1:安装 7-Zip

首先,需要 7-Zip 来解压 ComfyUI 文件。可从官方 7-Zip 网站下载。(https://7-zip.org/a/7z2301-x64.exe)

步骤 2:下载 ComfyUI

从官方 GitHub 仓库下载 ComfyUI 的独立版本。(https://github.com/comfyanonymous/ComfyUI/releases/download/latest/ComfyUI_windows_portable_nvidia_cu118_or_cpu.7z)

步骤 3:解压 ComfyUI

右键单击下载的文件,选择“7-Zip” > “Extract Here”。

步骤 4:下载检查点模型

ComfyUI 需要一个检查点模型才能工作。你可以下载一个,例如 DreamShaper 8 模型,或与其他稳定扩散 GUI 共享模型(下文会详细介绍)。

将模型放置在 ComfyUI_windows_portable\ComfyUI\models\checkpoints 文件夹中。

步骤 5:启动 ComfyUI

  • 如果你有 Nvidia GPU:双击 run_nvidia_gpu.bat
  • 否则:双击 run_cpu.bat

ComfyUI 会自动在你的默认网页浏览器中打开。

2.2 Mac系统安装

Mac 的安装过程稍微复杂一些,需要使用终端。

步骤 1:安装 Homebrew

打开终端并运行:

/bin/bash -c "$(curl -fsSL )"

步骤 2:安装所需软件包

运行以下命令:

brew install cmake protobuf rust python@3.10 git wget

步骤 3:克隆 ComfyUI

运行:

git clone 
cd ComfyUI

步骤 4:设置 Python 环境

python3 -m venv venv
source venv/bin/activate

步骤 5:安装 ComfyUI 依赖项

安装所需的 Python 包:

pip install torch torchvision torchaudio
pip install -r requirements.txt

步骤 6:下载稳定扩散模型

下载模型并将其放置在 models/checkpoints 目录中。

步骤 7:启动 ComfyUI

运行:

python main.py

3 模型共享设置

为了不重复拷贝大型模型文件,可以通过设置让 ComfyUI 直接使用 AUTOMATIC1111 的模型目录。

  1. 将 ComfyUI 目录中的 extra_model_paths.yaml.example 文件重命名为 extra_model_paths.yaml
  2. 打开这个新命名的文件,修改 base_path 的值,使其指向你的 AUTOMATIC1111 模型目录。
  3. 保存更改后,完全重启 ComfyUI,以便设置生效。

4 快速上手 ComfyUI

安装好 ComfyUI 后,下面是生成你的第一张图像的简单步骤:

  1. 在“加载检查点”节点中,选择一个模型。
  2. 在对应的“CLIP 文本编码”节点中,输入你的提示文本和负提示。
  3. 点击“队列提示”,开始生成图像。

5 高级技巧

ComfyUI 的强大之处在于能够构建复杂的工作流程。以下是一些高级用法,供你探索:

  • 多模型比较:通过使用多个“加载检查点”节点,你可以在同一个工作流程中对比不同模型的效果。
  • 自定义采样:尝试不同的采样节点,精细调整你的图像生成过程。
  • 图像编辑:加入图像输入节点,对现有图像进行修改或创造新变体。
  • 条件控制:利用 ControlNet 节点,对你的图像生成进行更精细的控制。
  • 动画制作:创建帧插值节点,实现流畅的动画效果。

这些高级技巧将帮助你充分发挥 ComfyUI 的潜力,创造出更加丰富多样的图像和动画。

6 故障排查

遇到问题时,可以按照以下步骤进行排查:

  1. 更新 GPU 驱动:确保你的 GPU 驱动程序是最新版本。
  2. 检查 ComfyUI 版本:确认你使用的是 ComfyUI 的最新版本。
  3. 模型文件位置:核实模型文件是否存放在正确的目录下。
  4. 查看错误信息:在终端或命令提示符窗口中查找可能出现的错误消息。

按照这些步骤操作,通常能帮助你快速定位并解决问题。

7 更新指南

ComfyUI 正在持续开发中,新功能和改进会定期推出。以下是更新步骤:

  • Windows 用户:在 update 文件夹中运行 update_comfyui.bat 脚本即可更新。
  • Mac 用户:在 ComfyUI 的目录下,先执行 git pull 命令,然后运行 pip install -r requirements.txt 来安装最新依赖。

推荐书单

《LangChain编程:从入门到实践》

LangChain为开发者提供了一套强大而灵活的工具,使其能够轻松构建和优化大模型应用。本书以简洁而实用的方式引导读者入门大模型应用开发,涵盖LangChain的核心概念、原理和高级特性,并为读者提供了在实际项目中应用LangChain的指导。本书从实际的例子出发,细致解读LangChain框架的核心模块和源码,使抽象的概念变得具体。无论你是初学者还是有经验的开发者,都能从中受益,能够将LangChain的独特之处融入自己的编程实践中。阅读本书,一起探索LangChain编程的奇妙世界吧!

相关推荐

教你把多个视频合并成一个视频的方法

一.情况介绍当你有一个m3u8文件和一个目录,目录中有连续的视频片段,这些片段可以连成一段完整的视频。m3u8文件打开后像这样:m3u8文件,可以理解为播放列表,里面是播放视频片段的顺序。视频片段像这...

零代码编程:用kimichat合并一个文件夹下的多个文件

一个文件夹里面有很多个srt字幕文件,如何借助kimichat来自动批量合并呢?在kimichat对话框中输入提示词:你是一个Python编程专家,完成如下的编程任务:这个文件夹:D:\downloa...

Java APT_java APT 生成代码

JavaAPT(AnnotationProcessingTool)是一种在Java编译阶段处理注解的工具。APT会在编译阶段扫描源代码中的注解,并根据这些注解生成代码、资源文件或其他输出,...

Unit Runtime:一键运行 AI 生成的代码,或许将成为你的复制 + 粘贴神器

在我们构建了UnitMesh架构之后,以及对应的demo之后,便着手于实现UnitMesh架构。于是,我们就继续开始UnitRuntime,以用于直接运行AI生成的代码。PS:...

挣脱臃肿的枷锁:为什么说Vert.x是Java开发者手中的一柄利剑?

如果你是一名Java开发者,那么你的职业生涯几乎无法避开Spring。它如同一位德高望重的老国王,统治着企业级应用开发的大片疆土。SpringBoot的约定大于配置、SpringCloud的微服务...

五年后,谷歌还在全力以赴发展 Kotlin

作者|FredericLardinois译者|Sambodhi策划|Tina自2017年谷歌I/O全球开发者大会上,谷歌首次宣布将Kotlin(JetBrains开发的Ja...

kotlin和java开发哪个好,优缺点对比

Kotlin和Java都是常见的编程语言,它们有各自的优缺点。Kotlin的优点:简洁:Kotlin程序相对于Java程序更简洁,可以减少代码量。安全:Kotlin在类型系统和空值安全...

移动端架构模式全景解析:从MVC到MVVM,如何选择最佳设计方案?

掌握不同架构模式的精髓,是构建可维护、可测试且高效移动应用的关键。在移动应用开发中,选择合适的软件架构模式对项目的可维护性、可测试性和团队协作效率至关重要。随着应用复杂度的增加,一个良好的架构能够帮助...

颜值非常高的XShell替代工具Termora,不一样的使用体验!

Termora是一款面向开发者和运维人员的跨平台SSH终端与文件管理工具,支持Windows、macOS及Linux系统,通过一体化界面简化远程服务器管理流程。其核心定位是解决多平台环境下远程连接、文...

预处理的底层原理和预处理编译运行异常的解决方案

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好![Mac-10.7.1LionIntel-based]Q:预处理到底干了什么事情?A:预处理,顾名思义,预先做的处理。源代码中...

为“架构”再建个模:如何用代码描述软件架构?

在架构治理平台ArchGuard中,为了实现对架构的治理,我们需要代码+模型描述所要处理的内容和数据。所以,在ArchGuard中,我们有了代码的模型、依赖的模型、变更的模型等,剩下的两个...

深度解析:Google Gemma 3n —— 移动优先的轻量多模态大模型

2025年6月,Google正式发布了Gemma3n,这是一款能够在2GB内存环境下运行的轻量级多模态大模型。它延续了Gemma家族的开源基因,同时在架构设计上大幅优化,目标是让...

比分网开发技术栈与功能详解_比分网有哪些

一、核心功能模块一个基本的比分网通常包含以下模块:首页/总览实时比分看板:滚动展示所有正在进行的比赛,包含比分、比赛时间、红黄牌等关键信息。热门赛事/焦点战:突出显示重要的、关注度高的比赛。赛事导航...

设计模式之-生成器_一键生成设计

一、【概念定义】——“分步构建复杂对象,隐藏创建细节”生成器模式(BuilderPattern):一种“分步构建型”创建型设计模式,它将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建...

构建第一个 Kotlin Android 应用_kotlin简介

第一步:安装AndroidStudio(推荐IDE)AndroidStudio是官方推荐的Android开发集成开发环境(IDE),内置对Kotlin的完整支持。1.下载And...