Monthly Archives: 3 月 2024

AIGC

玩转StableDiffusion.7——InstantId制作风格化照片

2024 年 03 月 28 日 – 上午 6:37

上次提到使用InstantId做换脸，这次就试试其官方突出推广的“风格化照片”功能，先来看看成果，第一组是原图，下面是各种风格转化效果



有点感觉吧~~有几个其实并不理想，如果多跑几张，应该会有更好的效果，无奈InstantId对显存要求很高，我的10G显卡跑着有点吃力，每张图基本都要5-10分钟以上(⊙o⊙)…
废话不错说，下面是基本的操作步骤~~其实和之前使用图生图做换脸是一样的：

——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

AIGC

玩转StableDiffusion.6——任意更换电商图背景

2024 年 03 月 26 日 – 上午 9:09

无意间看到了使用StableDiffusion更换商品图背景的方法，这里分享出来，比ps来的要简单些，而且融入更好。首先，需要安装一个名为“rembg”的插件，然后切换到“后期处理”界面，上传一个淘宝找来的香水图片，选择最下面“移除背景”、选择“u2net”、“回送蒙版”，点击”生成”按钮，即可得到一张黑白的蒙版图。这里注意，第一次运行可能会需要下载模型，时间会比较久：

下载蒙版图，（我这个示例图找的不太好，前景的标签也被加进去了，可以到ps里处理一下，把左边标签留下的白框涂掉）。切换到“图生图”、“上传重绘蒙版”，分别上传刚才的商品图、和蒙版图，提示词输入你想要的效果，如下图设置，比较重要的是，因为我们是要整个换背景，所以最下方“重绘幅度”设置为1。ok，点击“生成”，稍等片刻，既可以看到效果。

可以看出，输出图自然给了原图瓶子立体和阴影效果，还是很不错的。

当然，有时因为对提示词理解的原因，输出图会多出一个“瓶子”，比如下面这样…这时可以尝试换换提示词，或者点生成几张。

当然，同样的方法也可以给人换背景，不过效果不如“规则的商品”更容易控制，大家感受一下：

——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

AIGC

玩转StableDiffusion.5——用InstantId换脸

2024 年 03 月 25 日 – 上午 4:04

“InstantID 是由InstantX项目组推出的一种SOTA的tuning-free方法，只需单个图像即可实现 ID 保留生成，并支持各种下游任务”。它的项目主页在这里：https://github.com/InstantID/InstantID，下面是官方效果图

相对之前玩过的easyphoto，InstantID最大的优势是省去了训练Lora的步骤，今天，我们先来试用InstantId的换脸功能。InstantID目前是通过ControlNet集成到StableDiffusion内，具体需要以下几个步骤：
1. 检查ControlNet版本不低于1.441、StableDiffusion版本不低于1.8.0
2. 下载模型、预处理器和配置文件，并放入对应目录，下载地址：https://github.com/Mikubill/sd-webui-controlnet/discussions/2589，需要下载的下列七个文件：1k3d68.onnx、glintr100.onnx、scrfd_10g_bnkps.onnx、genderage.onnx、2d106det.onnx、ip-adapter_instant_id_sdxl.bin、control_instant_id_sdxl.safetensors。5个onnx配置文件放入：webui根目录/extensions/sd-webui-controlnet/annototort/downloads/insightface/models/antelopev2。另外两个文件放入：webui根目录/extensions/sd-webui-controlnet/models
ok，重启webui后，开始操作
1. 切换到图生图，大模型选择SDXL或SDXLTurbo类模型，上传模仿图片。为了得到相对更好的效果，如果是Turbo模型，Steps设置为5-7即可、CFG设置为1.5左右；非Trubo模型Steps保持默认20，CFG设置为3-5；输入一组符合模仿图特征的提示词
2. 打开一个ControlNet单元，上传脸模图片，按下图设置

3. 再打开一个ControlNet单元，上传与图生图相同的模仿图图片

ok，点击“生成”按钮，稍等片刻，看看效果：

换一组，再来一次：

——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

AIGC

ComfyUI学习笔记.2——ComfyUI&AnimateDiff制作动画

2024 年 03 月 14 日 – 上午 4:33

互联网的存在让学习变成了一个成本极低的事情，以前是各种图文教程，这几年视频网站兴起，B站、油管都有大量的教学视频，就连开源项目也都自带方便的学习入口，只要你想学，各种资源随手一抓一大把。首先，开始正题之前，先让我们来赞美上帝、赞美共享和开源精神…阿门…
ComfyUI版AnimateDiff项目地址：https://github.com/Kosinkadink/ComfyUI-AnimateDiff-Evolved。在项目说明后面，还提供了几个漂亮的示例，这些示例都是带ComfyUI工作流图的…只要将你感兴趣的工作流拖到你的ComfyUI界面，即可在本地运行这个工作流~~当然，前提是你要补上缺失的节点插件和模型。我们还是从开始一步一步说说怎么通过提示词生成动画片段：
首先，点击右侧导航条“清除”清理工作区、“加载默认”，然后按一下几步得到AnimateDiff的工作流
1. 添加新节点“CLIP停止层”，连接到大模型与提示词节点之间，数值设置为-2
2. 添加“VAE加载器”节点到“VAE解码节点”，根据大模型版本是否是XL,选择VAE模型的版本
3. 添加“AnimateDiff Evo -> AnimateDiff加载器”节点，连接到大模型和采样器两个模型之间
4. 从输出端“VAE解码器 – 图像”拉出、新建“合并为视频”节点，保持默认帧率8，可以选择输出格式为gif，或是mp4
5. 在画面尺寸节点，调整批次大小到16，16÷8=2，将输出长度为2秒的视频
——-至此，简单输入一个关键字，看能否正常输出视频。（我这里工作流里还加了一个“墨心”Lora）

输出结果

上面演示视频只有两秒，如果大家尝试加大批次数到超过32，会发现报错，提示说最多只能生成32帧视频，要突破这个限制，需要在加入一个上下文节点，下面我们顺道把另外几个辅助点也一起都加上：
6. 新建“上下文设置”节点，连接到“AnimateDiff加载器”上面的“上下文设置”。
7. 新建“动态Lora”节点，连接到“AnimateDiff加载器”上面的“动态LORA”，选择对应的Lora，可以控制镜头运动；另外，动态LORA节点可以串联多个，实现更多动态运动。
——这里可以再点击生成按钮，试试镜头运动和提高时长的输出效果。
8. 安装FizzNodes插件节点，新建“Fiz添加节点 -> 提示词调度”，添加提示词调度节点，替换原有的正向提示词节点
9. 在提示词调度的第一个文本框可以定义每一帧的动作，第二个文本框输入正常的提示词；注意，这里第一个文本框的格式虽然没有花括号方括号，但类似json格式，也就是需要英文双引号、冒号、行逗号
10. 将批次增加到48，也就是6秒，同时忽略Lora节点（一方面为了能看到帧序列关键字是否生效，另一方面加了Lora以后，输出会更“稀碎”^_^）
ok，试试最终输出效果

素材结果

后记：可以看到输出视频非常“丝滑”…仅此而已，很明显角色的一致性是有问题的…只能说，还要继续努力、提高可控性。其实，现阶段无论是StableDiffusion，还是ComfyUI，生成的视频都相对前不久OpenAI新发布的Sora，都是小儿科，可控性很低。（当然，也是因为我刚入门，对很多控制手段都还不了解。而且，Sora也只是发布了一段演示视频，外界还不知道它的具体做法。）不过，现阶段开源免费的做的最好的也就是StableDiffusion和ComfyUI，而且，以这两年AIGC发展的速度，相信用不了多久，开源领域也会出现Sora同级别的产品

——over
转载请注明出处: 昆仑的山头

Tags AI, ComfyUI | Permalink | Comment (0)

AIGC

ComfyUI学习笔记.1

2024 年 03 月 11 日 – 上午 9:21

说到ComfyUI与StableDiffusion，其实严格来说，二者没啥直接关联，都是可以独立运行的AI出图开源项目；可二者又是出自同门、且模型通用，整个工作原理也都类似。看评价说ComfyUI更难入门，大概是我有StableDiffusion的使用经验，今天实际使用ComfyUI，并没这么觉得，反而感觉操作更简单，更容易上手。
ComfyUI最大的特色就是节点化工作流界面，操作简单明了。而且最重要的是，相对StableDiffusion，同样条件下，ComfyUI出图更快~~真的是快。这里就来说一下安装方法和主要插件，首先是项目地址：https://github.com/comfyanonymous/ComfyUI，不是下载项目本身，而是看项目README，找到 Installing – Windows – Direct link to download，点击链接下载、解压。
如果要和本地StableDiffusion共用模型，可以修改项目目录下ComfyUI/extra_model_paths.yaml.example文件，去掉文件名“.example”，将自己的webui目录填进去，另外要留意的是controlNet目录，文件里默认不对，也要修改。ok，做好这些，就可以双击项目目录下“run_nvidia_gpu.bat”启动ComfyUI。
好，先搞一个妹子图试试~~通过节点化的界面，可以很清晰的看出出图的几个步骤：大模型、正反提示词、采样器、VAE、成品图

~~运行成功！
下面开始安装插件，先来第一个：管理器，项目地址 https://github.com/ltdrdata/ComfyUI-Manager，下载以后放入ComfyUI/custom_nodes目录内，重启项目~~这时右侧导航条的最下方就出现了“Manager”按钮，通过这个管理器，不仅可以对ComfyUI做各种设置，而且还能下载、管理插件，其中一个有意思的设置：“预览方法”，打开以后，就能在采样器中看到出图的每一个“step”，让我们更能理解AI出图的过程，很有意思。

然后是中文汉化插件https://github.com/AIGODLIKE/AIGODLIKE-ComfyUI-Translation，可以选择手动下载安装，也可以在刚才的“管理器”中通过“安装节点”安装
另外两个比较有用的是“SDXL提示词”和“脚本辅助工具”，地址分别是https://github.com/twri/sdxl_prompt_styler、https://github.com/pythongosssss/ComfyUI-Custom-Scripts。第一个插件允许添加“SDXL风格节点”，可将很多预设的风格提示词直接加入，非常方便。最后一个辅助工具，最有用的一点是可以替换大模型节点，让大模型的显示更加简洁、且能够显示出模型预览图

另外，图像面板也很好用，能够看到最近生产的各个图片，直接把图片拖入工作区，还能将图片的生产预设直接带过去，相当于保存了整个工作流
~~ok，先介绍这几个插件，整体用起来，ComfyUI的可视化节点界面，比webui的界面简单直观了很多，项目打开、出图也都更快了
——over
转载请注明出处: 昆仑的山头

Tags AI, ComfyUI | Permalink | Comment (0)

AIGC

玩转StableDiffusion.4——用EasyPhoto实现丝滑换脸

2024 年 03 月 07 日 – 上午 3:44

EasyPhoto是一个集模型训练、文生图、图生图、文生视频、图生视频于一体的SD插件，功能强大，操作简便，今天就来看看如果用它来做AI换脸。
安装好EasyPhoto以后，SD的webui的上导航就会出现EasyPhoto选项卡，点进去以后，默认就是“训练”Lora的界面。这里可以选择不少于5张面部图片，尽量包含各种表情、各种角度。我们就来请出一位和蔼可亲的大叔来做模特，把图片上传到“训练”内

右边“高级选项”中，选择“人物Lora”、选一个比较通用的写实大模型。“max train steps”和“max steps per photos”，分别是训练步数，和每张图片训练多少次，如果不想训练过程太久，可以保持默认选项，下面的验证选项“Validation”建议取消勾选，否则不仅训练过程会变慢，而且还很容易报错、中断训练过程。ok，点击橙色的“Start Training”按钮，输入Lora名称，开始训练
16张图，按上图的设置，手头这台电脑显卡是10G3080，训练时间大概是20~30分钟
~~训练完成，切换到“Photo Inference”选项，测试一下训练效果。先使用“Photo2Photo – Template Gallery”，选一张easyphoto自带的模版图片，下侧大模型，尽量和训练Lora时保持一致，Num of Faceid选1，user_0 id选择刚才训练的Lora（如果没有，点一下右侧的刷新按钮），点击橙色按钮，稍等片刻，既可以看到换脸效果

下方“高级选项”，可输入更多提示词，对输出结果进行更多调整。勾选选择“Display Face Similarity Scores”，可以看到当前输出结果，是参考自哪张训练图。
换一种同性别的证件照：

可以看出easyphoto并非简单换脸，而是会做一定程度的融合，具体的融合参数，可通过“高级选项”进行设置。
切换到“Sing Image Upload”，上传几张自定义图片试试效果：

另外试了一下easyphoto的图生视频选项，效果很渣，等调整好了，再拿出来展示o(*￣︶￣*)o
——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

AIGC

玩转StableDiffusion.3——使用tile把随手涂鸦变成美图

2024 年 03 月 03 日 – 上午 6:11

ControlNet的出现，在很大程度上弥补了StableDiffusion出图的不可控性，今天就来试试使用里面的tile预处理器，来将随手画的一个草图变成一棵逼真的老树，先看原图：

首先确保已经安装了ControNet插件，模型下载地址：https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main
“文生图”，输入关键字：1tree,masterpiece,best quality，选择ControNet，“启用”，上传上面的草图，预处理器选择“tile_resample”，模型选择“control_v11file_sd15_tile”，其他保持默认设置

点击“生成”，成品图：

怎么样，纹理细节补充的很完美吧^_^
有人说，同样的功能，“图生图”也能完成。那么，咱们就来比较一下，同样一张草图，“图生图”的输出结果

——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

AIGC

玩转StableDiffusion.2——拒绝脸崩，ADtailer的使用

2024 年 03 月 02 日 – 上午 4:02

初试StableDiffusion，最容易碰到的问题就是成品脸部异常，表情诡异、甚至不是人脸。特别是当画面中人物较多，或清晰度较低时，出现这种问题的概率更高…比如下面

这时，可以把图片导入到“图生图”，然后逐个“局部重绘”，选中面部后重新渲染。缺点是，这样做太麻烦。那么，有没有更高效的解决方案？有的，插件ADtailer就可以解决这种问题。
ADtailer插件安装地址：https://github.com/bing-su/adetailer.git。安装后，还需要去huggingface下载对应的模型，地址：https://huggingface.co/Bingsu/adetailer/tree/main，下载里面的*.pt文件，放入stable-diffusion-webui/models/adetailer目录，“应用更改并重启”，回到“文生图”界面，选择“启用After Detailer”，“After Detailer模型”选择“face_yolov8n_v2.pt”，如下图

同样的关键字，点“生成”。这次，在图片初稿出现以后，会看到预览区域人物面部出现红框“face 0.x”的字样，这就是插件正在对面部做矫正：

成品：

除了矫正面部，ADtailer还可以选择多个单元，选择对应的模型，修复手部、身体
——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

AIGC

玩转StableDiffusion.1 ——安装与试运行

2024 年 03 月 01 日 – 上午 10:16

去年曾经用手头mac本装过一次StableDiffusion，当时运行也成功了，但过了一段时间，突然就不行了。因当时忙于别事，没再深究。春节闲来无事，便准备在手头的windows台式机上试试。由于这台windows之前只用来玩游戏，比较“纯洁”，所以安装过程基本顺利。网上有很多StableDiffusion的安装教程，这里只说一下自己碰到的坑吧：python的版本要求。
开始没多想，直接先去python官网找最新版本的python安装，然后下载stable-diffusion-webui安装包，在已打开科学上网的前提下，启动里面的webui.bat，居然失败了…后来发现问题：StableDiffusion所使用的pytorch，python版本不能大于3.10.6。于是回头一路找python降级的方法~~看大家评价，好像不太容易。
那就换个思路吧，用conda装多版本~~安装conda以后，单独create一个AICG专用的python环境，然后将下面的语句加到webui.bat的靠前位置：
set PYTHON=C:/Dev/conda/envs/aipy3.10/python.exe
再次启动，OK，安装成功、web界面成功打开！
（后来才知道，国内有大神做的“秋叶安装包”，里面集成了环境、安装、模型管理等各种功能，NB到掉渣，大家有需要的，可以拿它试试）
~~测试效果，简单提示词这里就不放了，给个复杂点的：best quality,1girl,((color hair)),[pink:blue:pink:blue] hair,purple long dress,(1dog),flowers meadows,[red flower:0.5],[yellow flower::0.6]，出来效果：

这里用的大模型是majicmixRealistic_v7，比较写实，效果还不错吧^_^
不过也有瑕疵，可能因为要素过多，裙子颜色、狗，都不太稳定，定义的花海颜色的生效时间也不太对
好在，脸比较完美o(*￣︶￣*)o
~~当然，这么完美的脸，是用了魔法的，具体是什么，下次再说^_^
————
对了，补充一句：相对mac的m1max，StableDiffusion在3080显卡上的出图速度提升了不下5倍，小分辨率的基本都是秒出！！
——over
转载请注明出处: 昆仑的山头

Tags AI, StableDiffusion | Permalink | Comment (0)

昆仑的山头

Monthly Archives: 3 月 2024

玩转StableDiffusion.7——InstantId制作风格化照片

玩转StableDiffusion.6——任意更换电商图背景

玩转StableDiffusion.5——用InstantId换脸

ComfyUI学习笔记.2——ComfyUI&AnimateDiff制作动画

ComfyUI学习笔记.1

玩转StableDiffusion.4——用EasyPhoto实现丝滑换脸

玩转StableDiffusion.3——使用tile把随手涂鸦变成美图

玩转StableDiffusion.2——拒绝脸崩，ADtailer的使用

玩转StableDiffusion.1 ——安装与试运行

分门别类

时间线

链接表

七嘴八舌

近期发布

发布日历

2024 年 3 月
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Monthly Archives: 3 月 2024

五花八门

分门别类

时间线

链接表

七嘴八舌

近期发布

发布日历