Author Archives: jkl

【AIGC】ComfyUI+Flux日常P图示例:换装、局部修改

今天来介绍一个ComfyUI-Flux的换装工作流。和ComfyUI示例里自带的类似功能工作流相比,此工作流增加了一个“PaintEditor”节点,作用是可以用画笔圈出说要修改的部位,这样可以让ComfyUI做出更精确的修改,同时又尽可能的保留原图其他部分的状态,话不多说,我们先来看一下实际的效果:

Before imageAfter image

(提示词:Change the clothing in the red-framed area to Leopard print skirt everything else in the image exactly the same, including all other people, background, poses, and facial features.)

可以看出,除了提示词要求的修改短裙,包括模特的面部表情、姿势在内的整张图的其他部分均未改变,甚至面部阴影也没有变化。

关于PaintEditor节点,安装地址:https://github.com/Pixelailabs/paint_editor。关键步骤:点击paint_editor节点里的“open paint editor”按钮,并用红笔圈出要修改的部分

如上图,除了修改服装,这个工作流还可以修改图片中的其他元素,比如:

Before imageAfter image

(提示词:Change the horse in the red-framed area to the Ostrich …)

Before imageAfter image

(提示词:Change the character in the red-framed area to the Ultraman…)

点击这里下载此工作流。

——
over
转载请注明出处:http://www.jiangkl.com/2025/07/aigc_comfyui_flux_change_clothes/

sp.Skeleton动画Listener汇总

简单总结一下cocos骨骼动画的各种几个回调监听,可以进行更精确的控制特效,免得到时只会this.schedule

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
    //整体开始是调用一次
    this.roleAnimation.setStartListener((trackEntry)=>{
        console.log('---->> HeroAI roleAnimation, setStartListener:', trackEntry.trackIndex, trackEntry.animation.name);
    });
    //动画关闭时调用,在setEndListener之后
    this.roleAnimation.setDisposeListener((trackEntry)=>{
        console.log('---->> HeroAI roleAnimation, setDisposeListener:', trackEntry.trackIndex, trackEntry.animation.name);
    });
    //整体结束时调用
    this.roleAnimation.setEndListener((trackEntry)=>{
        console.log('---->> HeroAI roleAnimation, setEndListener:', trackEntry.trackIndex, trackEntry.animation.name);
    });
    //中断时调用,在setEndListener之前
    this.roleAnimation.setInterruptListener((trackEntry)=>{
        console.log('---->> HeroAI roleAnimation, setInterruptListener:', trackEntry.trackIndex, trackEntry.animation.name);
    });
    //每次循环结束时调用
    this.roleAnimation.setCompleteListener((trackEntry)=>{{
        console.log('---->> HeroAI roleAnimation, setCompleteListener:', trackEntry.trackIndex, trackEntry.animation.name);
    });

——
over
转载请注明出处:http://www.jiangkl.com/2025/04/cocos-skeleton-listener

cocos.tween动画,时间线控制汇总

本文主要简绍cc.tween与sequence、delay、parallel、repeat和call的各种搭配、混合使用,实现事件序列的串并行控制
1. 简单串行

1
2
3
4
5
6
7
8
// 示例代码,先执行动作1、再执行动作2、然后执行回调
cc.tween(node)
    .to(time1, { position: newPosition }) // 动作1
    .to(time2, { angle: newAngle }) // 动作2
    .call(() => {
        // console.log('>> cc.tween end')
    })
    .start();

2. 并行parallel、延迟delay

1
2
3
4
5
6
7
8
9
// 示例代码,先同步执行动作1和动作2、然后延迟0.5秒、然后执行动作3
cc.tween(node)
    .parallel(
        cc.tween().to(time1, { position: newPosition1 }),// 动作1
        cc.tween().to(time2, { angle: newAngle }),// 动作2
    )
    .delay(0.5)
    .to(time2, { position: newPosition2 }) // 动作3
    .start();

3. 并行parallel、串行sequence、重复repeat

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
// 示例代码 串并行混排、重复
cc.tween(node)
    .repeat(3,  // 让整个 sequence 重复 3 次
        cc.tween().sequence( //先执行第一个parallel,然后等待0.5秒、然后执行第二个parallel
            cc.tween().parallel( //先动作1与动作2串行
                cc.tween().to(1, { position: cc.v2(200, 200) }),  // 动作1
                cc.tween().to(1, { angle: 180 }) //动作2
            ),
            cc.tween().delay(0.5),
            cc.tween().parallel( //后动作3与动作4
                cc.tween().to(1, { position: cc.v2(-200, -200) }).to(1, { position: cc.v2(0, -200) }), //动作3,包含两个串行的子动作
                cc.tween().to(1, { color: cc.Color.RED }) //动作4
            )
        ).call(()=>{
               console.log('>> repeat once'); //每次repeat可以单独定义回调
        }),
 
    ).call(()=>{
        console.log('>> repeat end');} //整体完成的回调
    ).start();

——
over
转载请注明出处:http://www.jiangkl.com/2025/02/cocos-tween_timeline

cocos.tween动画,移动曲线参数汇总

1. 缓动曲线:

1
2
3
4
5
6
7
8
9
10
11
// 示例代码
cc.tween(node)
    .to(time, { position: newPosition }, { easing: "sineInOut" }) // 先慢后快
    .start();
// 常用 easing 类型
// "sineIn"	开始慢,后面加速
// "sineOut"	开始快,后面减速
// "sineInOut"	先慢-加速-再慢
// "quadIn"	二次方曲线加速
// "quadOut"	二次方曲线减速
// "quadInOut"	二次方曲线平滑过渡

2. 贝塞尔曲线(Bezier Curve):

1
2
3
4
5
6
7
//示例代码
cc.tween(node)
    .bezierTo(time, cc.v2(100, 200), cc.v2(200, 300), cc.v2(300, 100)) // 1秒内按贝塞尔曲线移动
    .start();
// bezierTo(time, control1, control2, endPos)
// control1 和 control2 是控制点,决定曲线形状。
// endPos 是终点,节点沿着曲线到达该点。

3. 分步依次移动,使用 sequence() 组合多个 to():

1
2
3
4
5
6
7
//示例代码
cc.tween(node)
    .sequence(
        cc.tween().to(time1, { position: cc.v2(100, 200) }, { easing: "sineOut" }),
        cc.tween().to(time2, { position: cc.v2(200, 100) }, { easing: "sineIn" })
    )
    .start();

——
over
转载请注明出处:http://www.jiangkl.com/2025/02/cocos_tween_positin_easing

用python提取Excel内的附件mp4

收到一个Excel文档,里面有两段内嵌的mp4视频,手头mac版的Excel打不开这俩附件。其实以前也发现过,无论是内嵌的doc、还是其他文件,mac版的excel似乎都打不开,但那时身边有用 windows的同事,让他帮忙打开再导出就好了。现在身边人全是mac本,手头唯一windows台式机平时只玩游戏,甚至没装office~~
先到的第一个方法是各种在线文档工具,但是,试了google和腾讯的,上传以后都不行。按说微软自家的在线文档总可以吧,好容易登陆了,TM上传这个Excel文件一直失败…
既然此路不通,那就从头开始:给windows装个office~~记得以前有试用版,装好以后能试用一个月。哪知现在的office365不付钱就找不到下载入口(⊙o⊙)…。有想着下载一个旧版的office,最好是破解版的,找了几个渠道,要么不是正常的下载包、要么到了百度网盘~~然后进网盘提示资源已经没了…(还送,好久不用windows,破解软件这么难找了吗 O(∩_∩)O哈哈~)
最后没办法,搜索引擎也找不到靠边的答案,问chatgpt,在chatgpt的提示下,一步步用python解出了附件,具体大概分下面两步:
1. 将excel备份一份,然后将扩展名改成“.zip”,然后解压,按AI的说法,运气好的话,mp4文件直接就在解压包/xl/embeddings目录底下~~我的运气不好,里面是两个bin文件,按chatgpt的说法,mp4数据就包在这个bin里
2. 调下面python脚本,处理bin文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
    import olefile #需要安装olefile库
    ole = olefile.OleFileIO('xx/xl/embeddings/oleObject2.bin')
    print(ole.listdir())
    streams = ole.listdir()
    print(streams) #打印出具体的数据流,mp4可能在\x01Ole10Native中,也可能在其他流中
    #提取mp4数据流
    if ole.exists('\x01Ole10Native'):
        with ole.openstream('\x01Ole10Native') as stream:
            data = stream.read()
        # 保存到缓冲文件
        with open('temp.bin', 'wb') as f:
            f.write(data)
        print("Data from \\x01Ole10Native saved as output.bin")
    else:
        print("\\x01Ole10Native stream not found")
    ole.close()
    # 从 MP4 文件中提取数据
    with open('temp.bin', 'rb') as f:
        data = f.read() 
    # 自动查找 MP4 文件头 ("ftyp")
    data_start = data.find(b'ftyp')
    if data_start == -1:
        print("MP4 header not found. The file may not contain valid MP4 data.")
        exit()
    print(f"MP4 header found at offset: {data_start}")
    # 从 mp4 文件头开始提取数据
    # mp4文件头在"ftyp"之前可能还有四个字节空位,具体的可以使用https://hexed.it之类的工具打开二进制文件查看
    data_start = data_start - 4 
    output_file = 'extracted_video.mp4' #输出mp4文件名
    with open(output_file, 'wb') as out_f:
        out_f.write(data[data_start:])
    print(f"File extracted successfully as {output_file}")

———-
over,转载请注明出处:http://www.jiangkl.com/2024/12/excel_mp4_python

Midjourney常用参数备忘

–v,选择模型版本
–aspect/–ar,出图宽高比,如 –ar 16:9
–stylize/–s,样式化程度,即更偏艺术风格还是更接近现实,0~1000,默认100
–quality/–q,图像质量,0.25/0.5/1/2,数值越大清晰度越高,时间也越长
–seed,指定种子,保证一致性
–chaos/–c,图像生成的随机性,0~100,数值越高,图像变化越大
–no,排除指定元素,如 –no water
–tile,创建可无缝拼接的重复图案,可用于壁纸、地板
–niji,使用专门动漫和漫画风格设计的版本生成图片,如 –niji 6
–iw,使用单张或多张参考图作为生图的参考,结合提示词生图,0~3,值越大参考程度越大,如 https://xxx/图片url A woman xxx, –iw 1.5
–cref,角色一致性,可与–cw配合使用,可设定生产图片的风格和参考图片的风格相似度,cw越大、可排斥生产图片和参考图片五官、服饰基本一样,如 Science ficton warrior…, –cref https://xxxx/参考图片地址 –cw 100
–sref,参考风格图像,如 –sref retro sculpture, –sref https://xxx/图片地址 –sw 500

css-display-flex各种居中对齐,强迫症的福音

先看页面效果

html+css:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
...
    <style>
        div.main{
            margin-left: 2%; width :96%;
            .title{
                width: 100%;display: flex;justify-content: space-between;
                align-items: center;padding: 10px 0;line-height: 16px;
                span{
                    font-size: 16px;color: #333;width: 200px; text-align: left;
                }
                >div{/*右侧单号、箭头*/
                    display: inline-flex;justify-content: right;align-items: center;width: 100px;
                    span{
                        font-size: 14px;color: #999;
                    }
                    img{
                        width: 14px; height: 14px; margin-right: -2px;/*修正png图的框框*/
                    }
                }
            }
            .content{
                width: 100%;
                .order{
                    background-color: #fff;border-radius: 5px;display: flex;
                    justify-content: space-between;align-items: center; margin: 10px 0;    
                    >img{/*商品图*/
                        width: 80px;height: 80px; border: 1px solid blue;
                        border-radius: 5px; margin: 10px;
                    }
                    >div{/*商品图右侧详情*/
                        display: inline-flex;flex-direction: column;
                        justify-content: space-between;align-items: center;
                        height: 80px;margin-right: 10px;
                        >div{/*单号、时间*/
                            display: flex; font-size: 16px;line-height: 16px;
                            span{
                                display:block;font-size: 16px;
                                color: #333;width: 200px;
                                text-align: left;width: 100%;
                            }
                            >span:last-child{/*时间*/
                                font-size: 11px;color: #999;text-align: right;
                            }
                        }
                        >span{/*商品名*/
                            display:inline-block;font-size: 18px;
                            color: #333;font-weight: 900;
                            text-align: left;width: 100%;
                        }
                        >span:last-child{/*规格*/
                            font-size: 11px;color: #999;
                            line-height: 12px;margin-top: -20px;/*拉进商品名与规格*/
                        }
 
                    }
                }
            }
        }
    </style>
    <div class="main">
        <div class="title">
            <span>近期订单</span>
            <div>
                <span>查看全部订单</span>
                <img src="arrow_right_small.png">
            </div>
        </div>
        <div class="content">
            <div class="order">
                <img src="IMG_1101.JPG">
                <div>
                    <div>        
                        <span>订单号: 123456789</span>
                        <span>2024-07-23 10:01:31</span>
                    </div>
                    <span>5090系列散热格窗............</span>
                    <span>红色、水冷款</span>
                </div>
 
            </div>
...

——-
over~~
后记:
记得上小学时,某日,学校请来村里老木匠,做桌椅。木匠逐个做好各种课桌的部件:桌子腿、桌面、桌洞底板,然后一个个部件拼接起来,再在接口处敲几个木削进去,一张桌子完工。老师盯着这一切,跟我们说:看到了吧,老师傅做东西就是有谱,每个部件都刚刚好,一个人轻松组装;这要是不靠谱的小年轻木匠,三五个人辅助也也不见的能拼到一起,而且拼出来桌子可能还桌腿不平摇摇晃晃
每次写页面、css,脑子里想的都是几个人辅助一起拼桌子的画面…虽然前有firebug、后有chrome的开发工具,各种页面布局,也是要反复测试才能勉强完成设计图的目标。当然,大部分时候都不能完全实现效果图,最后就彻底改成position: absolute,各种算坐标,绝对定位~~给人感觉就是:虽然呈现在眼前的貌似是一张桌子,但后面其实是各种钉子、角铁钉住、甚至胶带粘在一起的 O(∩_∩)O哈哈~
近期写小程序,再次开始搞css,发现display:flex“弹性盒模型”真的很好用,这里记个布局范式,便于以后查阅

AI谱曲与舞蹈

本文介绍两个好玩的AI工具,都是今年上半年新推出的,都是国外的的网站,趁现在不用魔法就能白嫖,有兴趣的可以试试:
第一个是AI作曲网站,suno.com,这是我用它谱的曲子,歌词是用chatgpt写的,大家可以听听效果
春之歌 >>
操作不复杂,只要在create页面,上传歌词、设定曲风就可以了
第二个是AI合成舞蹈,viggle.ai,这个用起来相对复杂一些,要选择一个舞蹈动作模版,再选一张四肢清晰的正脸照片,就可以了。这是它的官方宣传视频,

需要注意的是,一定要选正脸照片,否则AI可以能给换张脸^_^;一定要选四肢清晰的照片,不能是穿裙子之类的衣服,否则AI区分不出四肢,出来动作会很奇怪
——over
转载请注明出处: 昆仑的山头

如何给你的视频增加章节进度条

先说明一下,这篇文章讲的不是如何用代码实现mp4播放器的使用,而是讲在使用“剪映”编辑视频时,如何加入章节提示,并让其跟随视频播放进度向前走,类似下图这样

简单来说,分如下四步,我们结合剪映里的时间线来讲解:
1. 可动进度条:增加一个白场素材,拖到屏幕底端,设置合适的高度;给白场增加一个“线性蒙版”,旋转-90度、视频开始x=-960、结尾x=960,也就是撑到屏幕两端;加关键帧,使其可以显示出播放进度;降低不透明度,和源视频更贴合
2. 背景色:增加一个宽度和白场一样宽的文本框,加空格撑满;文本框“背景”里面加一个背景色,移到白场下面、降低不透明度
3. 章节分割线:增加文本框,增加“|”,调整大小、拖到章节分割位置;复制粘贴到各个段落分割位置
4. 章节说明文字:增加文本框,填写段落名称,拖到对应位置

ok,就是这样
(参考自B站:https://www.bilibili.com/video/BV1Gu4y1U7RM/?p=1&vd_source=87ddd0d31e13cad4e2c834825408fd9b)
——over
转载请注明出处: 昆仑的山头

使用GPT-SoVITS克隆声音

GPT-SoVITS是一个集模型训练、声音合成于一体的开源AI声音处理项目,项目地址:https://github.com/RVC-Boss/GPT-SoVITS,感兴趣的可以照项目主页readme里的安装方法安装。这个安装难度不高,比较麻烦的python版本的匹配,可以通过conda为其单独开安装一个python版本:conda create –name py39 python=3.9
项目安装完以后,需要到项目目录内看一下是否自动下载了模型(包括models和Weights),模型地址见readme。我这边实际测试,windows版本自动安装了模型,但mac版本的就没有自动安装模型,需要手动下载、再按要求放入指定目录
GPT-SoVITS的使用分简单和复杂两种办法,简单方法是使用项目自带模型。具体做法是,启动webui后,选择“1-GPT-SoCITS-TTS”-“1c-推理”,然后点选项目的“是否开启TTS推理WebUI”,待自动打开新页面后,选择系统的GPT模型和SoVITS模型,上传准备好的参考音频、输入参考音频文本内容,参考音频需要控制在3~10秒;然后输入要合成的文体,点击“合成语音”,但是这种合成出来效果并不好,而且容易出错,大家可以感受一下
示例音频
文本:“小草偷偷地从土地里钻出来,嫩嫩的,绿绿的。园子里,田野里,瞧去,一大片一大片满是的。坐着,躺着,打两个滚,踢几脚球,赛几趟跑,捉几回迷藏。风轻悄悄的,草软绵绵的”
合成音频
更推荐的做法,是自己训练模型,也不算复杂,首先,要先找一段3~5分钟尽量感觉干净无噪声、无背景音乐的人声音频,然后按如下步骤操作:
1. 使用“前置数据集获取工具”,在“0b-语音切分工具”内,选择音频输入输出路径后,点击“开启语音切割”,将语音切割成多个小段
2. 将上一步的分段语音输出路径,拷贝到下面的“0c-中文批量离线ASR工具”内,点击“开启离线批量ASR”,将语音自动识别为文字文本

3. 使用“0c-语音文本校对标注工具”,点击“开启打标webUI”,在新页面内校对语音文本(嫌webui不好用,可以自己找到上一步生成的opt文件,然后用自己习惯的文本编辑器修改)

4. 切换到“1-GPT-SoVITS-TTS”选项卡,在第一行输入你想要的模型名称
5. 在“1A-训练集格式化工具”内,输入切分音频.list路径,和打标opt文件路径,点击最下方“一键三连”,开始格式化进程,输出内容会放在项目路径下logs目录内


6. 切换到“1B-微调训练”,依次“开启SoVITS训练”和“开启GTP训练”,开始训练模型。这一步看电脑配置,配置低或者CPU运行的话,会很慢
模型训练完成后,重复本文开始的步骤:切换到“1C-推理”,点击“开启webui”,点击“刷新模型路径”,找到自己训练的GTP和SoVITS模型,再试一下刚才的语音,感觉音色好了不少:
但董佳耀的语音太冲,所以重新用更舒缓的语音训练了一个模型,效果还不错:
舒缓语音参考音频
舒缓语音训练结果:
——over
转载请注明出处: 昆仑的山头
———-
一周后补充:
“鄙视小帅、理解小帅、曾经小帅”
比较了GPT-SoVITS,和其他渠道的音频合成效果,最终还是选择了自己曾经鄙视的“解说小帅”,理由很简单:清晰! O(∩_∩)O哈哈~