昆仑的山头

Monthly Archives: 5 月 2024

如何给你的视频增加章节进度条

2024 年 05 月 31 日 – 上午 10:06

先说明一下，这篇文章讲的不是如何用代码实现mp4播放器的使用，而是讲在使用“剪映”编辑视频时，如何加入章节提示，并让其跟随视频播放进度向前走，类似下图这样

简单来说，分如下四步，我们结合剪映里的时间线来讲解：
1. 可动进度条：增加一个白场素材，拖到屏幕底端，设置合适的高度；给白场增加一个“线性蒙版”，旋转-90度、视频开始x=-960、结尾x=960，也就是撑到屏幕两端；加关键帧，使其可以显示出播放进度；降低不透明度，和源视频更贴合
2. 背景色：增加一个宽度和白场一样宽的文本框，加空格撑满；文本框“背景”里面加一个背景色，移到白场下面、降低不透明度
3. 章节分割线：增加文本框，增加“|”，调整大小、拖到章节分割位置；复制粘贴到各个段落分割位置
4. 章节说明文字：增加文本框，填写段落名称，拖到对应位置

ok，就是这样
（参考自B站：https://www.bilibili.com/video/BV1Gu4y1U7RM/?p=1&vd_source=87ddd0d31e13cad4e2c834825408fd9b）
——over
转载请注明出处: 昆仑的山头

Tags 做视频 | Permalink | Comment (0)

使用GPT-SoVITS克隆声音

2024 年 05 月 21 日 – 上午 5:20

GPT-SoVITS是一个集模型训练、声音合成于一体的开源AI声音处理项目，项目地址：https://github.com/RVC-Boss/GPT-SoVITS，感兴趣的可以照项目主页readme里的安装方法安装。这个安装难度不高，比较麻烦的python版本的匹配，可以通过conda为其单独开安装一个python版本：conda create –name py39 python=3.9
项目安装完以后，需要到项目目录内看一下是否自动下载了模型（包括models和Weights），模型地址见readme。我这边实际测试，windows版本自动安装了模型，但mac版本的就没有自动安装模型，需要手动下载、再按要求放入指定目录
GPT-SoVITS的使用分简单和复杂两种办法，简单方法是使用项目自带模型。具体做法是，启动webui后，选择“1-GPT-SoCITS-TTS”-“1c-推理”，然后点选项目的“是否开启TTS推理WebUI”，待自动打开新页面后，选择系统的GPT模型和SoVITS模型，上传准备好的参考音频、输入参考音频文本内容，参考音频需要控制在3~10秒；然后输入要合成的文体，点击“合成语音”，但是这种合成出来效果并不好，而且容易出错，大家可以感受一下
示例音频
文本：“小草偷偷地从土地里钻出来，嫩嫩的，绿绿的。园子里，田野里，瞧去，一大片一大片满是的。坐着，躺着，打两个滚，踢几脚球，赛几趟跑，捉几回迷藏。风轻悄悄的，草软绵绵的”
合成音频
更推荐的做法，是自己训练模型，也不算复杂，首先，要先找一段3~5分钟尽量感觉干净无噪声、无背景音乐的人声音频，然后按如下步骤操作：
1. 使用“前置数据集获取工具”，在“0b-语音切分工具”内，选择音频输入输出路径后，点击“开启语音切割”，将语音切割成多个小段
2. 将上一步的分段语音输出路径，拷贝到下面的“0c-中文批量离线ASR工具”内，点击“开启离线批量ASR”，将语音自动识别为文字文本

3. 使用“0c-语音文本校对标注工具”，点击“开启打标webUI”，在新页面内校对语音文本（嫌webui不好用，可以自己找到上一步生成的opt文件，然后用自己习惯的文本编辑器修改）

4. 切换到“1-GPT-SoVITS-TTS”选项卡，在第一行输入你想要的模型名称
5. 在“1A-训练集格式化工具”内，输入切分音频.list路径，和打标opt文件路径，点击最下方“一键三连”，开始格式化进程，输出内容会放在项目路径下logs目录内


6. 切换到“1B-微调训练”，依次“开启SoVITS训练”和“开启GTP训练”，开始训练模型。这一步看电脑配置，配置低或者CPU运行的话，会很慢
模型训练完成后，重复本文开始的步骤：切换到“1C-推理”，点击“开启webui”，点击“刷新模型路径”，找到自己训练的GTP和SoVITS模型，再试一下刚才的语音，感觉音色好了不少：
但董佳耀的语音太冲，所以重新用更舒缓的语音训练了一个模型，效果还不错：
舒缓语音参考音频
舒缓语音训练结果：
——over
转载请注明出处: 昆仑的山头
———-
一周后补充：
“鄙视小帅、理解小帅、曾经小帅”
比较了GPT-SoVITS，和其他渠道的音频合成效果，最终还是选择了自己曾经鄙视的“解说小帅”，理由很简单：清晰！ O(∩_∩)O哈哈~