免费

GPT-SoVITS-AI语音克隆你只需要几步

 

语音克隆,这一神秘而又引人入胜的技术,正以前所未有的速度崭露头角。无论是想要在数字世界中复制自己的声音,还是渴望重听逝去亲人的话语,语音克隆都为我们打开了一扇通往声音世界的新门径;遵循白嫖免费的原则,本期还是使用开源项目
 
使用的是目前比较流行的AI语音克隆工具-GPT-SoVITS,无论你是折腾侠,还是技术小白,本文Jay同学将用最简单的语言和图文教程教会你,只需要10步快速入门这款开源项目,在开始之前,先试听一下Jay利用周杰伦的素材训练出来的成果:试听地址:AI语音克隆:模仿任何人你只需要几步 (qq.com)

项目介绍

  • GPT-SoVITS
由RVC创始人RVC-Boss与AI声音转换技术专家Rcell共同开发的一款跨语言TTS克隆项目,这个项目被称为“最强大中文声音克隆项目”,它可以实现零样本和少样本的语音克隆,以及跨语言的文本到语音转换。它具有数据量少、质量高、灵活性强、易用性高等优点,可以应用于多种场景;自上线以来,截至目前github上的Stars数已达到9.4K
少样本语音克隆:只需1分钟的训练数据,就可以对模型进行微调,提高语音的相似性和真实感。只需几步操作,就可以创建自己的TTS模型
 
跨语言支持:可以在不同于训练数据集的语言中进行推理,目前支持英语、日语和中文。可以实现多语言的语音合成和翻译
WebUI工具:集成了语音伴奏分离、自动训练集分割、中文ASR和文本标注等工具,帮助初学者创建训练数据集和GPT/SoVITS模型

准备工作

一台电脑,CPU无太高要求,显卡有条件请选择4060+6G以上,当然Jay用的4G+4050同样成功训练,就是中途一直报错,需要不断调整训练参数;如果配置不够或者想要更好的训练效果,可以租用云服务器云端部署训练,这里不作为本期重点,自行搜索教程
项目地址:
https://github.com/RVC-Boss/GPT-SoVITS
官方教程:
https://www.bilibili.com/video/BV12g4y1m7Uw/
官方文档:
https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
云端训练:
https://www.bilibili.com/video/BV1sg4y127GD?t=12.0
如果访问Github有困难,可以使用作者发布的备用地址:
https://www.icloud.com.cn/iclouddrive/056y_Xog_HXpALuVUjscIwTtg#GPT-SoVITS_Models
Jay原创图文教程:AI语音克隆:模仿任何人你只需要几步 (qq.com)
 

注意事项

如果没有出现模型文件,说明你训练失败,训练成功的以下两个目录会出现对应模型文件;还有一种情况就是界面显示训练结束,但是没有模型文件,依然属于训练失败,可以查看一下运行端口界面提示的报错,如果通过调上面的参数还是不行,说明配置是真的不行了
语音合成中需要强调,如果合成效果不行,尝试多点击几次合成语音,每次合成的效果都会有较大差别