- 受到原bilibili视频启发,打算自己动手训练tts模型,但无法解决依赖问题,故寻找新的解决方案
本项目没有任何优化升级,单纯的解决依赖问题。原demo只是将代码风格优化,并修改了几个接口
- 测试平台为linux+n卡,windows由于无本地环境无法测试。
(没有显卡,全靠白嫖) - 基本环境 conda + python3.9
只针对Tacotron2的问题, vecoder部分未处理
- 解决原仓库版本依赖问题,基于nvidia_demo_repo修改而成,具体修改细节可以参考commit。
- 兼容原仓库训练模型,方便迁移学习
本项目tacotron2通过命令行参数和默认命令行参数完成模型hparam设定,args_parser只暴露了一部分接口,其余接口可自行参考源码添加
- 在dependency目录安装依赖,详细请参考install.sh
- 在items目录运行train.py程序开始训练,运行命令可参考my_scripts,official_scripts和note_books进行设置
- infer同理
基于 @CjangCjengh Ayachi Nene model2 进行迁移训练 cleanner: japanese_tokenization_cleaners
提示:迁移学习最好保证text_cleanner一致获取最大效果
用google colab打开本仓库中my_notebooks文件夹下的的notebook
本项目仅供参考学习使用, 请尊重原作品的版权。不滥用数据集和训练成果,本仓库不会承担相关责任。
- 在issue中报告项目接口相关的bug或者实用的功能(本人非深度学习研究者,只能解决软件工程方面的问题,原理问题请另请dalao)
- 欢迎pull request, 请简要说明功能。
- 用邀请链接注册一下中国移动九天·毕昇计算平台,
帮作者贡献一点算力
这是作者能嫖到的最高算力 8核32G +1V100, 没有充值方式, 靠拉人注册获取算力豆租借服务
- 网络诡异, 磁盘速度诡异,系统诡异,需要有折腾的准备
- 教作者提取saga社的数据集(
他家项目文件命名太不规范了)
联系邮箱 [email protected]
- 感谢dalao @CjangCjengh 提供的text_cleanners,pretrained model,和一个 good begin
- 感谢dalao @luoyi 训练的hifigan模型,以及如何调用hifigan的源码
本项目采用 GNU GPLv2