Skip to content

v2.2 Clap-Enhanced prompt audio generation

Compare
Choose a tag to compare
@Stardust-minus Stardust-minus released this 12 Dec 11:35
· 131 commits to master since this release
eaefc57

本次更新主要内容如下:
1.修正了commons.py中slicer存在的bug,彻底解决卡死问题,并有提速。(PR By @OedoSoldier
2.Emotion 模型换用CLAP多模态模型,推理支持输入text prompt引导风格化进行合成。
3.借鉴vq-vae对CLAP做vq,同时对clap vec概率置空,防止过拟合。(PR By @OedoSoldier
4.推理&训练时未使用到的其他语种bert不再置空,而是使用rand。(PR By @OedoSoldier
5.新增预处理webuI.
6.preprocess_text阶段不再选择val_per_spk,换用val_per_lang(uage)
底模和CLAP模型已上传openi。
Bert-VITS2开发组
敬上

Base model: