Release v2.2 Clap-Enhanced prompt audio generation · fishaudio/Bert-VITS2

本次更新主要内容如下：
1.修正了commons.py中slicer存在的bug，彻底解决卡死问题，并有提速。（PR By @OedoSoldier ）
2.Emotion 模型换用CLAP多模态模型，推理支持输入text prompt引导风格化进行合成。
3.借鉴vq-vae对CLAP做vq，同时对clap vec概率置空，防止过拟合。（PR By @OedoSoldier ）
4.推理&训练时未使用到的其他语种bert不再置空，而是使用rand。（PR By @OedoSoldier ）
5.新增预处理webuI.
6.preprocess_text阶段不再选择val_per_spk,换用val_per_lang(uage)
底模和CLAP模型已上传openi。
Bert-VITS2开发组
敬上

Base model:

OpenI: https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/show_model
Hugging Face: https://huggingface.co/OedoSoldier/Bert-VITS2-2.2-CLAP

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

v2.2 Clap-Enhanced prompt audio generation

Contributors