文本转语音错误

导入音频后,转换结果只有开头一部分正确,后面就对不上了

可以说明一下具体情况吗?
用的是哪个引擎?本地的还是 Azure?

音频是什么样的音频?纯语音的,还是有其他声音(音乐、背景音这些)。

对不上是怎么对不上?文本不对,还是时间轴对不上?

本地和Azure,都试过。
在B站上下载的动画视频,有背景音乐。
我又试了几个,时间轴对不上,还有大段缺失的文本

影视作品这些目前确实比较难做得准确。建议去网上找找有没有字幕可以下载,.srt 格式的,然后在 Enjoy 里上传进行对齐。

1 个赞