导入音频后,转换结果只有开头一部分正确,后面就对不上了
可以说明一下具体情况吗? 用的是哪个引擎?本地的还是 Azure?
音频是什么样的音频?纯语音的,还是有其他声音(音乐、背景音这些)。
对不上是怎么对不上?文本不对,还是时间轴对不上?
本地和Azure,都试过。 在B站上下载的动画视频,有背景音乐。 我又试了几个,时间轴对不上,还有大段缺失的文本
影视作品这些目前确实比较难做得准确。建议去网上找找有没有字幕可以下载,.srt 格式的,然后在 Enjoy 里上传进行对齐。