题目:判断题 VALL-E利用离散编码技术将连续的语音特征表示转换为离散标记(token), 从而利用类似语言模型的next-token prediction机制实现语音合成。VALL-E是一个Decoder-only的语音语言模型。
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。