#quality
共 2 篇相关内容 · 安全漏洞、AI动态、技术文章
技术文章 2
PASQA:专攻日语语音重音正确性的质量评估新范式
日本LY Corporation团队提出PASQA模型,专攻语音合成中日语声调重音的正确性评估。该模型基于自监督学习框架wav2vec 2.0,融合音节信息、排序损失、帧级错误检测和说话人不变训练四大策略。实验表明,传统MOS预测模型对重音错误的排序准确率仅13%至20%,而PASQA达到75%以上,与人类判断的相关系数达0.828,为TTS系统的精细质量评估开辟了全新路径。
PASQA:专注语音重音正确性的质量评估新方法
日本雅虎LY公司团队提出PASQA模型,专门评估语音合成中日语声调重音的正确性。该模型基于自监督学习框架wav2vec 2.0,融合音节信息、排序损失、帧级错误检测和说话人不变训练四大策略。实验证明,传统MOS预测模型对重音错误完全不敏感,而PASQA在排序准确率和人类判断一致性上均大幅领先,为TTS系统的精细质量评估开辟了新路径。