quality 相关技术文章与安全漏洞汇总

技术文章 2

PASQA：专攻日语语音重音正确性的质量评估新范式

日本LY Corporation团队提出PASQA模型，专攻语音合成中日语声调重音的正确性评估。该模型基于自监督学习框架wav2vec 2.0，融合音节信息、排序损失、帧级错误检测和说话人不变训练四大策略。实验表明，传统MOS预测模型对重音错误的排序准确率仅13%至20%，而PASQA达到75%以上，与人类判断的相关系数达0.828，为TTS系统的精细质量评估开辟了全新路径。

PASQA：专注语音重音正确性的质量评估新方法

日本雅虎LY公司团队提出PASQA模型，专门评估语音合成中日语声调重音的正确性。该模型基于自监督学习框架wav2vec 2.0，融合音节信息、排序损失、帧级错误检测和说话人不变训练四大策略。实验证明，传统MOS预测模型对重音错误完全不敏感，而PASQA在排序准确率和人类判断一致性上均大幅领先，为TTS系统的精细质量评估开辟了新路径。