#assessment
共 9 篇相关内容 · 安全漏洞、AI动态、技术文章
技术文章 9
PASQA:专攻日语语音重音正确性的质量评估新范式
日本LY Corporation团队提出PASQA模型,专攻语音合成中日语声调重音的正确性评估。该模型基于自监督学习框架wav2vec 2.0,融合音节信息、排序损失、帧级错误检测和说话人不变训练四大策略。实验表明,传统MOS预测模型对重音错误的排序准确率仅13%至20%,而PASQA达到75%以上,与人类判断的相关系数达0.828,为TTS系统的精细质量评估开辟了全新路径。
PASQA:专注语音重音正确性的质量评估新方法
日本雅虎LY公司团队提出PASQA模型,专门评估语音合成中日语声调重音的正确性。该模型基于自监督学习框架wav2vec 2.0,融合音节信息、排序损失、帧级错误检测和说话人不变训练四大策略。实验证明,传统MOS预测模型对重音错误完全不敏感,而PASQA在排序准确率和人类判断一致性上均大幅领先,为TTS系统的精细质量评估开辟了新路径。
PASQA:专注重音质量评估的语音评估新模型——用合成语音训练出听感黄金耳朵
PASQA是首个专门针对重音正确性的语音质量评估模型。现有MOS预测模型对重音错误不敏感,而PASQA利用重音可控TTS合成训练数据,结合音节条件融合、排序损失、辅助错误定位和说话人不变训练四大技术,实现了高精度的重音质量评估,已被INTERSPEECH 2026接收。
PASQA:专攻声调重音的语音质量评估模型——让AI也能听出「味噌汤里放错了盐」
现有的语音质量评估模型对声调重音错误视而不见。PASQA用合成语音制造可控的声调错误来训练模型,让模型学会像日语母语者一样敏锐地捕捉重音位置偏差。该模型结合音拍条件融合、排序损失、辅助错误定位和说话人不变训练等多项技术,已被INTERSPEECH 2026接收。
PASQA:专攻声调重音的语音质量评估模型——让AI也能听出「味噌汤里放错了盐」
现有的语音质量评估模型对声调重音错误视而不见。PASQA用合成语音制造可控的声调错误来训练模型,让模型学会像日语母语者一样敏锐地捕捉重音位置偏差。该模型结合音拍条件融合、排序损失、辅助错误定位和说话人不变训练等多项技术,已被INTERSPEECH 2026接收。
PASQA:专攻日语声调重音的语音质量评估模型
东京大学与LINE联合研究团队提出PASQA,首个专门针对声调重音(pitch-accent)正确性的语音质量评估模型。该模型基于自监督语音表示,结合音拍条件融合、排序损失和重音错误定位任务,在日语合成语音上实现了对重音错误的精准检测,远超传统MOS预测模型。论文已被INTERSPEECH 2026接收。
PASQA:专攻日语声调重音的语音质量评估模型
东京大学与LINE联合研究团队提出PASQA,首个专门针对声调重音(pitch-accent)正确性的语音质量评估模型。该模型基于自监督语音表示,结合音拍条件融合、排序损失和重音错误定位任务,在日语合成语音上实现了对重音错误的精准检测,远超传统MOS预测模型。论文已被INTERSPEECH 2026接收。
PASQA:聚焦音高重音的语音质量评估模型——用合成语音训练出"重音听诊器"
日本LY Corporation团队提出PASQA模型,专门评估日语语音合成中的音高重音正确性。该模型通过可控TTS系统构建大规模重音错误数据集,结合自监督学习、音拍条件融合、排序损失和说话人不变训练等四项创新,在重音质量排序准确率和与人类判断的一致性上均显著超越传统MOS预测模型,并在域外GPT-4o-mini-TTS系统上保持鲁棒性能。
PASQA:面向音高重音的语音质量评估模型——用合成语音训练出人类级别的重音判断能力
PASQA提出了一种专门针对音高重音正确性的语音质量评估模型。通过使用可控制重音的TTS系统构造带有重音错误的合成语音数据集,并结合音节条件融合、排序损失、重音错误定位辅助任务和说话人不变训练等技术,PASQA在重音正确性判断上显著超越了传统MOS预测模型,被Interspeech 2026接收。