Skip to content

评测指标

1.语音质量

1.1 Perceptual Evaluation of Speech Quality (PESQ)

语音质量感知评价(Perceptual Evaluation of Speech Quality)用于测量语音质量的主观感知质量,可以评估增强语音的清晰度、自然度和噪声抑制方面的性能。它通过模拟人类听觉系统的特点,将增强后的语音与参考语音进行比较,从而预测增强后语音的主观意见得分。PESQ是一个介于-0.5到4.5之间的值,值越高,表示语音质量越好,语音增强模型的性能越好。

1.2 Short Time Objective Intelligibility (STOI)

短时客观可懂度(Short Time Objective Intelligibility)是一个人为设计的客观评估指标,主要关注语音的清晰度和可辨识度。STOI基于短时频谱包络的相似度,通过比较增强后的语音和参考语音之间的时域相似性,来估计语音的可懂性。STOI是一个介于0到100的值,值越接近100,表示语音可懂度更好,语音增强模型的性能越好。