一种音质评估方法、装置和设备与流程

2021-01-28 12:01:07|

301|

起点商标网

本申请涉及音频音质评估
技术领域：
，特别涉及一种音质评估方法、装置和设备。
背景技术：
：目前，在有参考音质评估领域，pesq(即perceptualevaluationofspeechquality，语音质量感知评估)方法被广泛应用，但是pesq方法通常针对的是voip(voiceoverinternetprotocol，基于ip的语音传输)网络通信，主要评估音频信号在网络传输过程中由于丢帧，抖动等影响带来的时间不对齐，频谱失真等问题。pesq方法由于内部会迭代多次的对齐处理，以及参数过滤算法流程复杂，评估一段音频信号音质耗时较长，并且，pesq处理采样频段有限，采样率在16khz以内，难以满足频段较宽的信号的评估需求。综上，在实现本发明过程中，发明人发现现有技术中至少存在音质评估速度较慢，采样率的选取上存在局限性的问题。技术实现要素：有鉴于此，本申请的目的在于提供一种音质评估方法、装置和设备，能够降低音质评估算法的复杂度，从而提升音质评估的速度，并且对音频采样率无要求。其具体方案如下：第一方面，本申请公开了一种音质评估方法，包括：在标准音频的播放过程中进行录音，以得到待评估信号；确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图；确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号；确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。可选的，所述确定所述第一语谱图与所述第二语谱图之间的图像相似度，包括：分别对所述第一语谱图和所述第二语谱图进行图像增强处理，以得到所述第一语谱图对应的第一增强图像以及所述第二语谱图对应的第二增强图像；确定所述第一增强图像与所述第二增强图像之间的图像相似度。可选的，所述分别对所述第一语谱图和所述第二语谱图进行图像增强处理，包括：分别对所述第一语谱图和所述第二语谱图进行锐化处理。相应的，所述确定所述第一增强图像与所述第二增强图像之间的图像相似度，包括：计算所述第一增强图像与所述第二增强图像之间的余弦相似度。可选的，所述分别对所述第一语谱图和所述第二语谱图进行图像增强处理，包括：分别对所述第一语谱图和所述第二语谱图进行边缘检测处理。相应的，所述确定所述第一增强图像与所述第二增强图像之间的图像相似度，包括：计算所述第一增强图像与所述第二增强图像之间的汉明距离或余弦相似度。可选的，所述确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图；确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图之前，还包括：剔除所述待评估信号和所述参考信号中的静音片段。可选的，所述剔除所述待评估信号和所述参考信号中的静音片段，包括：确定所述待评估信号对应的第一对数功率谱以及所述参考信号对应的第二对数功率谱；将所述第一对数功率谱中分贝值小于预设阈值的片段确定为第一静音片段；将所述第二对数功率谱中分贝值小于所述预设阈值的片段确定为第二静音片段；剔除所述待评估信号的所述第一静音片段以及所述参考信号中的所述第二静音片段。可选的，所述在标准音频的播放过程中进行录音，以得到待评估信号之后，还包括：分别对所述待评估信号和所述参考信号进行归一化处理。可选的，所述音质评估方法，还包括：基于掩蔽效应对所述第一功率谱和所述第二功率谱进行优化处理。第二方面，本申请公开了一种音质评估装置，包括：待评估信号获取模块，用于在标准音频的播放过程中进行录音，以得到待评估信号；第一语谱图获取模块，用于确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图；第二语谱图获取模块，用于确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号；音质评分确定模块，用于确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。第三方面，本申请公开了一种电子设备，包括：存储器，用于保存计算机程序；处理器，用于执行所述计算机程序，以实现前述的音质评估方法。第四方面，本申请公开了一种计算机可读存储介质，用于保存计算机程序，所述计算机程序被处理器执行时实现前述的音质评估方法。可见，本申请先在标准音频的播放过程中进行录音，以得到待评估信号，然后确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图，以及确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号，之后确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。也即，本申请以确定图像相似度的方式确定待评估信号和参考信号临界频带上的功率谱之间的相似度，得到待评估信号的音质评分，这样，能够降低音质评估算法的复杂度，从而提升音质评估的速度，并且对音频采样率无要求。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。图1为本申请公开的音质评估方案所适用的系统框架示意图；图2为本申请公开的一种音质评估方法流程图；图3为本申请公开的一种具体的音质评估方法流程图；图4为本申请公开的一种具体的音质评估方法流程图；图5为本申请公开的一种质量较高的待评估信号与参考信号在临界频带上的功率谱比对以及相似度分布示意图；图6为本申请公开的一种质量较低的待评估信号与参考信号在临界频带上的功率谱比对以及相似度分布示意图；图7为本申请公开的一种具体的音质评估方法流程图；图8为本申请公开的一种具体的音质评分相关度测试比对示意图；图9为本申请公开的一种音质评估装置结构示意图；图10为本申请公开的一种电子设备结构图。具体实施方式下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。目前，在有参考音质评估领域，pesq方法被广泛应用，但是pesq方法通常针对的是voip网络通信，主要评估音频信号在网络传输过程中由于丢帧，抖动等影响带来的时间不对齐，频谱失真等问题。pesq方法由于内部会迭代多次的对齐处理，以及参数过滤算法流程复杂，评估一段音频信号音质耗时较长，并且，pesq处理采样频段有限，采样率在16khz以内，难以满足频段较宽的信号的评估需求。为此，本申请提供了一种音质评估方案，能够降低音质评估算法的复杂度，从而提升音质评估的速度，并且对音频采样率无要求。本申请的音质评估方案中，采用的系统框架具体可以参见图1所示，具体可以包括：后台服务器和与后台服务器建立通信连接的若干数量的拾音设备。其中，拾音设备包括但不限于平板电脑、笔记本电脑、智能手机、个人电脑(personalcomputer，pc)或者其他专业设备，此处不做限定。本申请中，在录音棚中利用拾音设备在标准音频的播放过程中进行录音，以得到待评估信号，然后将得到的待评估信号传输至服务器，服务器执行的步骤包括：确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图；确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号；确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。其中，标准音频采用专业播放设备进行播放，并且，标准音频为预先在录音棚中通过专业录音设备录制得到音频。在另外一些具体的实施方式中，拾音设备在得到待评估信号后，可以在本地确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图，确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号；确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。本申请提供的音质评估方法可以具体应用于拾音设备的录音系统评估场景，可以将得到的音质评分作为评价指标，以评估拾音设备的录音系统的性能。参见图2所示，本申请公开了一种音质评估方法，包括：步骤s11：在标准音频的播放过程中进行录音，以得到待评估信号。步骤s12：确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图。步骤s13：确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号。在具体的实施方式中，获取到待评估信号之后，先分别对所述待评估信号和参考信号进行归一化处理，以将待评估信号和参考信号处理到同一量级上进行比较，采用的归一化公式可以为：其中，x(i)表示归一化处理前的信号，x(i)'表示归一化处理后的信号，i表示整段信号的样点索引，从0开始取值，直到信号结尾。进一步的，分别对待评估信号和参考信号进行stft(即short-timefouriertransform，短时傅里叶变换)以将待评估信号和参考信号转换到频域，计算待评估信号的第一信号功率谱以及参考信号的第二信号功率谱。具体的，可以以帧长20ms，帧移10ms，添加窗函数做stft变换，定义最长帧移为10ms。对信号加窗截断时窗函数w(m)长度t＝20ms。可以选用hann(海宁)窗或hamming(汉明)窗。通过stft将每个分析帧信号转换到频域，采用的公式为：其中，x(k,n)表示第k个频点第n帧的信号频谱。w(m)表示窗函数，表示傅里叶变换，xn(m)表示第n帧信号序列，m表示帧内样点索引，取值范围：m∈[0,n-1]，n表示信号帧长。然后分别计算待评估信号的第一信号功率谱以及参考信号的第二信号功率谱，采用的公式如下：p(k,n)＝|x(k,n)|2；进一步的，分别将第一信号功率谱和第二信号功率谱映射到bark域，确定第一信号功率谱对应的临界频带以及第二信号功率谱对应的临界频带，然后确定待评估信号在临界频带上的第一功率谱以及参考信号在临界频带上的第二功率谱。具体的，可以定义临界频带(bark域)变量z与频率变量f之间的对应公式如下：将[80,16k]hz频段上信号在bark域以bark宽δz＝1.6分频段，得到多段临界频带，若采样率不足32khz时，使用最大带宽fs(采样率)/2作为频段上限进行bark域映射。然后计算各个临界频带对应的频率(f)，bark(z)，以及频带上下限和中心频率。然后将频带上下限和中心频率映射回频域，在频域计算每段临界频带的功率谱：其中，pb(j,n)表示第n帧第j段临界频带的功率；px(k,n)表示第n帧第k个频点功率；il(j),iu(j)分别表示第j段临界频带的下限及上限频点。这样，计算出待评估信号在临界频带上的第一功率谱，以及参考信号在临界频带上的第二功率谱，分别将第一功率谱和第二功率谱转换为对数功率谱，然后生成对数功率谱对应的图像，以得到第一语谱图和第二语谱图。另外，在一些实施例中，可以基于掩蔽效应对所述第一功率谱和所述第二功率谱进行优化处理。可以利用听觉系统特点，模拟人耳对不同频率的敏感度，基于频谱时频掩蔽特性对待评估信号和参考信号在临界频带上的功率谱进行进一步的优化处理，从而能够更好地模拟听觉感知特性，提升最终评分结果的准确度。步骤s14：确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。可见，本申请实施例先在标准音频的播放过程中进行录音，以得到待评估信号，然后确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图，以及确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号，之后确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。也即，本申请实施例以确定图像相似度的方式确定待评估信号和参考信号临界频带上的功率谱之间的相似度，得到待评估信号的音质评分，这样，能够降低音质评估算法的复杂度，从而提升音质评估的速度，并且对音频采样率无要求。参见图3所示，本申请实施例公开了一种具体的音质评估方法，包括：步骤s21：在标准音频的播放过程中进行录音，以得到待评估信号。步骤s22：剔除所述待评估信号和参考信号中的静音片段。在具体的实施方式中，本实施例可以确定所述待评估信号对应的第一对数功率谱以及所述参考信号对应的第二对数功率谱；将所述第一对数功率谱中分贝值小于预设阈值的片段确定为第一静音片段；将所述第二对数功率谱中分贝值小于所述预设阈值的片段确定为第二静音片段；剔除所述待评估信号的所述第一静音片段以及所述参考信号中的所述第二静音片段。具体的，可以分别基于第一信号功率谱和第二信号功率谱计算所述第一对数功率谱以及第二对数功率谱，将功率转换为分贝值。其中，关于所述第一信号功率谱和第二信号功率谱的计算过程可以参考前述实施例公开的内容，在此不再进行赘述。在具体的实施方式中，可以分别基于第一信号功率谱和第二信号功率谱计算待评估信号以及参考信号各帧信号的功率，采用的公式如下：其中，k表示频点总数。进一步的，计算出第一对数功率谱以及第二对数功率谱，采用的公式如下：并且，本实施例可以基于确定所述预设阈值，若pdb(n)＜pdbthr，则将对应的帧确定为静音帧，从对应的第一信号功率谱或第二信号功率谱中剔除。步骤s23：确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图。步骤s24：确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号。步骤s25：确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。可见，本实施例可以基于信号的对数功率谱，将待评估信号和参考信号中的静音片段剔除，这样，能够防止静音段对当前音质评估的干扰，从而提升音质评估的鲁棒性。参见图4所示，本申请实施例公开了一种具体的音质评估方法，包括：步骤s31：在标准音频的播放过程中进行录音，以得到待评估信号。步骤s32：确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图。步骤s33：确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号。步骤s34：分别对所述第一语谱图和所述第二语谱图进行图像增强处理，以得到所述第一语谱图对应的第一增强图像以及所述第二语谱图对应的第二增强图像。步骤s35：确定所述第一增强图像与所述第二增强图像之间的图像相似度。在一种具体的实施方式中，可以分别对所述第一语谱图和所述第二语谱图进行锐化处理，然后计算所述第一增强图像与所述第二增强图像之间的余弦相似度。具体的，可以利用锐化卷积核分别对第一语谱图和第二语谱图进行卷积处理，以实现对第一语谱图和第二语谱图的锐化。比如，利用3阶拉普拉斯锐化矩阵分别对第一语谱图和第二语谱图做二维卷积，得到锐化后的第一语谱图和第二语谱图。三阶拉普拉斯锐化矩阵如下：二维卷积表示如下：其中，spb(j,n)表示第n帧第j个临界频带锐化处理后的对数功率谱，m1,m2分别表示卷积核的行数和列数，本实施例中，m1＝m2＝3。进一步的，本实施例可以计算第一增强图像和第二增强图像中每帧信号的余弦相似度，然后取均值得到待评估信号的音质评分。其中，余弦相似度采用如下公式计算：其中，sim(n)表示第n帧信号的余弦相似度，表示参考信号第n帧第j个临界频带锐化处理后的功率谱，表示待评估第n帧第j个临界频带锐化处理后的功率谱，j表示临界频带个数。然后将各帧相似度的均值确定为最终的相似度结果，即待评估信号的音质评分：其中，n表示信号的帧数，即信号长度。参见图5所示，本申请实施例公开了一种质量较高的待评估信号与参考信号在临界频带上的功率谱比对以及相似度分布示意图。待评估信号与参考信号相似度为0.86。参见图6所示，本申请实施例公开了一种质量较低的待评估信号与参考信号在临界频带上的功率谱比对以及相似度分布示意图。待评估信号与参考信号相似度为0.36。并且，在对语谱图进行锐化处理时，对于卷积核函数的选取，不局限于前述拉普拉斯微分矩阵，在一些实施例中，可以通过改变锐化矩阵，提升评分准确度。比如，改变矩阵的形状，可以不是方阵，或者替换为其他的二维微分矩阵。在另外一种具体的实施方式中，可以分别对所述第一语谱图和所述第二语谱图进行边缘检测处理，然后计算所述第一增强图像与所述第二增强图像之间的汉明距离或余弦相似度。也即，本实施例可以采用边缘检测的方式，得到二值分布的边缘矩阵，可以计算汉明距离或者余弦相似度，以计算出待评估信号和参考信号的相似度，得到更具鲁棒性的音质评分结果。例如，参见图7所示，图7为本申请实施例公开的一种具体的音质评估方法流程图。对待评估信号和参考信号进行预处理，包括归一化处理和短时傅里叶变换，确定待评估信号在临界频带上的第一功率谱以得到第一语谱图，以及确定参考信号在临界频带上的第二功率谱以得到第二语谱图，然后进行语谱图增强处理，最后进行图像相似度计算，以得到待评估信号的音质评分，音质评分为[0,1]之间的值。可见，本申请实施例通过对分别对第一语谱图和第二语谱图进行图像增强处理，具体的增强方式可以为锐化处理或边缘检测，然后计算增强处理后的语谱图之间的图像相似度，以得到所述待评估信号的音质评分。能够最大程度的对比待评估信号和参考信号临界频带上功率谱的分布特点，提取信号的主要特征信息，从而提升音质评估结果的准确性。进一步的，对本申请提供的音质评估方案进行测试，可以将采样率为44100hz的161句歌唱短句作为参考信号，将这些参考信号进行不同程度带噪、畸变音频处理后得到对应的待评估信号，分别利用本申请的音质评估方案以及pesq方法计算待评估信号的音质评分，并对pesq方法得到的评分结果做归一化后，进行对比分析。在具体的实施方式中，本申请的音质评估方案可以具体包括：分别对待评估信号和参考信号进行归一化处理，然后通过短时傅里叶变换将待评估信号和参考信号转到频域，确定待评估信号对应的第一信号功率以及参考信号对应的第二信号功率谱，分别剔除第一信号功率谱以及第二信号功率谱中的静音片段，然后将第一信号功率谱和第二信号功率谱映射到bark域，确定待评估信号在临界频带上的第一功率谱以得到第一语谱图，以及确定参考信号在临界频带上的第二功率谱以得到第二语谱图，分别对第一语谱图和第二语谱图进行锐化处理，以得到第一语谱图对应的第一增强图像以及第二语谱图对应的第二增强图像，计算所述第一增强图像与所述第二增强图像之间的余弦相似度，以得到所述待评估信号的音质评分。具体的，可以利用ppc(即pearsonproduct-momentcorrelationcoefficient，皮尔森相关系数)以及rmse(即rootmeansquarederror，均方误差根)来衡量客观评分与主观评分的相关程度。其中，ppc计算公式如下：n表示样本数，ms(i)、mo(i)分别为第i个样本的主观评分即人工打分结果和客观评分即通过算法得到的评分结果。分别为主观评分和客观评分对应的均值。pcc反应两者之间的线性相关程度的强弱，该值越接近1，说明客观评估结果越准确。rmse反映的是客观评分与主观评分之间的偏差。公式表示如下：参见图8所示，图8为本申请实施例公开的一种具体的音质评分相关度测试比对示意图。参见表一所示，表一为分别利用本申请的音质评估方案以及pesq方法计算待评估信号的音质评分得到的主观评分和客观评分相似度统计结果。表一pccrmsepesq0.9081360.566783本申请方案0.8879530.138133由上表可见：本申请方案得到的客观评分与主观评分与pesq相比pcc一致性虽然略弱，但rmse更优。参见表二所示，表二为同样执行161句音频评分，在i7处理器，4.2ghz主频的机器上运行，本申请方案与pesq的耗时。表二由此可见，本申请方案相比pesq耗时明显降低很多，相对pesq降低4.6倍左右，也即，本申请方案显著的提升了音质评分的效率。下面以某个拾音设备的录音系统评估过程为例，对本申请中的技术方案进行说明。在录音棚中，通过监听音箱或者人工嘴播放标准音频《老街》，在标准音频的播放过程中录音，以得到待评估信号，然后分别将待评估信号和对标准音频采样得到的参考信号进行归一化处理，之后通过短时傅里叶变换将待评估信号和参考信号转到频域，确定待评估信号对应的第一信号功率以及参考信号对应的第二信号功率谱，分别剔除第一信号功率谱以及第二信号功率谱中的静音片段，然后将第一信号功率谱和第二信号功率谱映射到bark域，确定待评估信号在临界频带上的第一功率谱以得到第一语谱图，以及确定参考信号在临界频带上的第二功率谱以得到第二语谱图，分别对第一语谱图和第二语谱图进行锐化处理，以得到第一语谱图对应的第一增强图像以及第二语谱图对应的第二增强图像，计算所述第一增强图像与所述第二增强图像之间的余弦相似度，以得到所述待评估信号的音质评分，或者，分别对第一语谱图和第二语谱图进行边缘检测处理，计算所述第一增强图像与所述第二增强图像之间的汉明距离，以得到所述待评估信号的音质评分。然后将得到的音质评分作为评价指标，以评估该拾音设备的录音系统。参见图9所示，本申请公开了一种音质评估装置，包括：待评估信号获取模块11，用于在标准音频的播放过程中进行录音，以得到待评估信号；第一语谱图获取模块12，用于确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图；第二语谱图获取模块13，用于确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号；音质评分确定模块14，用于确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。可见，本申请实施例先在标准音频的播放过程中进行录音，以得到待评估信号，然后确定所述待评估信号在临界频带上的第一功率谱以得到第一语谱图，以及确定所述标准音频对应的参考信号在临界频带上的第二功率谱以得到第二语谱图；其中，所述参考信号为所述标准音频对应的采样信号，之后确定所述第一语谱图与所述第二语谱图之间的图像相似度，以得到所述待评估信号的音质评分。也即，本申请实施例以确定图像相似度的方式确定待评估信号和参考信号临界频带上的功率谱之间的相似度，得到待评估信号的音质评分，这样，能够降低音质评估算法的复杂度，从而提升音质评估的速度，并且对音频采样率无要求。其中，所述音质评分确定模块14具体包括：图像增强处理单元，用于分别对所述第一语谱图和所述第二语谱图进行图像增强处理，以得到所述第一语谱图对应的第一增强图像以及所述第二语谱图对应的第二增强图像；相似度计算单元，用于确定所述第一增强图像与所述第二增强图像之间的图像相似度。在一种具体的实施方式中，所述图像增强处理单元，具体用于分别对所述第一语谱图和所述第二语谱图进行锐化处理。相应的，所述相似度计算单元，具体用于计算所述第一增强图像与所述第二增强图像之间的余弦相似度。在另一种具体的实施方式中，所述图像增强处理单元，具体用于分别对所述第一语谱图和所述第二语谱图进行边缘检测处理。相应的，所述相似度计算单元，具体用于计算所述第一增强图像与所述第二增强图像之间的汉明距离或余弦相似度。并且，所述音质评估装置，还包括静音段剔除模块，用于剔除所述待评估信号和所述参考信号中的静音片段。在具体的实施方式中，所述静音片段剔除模块具体包括：对数功率谱确定单元，用于确定所述待评估信号对应的第一对数功率谱以及所述参考信号对应的第二对数功率谱；第一静音片段确定单元，用于将所述第一对数功率谱中分贝值小于预设阈值的片段确定为第一静音片段；第二静音片段确定单元，用于将所述第二对数功率谱中分贝值小于所述预设阈值的片段确定为第二静音片段；静音片段剔除单元，用于剔除所述待评估信号的所述第一静音片段以及所述参考信号中的所述第二静音片段。并且，所述音质评估装置，还包括归一化处理模块，用于分别对所述待评估信号和所述参考信号进行归一化处理。进一步的，所述音质评估装置，还包括功率谱优化单元模块，用于基于掩蔽效应对所述第一功率谱和所述第二功率谱进行优化处理。进一步的，本申请实施例还提供了一种电子设备。图10是根据一示例性实施例示出的电子设备20结构图，图中的内容不能被认为是对本申请的使用范围的任何限制。图10为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20，具体可以包括：至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中，所述存储器22用于存储计算机程序，所述计算机程序由所述处理器21加载并执行，以实现前述任一实施例公开的音质评估方法中的相关步骤。另外，本实施例中的电子设备20具体可以为服务器。本实施例中，电源23用于为电子设备20上的各硬件设备提供工作电压；通信接口24能够为电子设备20创建与外界设备之间的数据传输通道，其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议，在此不对其进行具体限定；输入输出接口25，用于获取外界输入数据或向外界输出数据，其具体的接口类型可以根据具体应用需要进行选取，在此不进行具体限定。另外，存储器22作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源可以包括操作系统221、计算机程序222及音频信号数据223等，存储方式可以是短暂存储或者永久存储。其中，操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222，以实现处理器21对存储器22中数据223的运算与处理，其可以是windowsserver、netware、unix、linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的音质评估方法的计算机程序之外，还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223可以包括电子设备20收集到的各种音频信号数据。进一步的，本申请实施例还公开了一种存储介质，所述存储介质中存储有计算机程序，所述计算机程序被处理器加载并执行时，实现前述任一实施例公开的音质评估方法步骤。本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上对本发明所提供的一种音质评估方法、装置和设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。当前第1页1 2 3

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。