HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种音频质量评估方法及装置与流程

2021-01-28 14:01:31|261|起点商标网
一种音频质量评估方法及装置与流程

本申请涉及计算机技术领域,尤其涉及一种音频质量评估方法及装置。



背景技术:

目前,直播越来越受欢迎,直播用户量也迅速增长,为保证观众端对直播音频有更好的体验,需要对直播的音频质量进行测试。

现有技术中,对直播的音频质量进行测试时,主要采用人为主观评测或者使用语音质量的感知评估(perceptualevaluationofspeechquality,pesq)/感知客观语音质量评估(perceptualobjectivelisteningqualityassessment,polqa)模型进行音质打分的客观评测方式,但是前者人为主观评测,无法准确地给出可量化的差异,效率和准确性都较低,对于后者,采用pesq/polqa模型,主要是比对输入前后的音频,进行各项加权后得分,但是这种方式,主播端直接通过音频线采集测试音频,不经过设备实际的麦克风(microphone,mic)采集,无需考虑环境噪声,但是无法满足主播端实际的直播场景,不能检测麦克风对音频的影响,并且该模型最终仅能给出音频质量的评分高低,无法推知问题原因,音频质量评估效果较差。



技术实现要素:

本申请实施例提供一种音频质量评估方法及装置,以解决现有技术中直播音频质量评估准确性较低,效果较差的问题。

本申请实施例提供的具体技术方案如下:

本发明一个实施例提供了一种音频质量评估方法,包括:

确定当前的测试类型,并根据测试类型与测试音频映射关系,确定对应的测试音频;

播放所述测试音频,以使主播端通过自身的音频采集装置采集所述测试音频;

获取观众端接收到的音频信号,其中,所述音频信号是主播端采集到所述测试音频后传输到所述观众端的;

根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果。

本发明另一个实施例提供了一种音频质量评估装置,包括:

确定模块,用于确定当前的测试类型,并根据测试类型与测试音频映射关系,确定对应的测试音频;

播放模块,用于播放所述测试音频,以使主播端通过自身的音频采集装置采集所述测试音频;

获取模块,用于获取观众端接收到的音频信号,其中,所述音频信号是主播端采集到所述测试音频后传输到所述观众端的;

分析模块,用于根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果。

结合本发明另一个实施例,确定当前的测试类型,并根据测试类型与测试音频映射关系,确定对应的测试音频时,确定模块具体用于:

若确定当前的测试类型为音量测试,则确定对应的测试音频为单一频率的信号;或,若确定当前的测试类型为音质测试,则确定对应的测试音频为满足设定频率范围的扫频信号。

结合本发明另一个实施例,所述单一频率的信号为1khz的正弦波;所述扫频信号的设定频率范围为0-24khz。

结合本发明另一个实施例,根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果时,分析模块具体用于:

若当前的测试类型为音量测试,则对所述音频信号进行频谱分析,将所述音频信号从时域转换为频域;

提取频域转换后的音频信号在所述测试音频的单一频率处的幅值;

获取主播端基于上一个版本的应用程序时,通过自身的音频采集装置采集所述测试音频时,获得的测试音频的历史测试结果,其中,所述历史测试结果中至少包括历史幅值;

将提取出的幅值与所述历史幅值进行比较,获得音量变化的测试结果。

结合本发明另一个实施例,根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果时,分析模块具体用于:

若当前的测试类型为音质测试,则分析所述音频信号的频谱特性,获取所述音频信号在频域上的截止频率;

根据所述测试音频的设定频率范围,将所述截止频率与所述设定频率范围进行比较,获得音质变化的测试结果。

结合本发明另一个实施例,根据所述测试音频的设定频率范围,将所述截止频率与所述设定频率范围进行比较,获得音质变化的测试结果时,分析模块具体用于:

确定所述测试音频的设定频率范围中的最大频率值;

确定所述截止频率与所述最大频率值的差值,若所述差值不大于阈值,则确定音质变化的测试结果符合要求,若所述差值大于阈值,则确定音质变化的测试结果不符合要求。

结合本发明另一个实施例,获取观众端接收到的音频信号时,获取模块具体用于:

通过与观众端直接连接的音频线,获取观众端接收到的音频信号。

本发明另一个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一种音频质量评估方法的步骤。

本发明另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种音频质量评估方法的步骤。

本申请实施例中,确定当前的测试类型,并播放当前的测试类型对应的测试音频,以使主播端通过自身的音频采集装置采集测试音频,主播端将采集到的测试音频发送给观众端,从而获取观众端从主播端接收到的音频信号,进行测试分析,获得测试结果,这样,不依赖人工主观判断,可以实现自动化测试,节省了人力,提高了准确性和效率,并且主播端通过自身的音频采集装置采集测试音频,符合实际直播场景,还可以检测音频采集装置对音频的影响,针对不同的测试类型,播放不同的测试音频和不同的测试分析方法,进行自动化测试,获得对应的量化测试结果,而不是一个简单的综合得分,能够推知问题原因,更加准确,测试也更加全面,提升了测试效果。

附图说明

图1为现有技术中音频质量评估的测试架构示意图;

图2为本申请实施例中音频质量评估方法的应用架构示意图;

图3为本申请实施例中一种音频质量评估方法流程图;

图4为本申请实施例中音量测试时前后测试音频的频谱分析示意图;

图5为本申请实施例中音质测试时前后测试音频的频谱分析示意图;

图6为本申请实施例中另一种音频质量评估方法流程图;

图7为本申请实施例中音量测试的测试结果示意图;

图8为本申请实施例中音质测试的测试结果示意图;

图9为本申请实施例中音频质量评估装置结构图;

图10为本申请实施例中电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为便于对本申请实施例的理解,下面先对几个概念进行简单介绍:

频谱分析:将时域信号变换至频域加以分析的方法称为频谱分析,频谱分析的目的是把复杂的时间历程波形,经过傅里叶变换分解为若干单一的谐波分量来研究,以获得信号的频率结构以及各谐波和相位信息。

扫频信号:表示频率在一定范围内周期变化的等幅信号。

截止频率:当保持输入信号的幅度不变,改变频率使输出信号降至最大值的0.707倍,即用频响特性来表述即为-3db点处即为截止频率,它是用来说明频率特性指标的一个特殊频率。

音频线:是音频连接线的简称,音频连接线用来传播声音的线。

目前,直播用户量迅速增长,竞争也非常激烈,提升观众良好的直播体验,对于在直播领域竞争和发展是非常重要的,因此对直播音频质量进行测试是很有必要的,现有技术中主要有两种方式:

一种方式为采用人为主观评测,来判断观众端听到的声音是否恶化,但是这种人为主观评测,准确性和效率都较低,也无法准确地给出可量化的差异。

另一种方式为采用语音质量的感知评估(perceptualevaluationofspeechquality,pesq)/感知客观语音质量评估(perceptualobjectivelisteningqualityassessment,polqa)模型,主要是通过比对输入前后的音频进行音质打分,例如,参阅图1所示为现有技术中音频质量评估的测试架构示意图,通过专业的pesq跑分软件对比输入音频源和输出音频得到pesq分值,评价标准pesq分值,分值越高音质越好,如图1所示,测试架构中包括音频测试专用个人计算机(personalcomputer,pc)一台、两根音频线、分别表示主播端和观众端的两部手机设备,还需准备测试音频素材和测试工具脚本,在测试时,主播端和观众端分别通过音频线直接与测试pc连接,并且,为了保证实验音频声音不会太小也不会破音,因此在测试开始前,专业人士需预先设置测试pc的扬声器和麦克风的音量,例如,调整扬声器和麦克风的音量分别为34和14,同时还需设置手机设备的音量,例如,设置为最大音量值减一格。

但是这种方式具有以下缺点:1)主播端与测试pc直接通过音频线连接,测试pc播放的测试音频通过音频线传输至主播端,主播端采集测试音频时不经过设备实际的麦克风(microphone,mic),屏蔽了背景噪声,无需考虑嘈杂环境中人声、背景噪声等对测试结果的影响,但是并不符合主播端实际的直播场景,通常主播端直播时是通过手机设备的mic采集声音的,也会存在噪声,这样这种方式不能检测麦克风对音频的影响,并在有噪声时,会造成干扰,无法适用于混入噪声的情况,降低测试准确性;2)测试前需要专门调节到设定的音量,无法测试出音量的变化;3)该方式仅能给出评分,例如设置得分范围为1-5分,测试结果为一个分值,根据分值来判断音频质量优劣,相关人员不能得知是什么原因影响的该分值,无法推知问题原因,音频质量测试效果较差,不够全面。

基于上述问题,本申请实施例中,对直播的音频现状和问题进行分析,当前直播中出现到问题主要是客户端代码中编码错误容易导致音量变小,并且音质变差,因此,本申请实施例中主要考虑这两个问题:音量变化的准确测量以及自动化检测,音质变化的准确测量以及自动化检测,在进行测试时可以准确测试出音频的音量变化和音质变化的量化值,而不是简单地给出一个综合得分。

并且,考虑当前的音频质量测试方式,现有技术中为了避免干扰,设备采集音频时均通过音频线直接输入,但是该方式与移动直播大部分场景,主播所实际采用的音频采集方式不同,主播通常都是通过手机设备自带的mic来完成声音的采集,并且手机上一般都有两个及以上的mic,而实际中直播应用程序(application,app)的开发代码中选取mic所在的位置,以及mic之间的降噪处理均会对采集结果有影响,现有技术的方式没有考虑也无法检测该问题。

因此,基于上述考虑本申请实施例中提供了一种音频质量评估方法,更加符合实际直播场景,根据当前的测试类型,播放对应的测试音频,主播端通过自身的音频采集装置采集该测试音频,进而获取观众端从主播端接收到的音频信号,根据当前的测试类型,对该音频信号进行测试分析,获得测试结果,这样,实现了自动化测试,节省了人力,主播端通过自身的音频采集装置采集音频,而不是直接通过音频线输入,能够考虑主播端的音频采集装置的影响,满足实际直播场景,提高测试准确性,并且最终基于不同的测试类型给出相应的测试结果,而不是一个简单的综合得分,可以获知问题原因,测试效果更加全面,能力更强,避免测试遗漏。

其中,测试类型可以为音量测试或音质测试,针对不同的测试类型,确定不同的测试音频和测试分析方法,从而通过自动化工具能够准确测量出音量变化和音质变化的数值,实现量化分析,对于音频问题的处理提供更加具体明确的指导意义,提升测试效果。

参阅图2所示,为本申请实施例中音频质量评估方法的应用架构示意图,包括主播端100、观众端200、测试设备300和服务器400。

主播端100和观众端200均是面向用户的终端,例如,主播端100面向主播,观众端200面向普通观众,可以是智能手机、平板电脑、便携式个人计算机、智能电视等任何智能设备。终端上可以安装有各种app,例如各种直播app,终端可以通过直播app向用户提供直播服务。

服务器400可以为主播端100和观众端200提供各种网络服务,例如,主播端100和观众端200可以通过服务器400互相收发数据,例如音频或视频等。其中,服务器400可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。

主播端100、观众端200可以分别与服务器400之间通过互联网相连,实现相互之间的通信。可选地,上述的互联网使用标准通信技术和/或协议。互联网通常为因特网、但也可以是任何网络,包括但不限于局域网(localareanetwork,lan)、城域网(metropolitanareanetwork,man)、广域网(wideareanetwork,wan)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(hypertextmark-uplanguage,html)、可扩展标记语言(extensiblemarkuplanguage,xml)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(securesocketlayer,ssl)、传输层安全(transportlayersecurity,tls)、虚拟专用网络(virtualprivatenetwork,vpn)、网际协议安全(internetprotocolsecurity,ipsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

测试设备300为进行音频测试的电子设备,也可以是智能手机、平板电脑、便携式个人计算机、音频测试专用pc等任何智能设备。

测试设备300与观众端200通过音频线连接,具体地,将测试设备300的麦克风与观众端200的耳机口通过音频线进行连接,其中,该音频线例如为3.5mm音频线,本申请实施例中并不进行限制。并且,测试设备300还可以通过音频线外接一个音箱,主要为了播放测试音频,提升播放效果,以使主播端100通过自身的音频采集设备采集从音箱中播放出的测试音频。

本申请实施例中音频质量评估方法主要应用于测试设备300,测试设备300根据当前的测试类型,播放不同的测试音频,并获取观众端200从主播端100接收到的音频信号,进行测试分析,获得测试结果。

需要说明的是,本申请实施例中的应用架构图是为了更加清楚地说明本申请实施例中的技术方案,并不构成对本申请实施例提供的技术方案的限制,当然,也并不仅限于直播业务,对于其它的应用架构和业务应用,本申请实施例提供的技术方案对于类似的问题,同样适用。

本申请各个实施例以应用于图2所示的应用架构图为例进行示意性说明。

另需要说明的是,在进行音频质量评估测试时,先预先基于图2所示的应用架构图搭建拓扑结构,并且还需要主播端和观众端均打开待测试的直播app,进入直播状态,例如主播端和观众端打开直播app,进入同一个直播房间,主播端可以向观众端发送音频数据,观众端可以接听该直播房间里主播端发送的音频数据。

基于上述实施例,参阅图3所示,为本申请实施例中一种音频质量评估方法流程图,该方法包括:

步骤300:确定当前的测试类型,并根据测试类型与测试音频映射关系,确定对应的测试音频。

本申请实施例中,考虑到直播音频所表现的问题主要有音量变小和音质变差,因此,在对音频质量进行评估测试时,主要是针对音量测试和音质测试,以量化音量变化和音质变化。

其中,测试类型包括音量测试或音质测试,则相应地执行步骤300时,可以有以下两种情况:

第一种情况:若确定当前的测试类型为音量测试,则确定对应的测试音频为单一频率的信号。

较佳的,该单一频率的信号为1khz的正弦波,这是因为,考虑人耳对声音敏感度,1khz的频率是较为敏感的频率,更符合对直播音频的测试需求,而采用正弦波是因为后续进行测试分析时,需要进行频谱分析,对时域信号进行傅里叶变换转换为频域信号,正弦波在进行傅里叶变换时计算更为简单,当然也可以采用其它单一频率的信号,例如其它频率的正弦波、其它频率的方波等,本申请实施例中并不进行限制。

并且,本申请实施例中,测试设备与主播端不采用音频线连接,这样主播端采集测试设备播放的测试音频时,不可避免会引入一些噪声,为了保证测试准确性,因此在进行音量测试时,采用单一频率的信号,以使后续进行测试分析时,即使测试环境中存在大量噪声,也可以基于该频率准确提取出所需的音量值。

第二种情况:若确定当前的测试类型为音质测试,则确定对应的测试音频为满足设定频率范围的扫频信号。

较佳的,扫频信号的设定频率范围为0-24khz,这也是考虑人耳接收频率段,也可以设置其它的频率范围,本申请实施例中并不进行限制。

本申请实施例中,通过分析问题代码和问题表现,音质变差主要是由于采样频率降低,导致音频中高频分量丢失,导致听到的声音不够饱满,听者的感受即为音质变差,因此,在对音质测试时,主要是测试高频分量的丢失程度,因此音质测试时输入的测试音频为一定范围的扫频信号,该扫频信号包括高频部分和低频部分。

步骤310:播放测试音频,以使主播端通过自身的音频采集装置采集测试音频。

具体地,若进行音量测试,此时测试设备调用脚本,使扬声器播放的为单一频率的信号,例如为1khz的正弦波,若进行音质测试,此时测试设备调用脚本,使扬声器播放的为扫频信号,例如为0-24khz的扫频信号。

进一步地,测试设备播放的测试音频,还可以通过音频线传输至音箱,由音箱向外播放,以使主播端能够采集该测试音频。

其中,主播端采集测试音频时,是通过自身的音频采集装置采集,例如自身的麦克风,主播端处于打开直播app状态,通过设备自身的麦克风采集测试音频,即通过直播端设备实际的麦克风采集,可以测试主播端的麦克风对音频的影响,这是因为,实际直播场景中,主播端通常都是基于设备自身的麦克风来完成声音的采集,而设备例如手机,可能有两个或更多的mic,直播app的开发代码中选取的不同位置的mic,或各mic之间的降噪处理都会对采集结果有影响,若主播端直接通过音频线接收测试设备播放的音频,是无法测试到各个mic对音频采集的影响的。

步骤320:获取观众端接收到的音频信号,其中,音频信号是主播端采集到测试音频后传输到观众端的。

具体包括:通过与观众端直接连接的音频线,获取观众端接收到的音频信号。

其中,音频线例如为3.5mm音频线,本申请实施例中并不进行限制。

也就是说,主播端采集到测试音频后,可以通过服务器传输给观众端,观众端接收到音频信号,由于测试是对输入和输出进行比较,为避免噪声干扰,从观众端输出的音频信号,就可以直接通过音频线传输给测试设备,由测试设备进行分析处理。

步骤330:根据当前的测试类型,对音频信号进行测试分析,获得测试音频的测试结果。

基于不同的测试类型,执行步骤330时,也可以分为以下两种情况:

第一种情况:若当前的测试类型为音量测试,则具体包括:

1)若当前的测试类型为音量测试,则对音频信号进行频谱分析,将音频信号从时域转换为频域。

例如,可以采用傅里叶变换将音频信号从时域转换为频域。

2)提取频域转换后的音频信号在测试音频的单一频率处的幅值。

例如,测试音频为1khz的正弦波,则转换为频域后,提取其中1khz频点处的幅值。

本申请实施例中,由于主播端采集测试音频时,中途测试音频经过主播端实际音频采集设备,例如mic,采集过程中可能会存在大量噪声,因此,本申请实施例中为了提升鲁棒性,在进行音量测试时,输入单一频率的信号,在输出端将接收到的音频信号进行频谱分析,提取该频点处的幅值,这样,即使在主播端采集录制时,环境比较嘈杂混入了大量噪声,也可以避免其它噪声干扰,准确提取到测试音频的音量值。

例如,以测试音频为1khz的正弦波为例,参阅图4所示,为本申请实施例中音量测试时前后测试音频的频谱分析示意图,如图4所示,图4中(a)为测试设备发送的测试音频的频谱图,可知在1khz频点处幅值是最高的,图4中(b)为观众端接收到的音频信号的频谱图,提取1khz频点处的幅值,即是去除噪声后的测试音频音量值。

3)获取主播端基于上一个版本的应用程序时,通过自身的音频采集装置采集测试音频时,获得的测试音频的历史测试结果,其中,历史测试结果中至少包括历史幅值。

其中,这里的应用程序主要是指测试对象,例如直播app,对直播app的音频进行测试。

也就是说,在进行音量变化的比较时,是和对上一个版本的应用程序进行测试时获取的历史幅值进行比较,这是因为,音量变化可能是由于应用程序的代码编码错误导致的,不同版本的应用程序可能会不同,例如,当前测试时,主播端基于当前版本的应用程序,采集测试音频,并传输至观众端,提取此时观众端接收的音频信号的频域在1khz处的幅值,并且,之前测试时,主播端基于上一个版本的应用程序,采集测试音频并传输至观众端,获取此时观众端接收的音频信号的频域在1khz处的幅值,即历史幅值,将当前的幅值和该历史幅值进行比较,检测不同版本的应用程序编码是否存在问题。

4)将提取出的幅值与历史幅值进行比较,获得音量变化的测试结果。

例如,通过比较,确定当前提取出的幅值比历史幅值小10db,说明当前版本的应用程序可能出现了问题,可以提示给测试人员,以使测试人员根据该音量变化的测试结果进行排查。

这样,由于测试结果更加具体,可以明确给出音量变化的量化值,从而可以更加有助于测试人员推知问题原因,例如音量变化通常是应用程序的代码问题,通过排查,问题原因可能是,在连麦模式时,直播app的软件开发工具包(softwaredevelopmentkit,sdk)切换了默认的采集mic所引起的,例如可能是从手机底部mic,切换为了背后摄像头处的mic,即可以检测到音量变化,并通过音量变化可以检测各mic对音频的影响。

第二种情况:若当前的测试类型为音质测试,则具体包括:

1)若当前的测试类型为音质测试,则分析音频信号的频谱特性,获取音频信号在频域上的截止频率。

本申请实施例中,由于音质变化主要是由于采集频率降低,高频分量丢失所引起,因此进行音质测试时,可以持续获取扫频信号播放期间,观众端接收到的音频信号,分析所获取的音频信号的频谱特性,获取在频域上的截止频率,即可以用截止频率来描述测试音频的高频分量的丢失程度。

2)根据测试音频的设定频率范围,将截止频率与设定频率范围进行比较,获得音质变化的测试结果。

具体地:确定测试音频的设定频率范围中的最大频率值;确定截止频率与最大频率值的差值,若差值不大于阈值,则确定音质变化的测试结果符合要求,若差值大于阈值,则确定音质变化的测试结果不符合要求。

例如,以测试音频为0-24khz的扫频信号为例,参阅图5所示,为本申请实施例中音质测试时前后测试音频的频谱分析示意图,如图5所示,图5中(a)为测试设备发送的测试音频的频谱图,频率范围从0-24khz周期变化,图5中(b)为一种观众端接收到的音频信号的频谱图,图5中(c)为另一种观众端接收到的音频信号的频谱图。

图5中(b)的截止频率为20khz,与测试音频的最大频率值24khz的差值为4khz,例如阈值为6khz,小于该阈值,符合要求,在允许的变化范围内,则说明音质变化较好,图5中(c)的截止频率为8khz,与测试音频的最大频率值24khz的差值为16khz,远大于阈值,则说明该音质变化不符合要求,会影响到观众的听觉感受,需要进行原因排查并进行修正。

这样,通过音质测试,能够检测出其中丢失的高频频率段,获得音质变化的量化值,更加准确,从而可以给测试人员以提示,有助于问题发现,例如,通过排查发现问题原因可能是,连麦模式下,上麦观众采集音量相比主播要小,导致观众端体验较差,相较于人工主观判断是不容易发现该音质变化的问题的。

本申请实施例中,确定当前的测试类型,并播放对应的测试音频,主播端通过自身的音频采集装置采集测试音频,并传输至观众端,从而获取观众端接收到的音频信号,基于当前的测试类型,对该音频信号进行测试分析,获得测试结果,不需要人工主观判断,实现了自动化测试,节省了人力,提高了准确性和效率,满足实际直播场景,并可以针对不同的测试类型进行自动化测试,量化测试结果,可以有助于测试人员推知问题原因,提高了准确性,并且测试更加全面,能力更强,提升了测试效果。

基于上述实施例,下面采用具体应用场景进行说明,以测试类型包括音量测试和音质测试,并以音量测试对应的测试音频为1khz的正弦波,音质测试时对应的测试音频为0-24khz的扫频信号为例,具体地:参阅图6所示,为本申请实施例中另一种音频质量评估方法流程图,该方法包括:

步骤600:开始。

步骤601:判断测试类型,若确定为音量测试,则执行步骤602,若确定为音质测试,则执行步骤603。

在测试开始之前,测试相关人员可以预先配置当前的测试类型,在开始测试时,测试设备可以根据配置来判断测试类型,从而控制播放不同的测试音频。

步骤602:播放1khz的正弦波。

步骤603:播放0-24khz的扫频信号。

步骤604:主播端通过自身的音频采集装置采集测试音频。

本申请实施例中,主播端中安装有直播app,在测试时需打开直播app,该直播app,通过主播端设备自身的mic采集测试音频。

步骤605:获取观众端接收到的音频信号。

同样地,在观众端也安装该直播app,并在测试时也需打开直播app,与直播端需进入同一直播房间,也便接收主播端采集到的测试音频,观众端可正常播放主播端采集到的测试音频,并通过音频线传输给测试设备,测试设备对音频信号进行测试分析。

步骤606:判断测试类型,若为音量测试,则执行步骤607,若为音质测试,则执行步骤608。

在开始测试时,判断出当前的测试类型后,可以进行标记,当获取到观众端的音频信号后,可以通过该标记确定出测试类型,并选取对应的测试分析方法。

步骤607:分析音频信号1khz处的幅值。

具体地:对音频信号进行频谱分析,将音频信号从时域转换为频域,并提取频域转换后的音频信号在1khz处的幅值,从而可以获得去除噪声后的测试音频的音量值。

进而获取主播端基于上一个版本的应用程序时,通过自身的音频采集装置采集测试音频时,获得的测试音频的历史测试结果,其中,历史测试结果中至少包括历史幅值,将提取出的幅值与历史幅值进行比较,获得音量变化的测试结果。

步骤608:分析音频信号的截止频率。

具体地:获取音频信号在频域上的截止频率,与扫频信号的最大频率值24khz进行比较,即可得到音质变化的量化值,获得音质变化的测试结果。

步骤609:显示测试结果。

这样,针对不同的测试类型,在主播端输入特定的测试音频,在观众端获取接收到音频信号,并进行频谱分析,能够准确地测试出音量变化和音质变化的数值,节省人力,提高准确性和效率,并且能够提供更多的指导意义,推知问题原因,测试更加全面,提升测试效果。

下面对本申请实施例中显示的测试结果进行简单说明。需要说明的是,本申请实施例中音量测试主要是分析音量幅值,音质测试主要是分析截止频率,但是为了便于查看结果,将音量幅值和截止频率均统一在音量测试和音质测试中显示出来。

参阅图7所示为本申请实施例中音量测试的测试结果示意图,如图7所示,为观众端输出的音频信号的频域图,横坐标为频率(单位:hz),纵坐标为幅值(单位:db),提取其在1khz处的幅值,例如为46db,即得到去除噪声后的测试音频的音量值,分析该幅值与历史幅值的大小,用于分析问题原因。

参阅图8所示为本申请实施例中音质测试的测试结果示意图,同样地,如图8所示,为观众端输出的音频信号的频域图,横坐标为频率(单位:hz),纵坐标为幅值(单位:db),此时对于音质测试,分析频域上的截止频率,例如从图8中可知,获取截止频率(即图8中所示的stopfreq)为20khz,与测试音频的最大频率值24khz进行比较,得到音质变化的量化值,自动化测试,并且可以提供更具体的问题原因,例如测试人员可以获知是音质变差了还是音量变小了,从而进行针对性的问题排查。

基于上述实施例,参阅图9所示,本申请实施例中音频质量评估装置,具体包括:

确定模块90,用于确定当前的测试类型,并根据测试类型与测试音频映射关系,确定对应的测试音频;

播放模块91,用于播放所述测试音频,以使主播端通过自身的音频采集装置采集所述测试音频;

获取模块92,用于获取观众端接收到的音频信号,其中,所述音频信号是主播端采集到所述测试音频后传输到所述观众端的;

分析模块93,用于根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果。

可选的,确定当前的测试类型,并根据测试类型与测试音频映射关系,确定对应的测试音频时,确定模块90具体用于:

若确定当前的测试类型为音量测试,则确定对应的测试音频为单一频率的信号;或,若确定当前的测试类型为音质测试,则确定对应的测试音频为满足设定频率范围的扫频信号。

可选的,所述单一频率的信号为1khz的正弦波;所述扫频信号的设定频率范围为0-24khz。

可选的,根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果时,分析模块93具体用于:

若当前的测试类型为音量测试,则对所述音频信号进行频谱分析,将所述音频信号从时域转换为频域;

提取频域转换后的音频信号在所述测试音频的单一频率处的幅值;

获取主播端基于上一个版本的应用程序时,通过自身的音频采集装置采集所述测试音频时,获得的测试音频的历史测试结果,其中,所述历史测试结果中至少包括历史幅值;

将提取出的幅值与所述历史幅值进行比较,获得音量变化的测试结果。

可选的,根据所述当前的测试类型,对所述音频信号进行测试分析,获得所述测试音频的测试结果时,分析模块93具体用于:

若当前的测试类型为音质测试,则分析所述音频信号的频谱特性,获取所述音频信号在频域上的截止频率;

根据所述测试音频的设定频率范围,将所述截止频率与所述设定频率范围进行比较,获得音质变化的测试结果。

可选的,根据所述测试音频的设定频率范围,将所述截止频率与所述设定频率范围进行比较,获得音质变化的测试结果时,分析模块93具体用于:

确定所述测试音频的设定频率范围中的最大频率值;

确定所述截止频率与所述最大频率值的差值,若所述差值不大于阈值,则确定音质变化的测试结果符合要求,若所述差值大于阈值,则确定音质变化的测试结果不符合要求。

可选的,获取观众端接收到的音频信号时,获取模块92具体用于:

通过与观众端直接连接的音频线,获取观众端接收到的音频信号。

基于上述实施例,参阅图10所示,本申请实施例中,一种电子设备的结构示意图。

本申请实施例提供了一种电子设备,该电子设备可以包括处理器1010(centerprocessingunit,cpu)、存储器1020、输入设备1030和输出设备1040等,输入设备1030可以包括键盘、鼠标、触摸屏等,输出设备1040可以包括显示设备,如液晶显示器(liquidcrystaldisplay,lcd)、阴极射线管(cathoderaytube,crt)等。

存储器1020可以包括只读存储器(rom)和随机存取存储器(ram),并向处理器1010提供存储器1020中存储的程序指令和数据。在本申请实施例中,存储器1020可以用于存储本申请实施例中任一种音频质量评估方法的程序,并且存储器1020中还可以存储各种测试音频。

处理器1010通过调用存储器1020存储的程序指令,处理器1010用于按照获得的程序指令执行本申请实施例中任一种音频质量评估方法。

例如,该电子设备可以为本申请图2中的测试设备300。

基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的音频质量评估方法。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips