用于处理信息的方法和装置与流程
本公开实施例涉及计算机技术领域,具体涉及语音技术领域。
背景技术:
随着人工智能技术的快速发展,语音交互已经广泛的应用于车载终端,极大的提升了人机交互的体验效果。车辆行驶过程中,车内的声学环境比较复杂,例如,车内存在车辆行驶的气流噪声、发动机噪声、车载扬声器发出的声音等等,这使得车载语音采集设备采集的音频质量较差。车载终端可以安装多种与语音相关的应用(application),例如,即时通讯工具、蓝牙车载电话、输入法应用等等。这些应用获取到车内的音频之后,一些应用可以采用自身的降噪算法对音频进行降噪处理后再进行后续处理,一些应用则不对音频进行降噪处理直接进行后续处理。由于不同的应用所使用的降噪算法可能并不相同,且车内的声学环境比较复杂,因此无法保证降噪效果。而如果不对音频进行降噪处理将直接影响后续的处理效果。
技术实现要素:
本公开提供了一种用于处理信息的方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种用于处理信息的方法,该方法包括:响应于确定预设的音频采集接口被车载终端应用调用,接收车载音频采集设备采集的音频;对上述车载音频采集设备采集的音频进行处理,得到处理后音频;将上述处理后音频发送至调用上述音频采集接口的车载终端应用,以供上述车载终端应用基于上述处理后音频进行预设的处理。
根据本公开的第二方面,提供了一种用于处理信息的装置,该装置包括:接收单元,被配置成响应于确定预设的音频采集接口被车载终端应用调用,接收车载音频采集设备采集的音频;处理单元,被配置成对上述车载音频采集设备采集的音频进行处理,得到处理后音频;发送单元,被配置成将上述处理后音频发送至调用上述音频采集接口的车载终端应用,以供上述车载终端应用基于上述处理后音频进行预设的处理。
根据本公开的第三方面,提供了一种电子设备,其特征在于,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如第一方面中任一项上述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,上述计算机指令用于使上述计算机执行如第一方面中任一项上述的方法。
根据本申请的技术在将车载音频采集设备采集的音频发送至车载终端应用之前,先将车载音频采集设备采集的音频进行处理,获得高品质的处理后音频,从而使车载终端应用所获取的音频质量更好,有利于车载终端应用进行后续的处理。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请的用于处理信息的方法的一个实施例的流程图;
图2是根据本申请的用于处理信息的方法的一个应用场景的示意图;
图3是根据本申请的用于处理信息的方法的又一个实施例的流程图;
图4是根据本申请的用于处理信息的装置的一个实施例的结构示意图;
图5是用来实现本申请实施例的用于处理信息的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
请参考图1,示出了根据本公开的用于处理信息的方法的一个实施例的流程100。该用于处理信息的方法,包括以下步骤:
s101,响应于确定预设的音频采集接口被车载终端应用调用,接收车载音频采集设备采集的音频。
在本实施例中,车载终端可以包括预设的音频采集接口。通过该音频采集接口可以录制车载音频采集设备(例如,麦克风或者麦克风阵列等)采集的音频。实践中,不同的操作系统所对应的预设音频采集接口可能并不相同。以车载终端的操作系统为安卓系统为例,预设的音频采集接口可以为audiorecord。车载终端所安装的车载终端应用可以调用上述预设的音频采集接口,以获取音频。用于处理信息的方法的执行主体,例如,车载终端的处理器,可以通过各种方式确定预设的音频采集接口是否被车载终端应用调用,如果确定预设的音频采集接口被车载终端应用调用,则执行主体可以接收车载音频采集设备(例如,麦克风或者麦克风阵列)采集的音频。实践中,车载音频采集设备可以采集车内驾驶员或乘客的语音信息、车内的噪声、以及车载扬声器造成的声学回声等等。
s102,对车载音频采集设备采集的音频进行处理,得到处理后音频。
在本实施例中,执行主体可以对上述车载音频采集设备采集的音频进行各种处理,例如,降噪处理,从而得到处理后音频。实践中,可以根据实际需要设置一种或者多种用于提升车载音频采集设备所采集音频质量的处理方法,来对车载音频采集设备采集的音频进行处理,以获得高品质的处理后音频。
s103,将处理后音频发送至调用音频采集接口的车载终端应用,以供车载终端应用基于处理后音频进行预设的处理。
在本实施例中,执行主体可以将s102得到的处理后音频发送至调用上述音频采集接口的车载终端应用,以供车载终端应用基于处理后音频进行预设的处理。这里,调用上述音频采集接口的车载终端应用可以是与语音相关的应用,例如,即时通讯工具、蓝牙车载电话、输入法应用等等。这样,车载终端应用接收到处理后音频之后,可以根据自身的处理逻辑对处理后音频进行相应的处理。
在本实施例的一些可选的实现方式中,调用音频采集接口的车载终端应用可以包括媒体播放器。以及s103可以具体如下进行;
将处理后音频发送至媒体播放器,以供媒体播放器执行预设操作。
在本实现方式中,执行主体可以将s102中得到的处理后音频发送至媒体播放器。媒体播放器接收到处理后音频后可以执行以下操作步骤1)和2):
1)对处理后音频进行语音识别,得到语音识别结果。
在本实现方式中,媒体播放器可以对接收到的处理后音频进行语音识别,从而得到语音识别结果。这里,语音识别结果可以为文本信息。
2)基于语音识别结果,从预设的信息集合中获取待播放信息,以及播放待播放信息。
在本实现方式中,根据语音识别结果,媒体播放器可以从预设的信息集合中获取待播放信息,并将待播放信息进行播放。这里,待播放信息可以包括但不限于音频信息、视频信息等等。实践中,针对媒体播放器可以预先设置信息集合,该信息集合可以存储在车载终端本地,也可以存储在云端。该信息集合中可以包括但不限于音频信息、视频信息等等。这样,媒体播放器可以根据语音识别结果从对应的信息集合中确定信息作为待播放信息。举例来说,对于信息集合中的每条信息,可以根据该信息所包含的内容设置标签。以信息为视频为例,标签可以包括但不限于视频的名称、视频中角色的名称、视频的导演、视频描述的事件等等。媒体播放器可以通过各种方式从语音识别结果中提取出一个或者多个关键词,并将提取的一个或者多个关键词与信息集合中的各条信息的标签进行匹配。根据匹配结果可以从信息集合中确定信息作为待播放信息。通过本实现方式,车载终端安装的媒体播放器可以基于处理后音频确定待播放信息,从而使确定的待播放信息更加准确。
在本实施例的一些可选的实现方式中,音频采集接口用于被至少一个车载终端应用调用。
在本实现方式中,上述预设的音频采集接口可以被车载终端所安装的至少一个车载终端应用调用。举例来说,车载终端所安装的、存在音频采集需求的车载终端应用都可以通过调用该音频采集接口进行音频获取。由于车载终端应用通过调用预设的音频采集接口获取的音频是经过了处理的处理后音频,因此,车载终端应用可以获取到高品质的处理后音频,有利于车载终端应用进行后续的处理。
继续参见图2,图2是根据本实施例的用于处理信息的方法的应用场景的一个示意图。在图2的应用场景中,响应于确定预设的音频采集接口被车载终端应用调用,车载终端的处理器可以接收麦克风采集的音频201。之后,车载终端的处理器可以对麦克风采集的音频201进行处理,得到处理后音频202。最后,车载终端的处理器可以将处理后音频发送至调用音频采集接口的车载终端应用203,以供车载终端应用基于处理后音频进行预设的处理。
本公开的上述实施例提供的方法在将车载音频采集设备采集的音频发送至车载终端应用之前,先将车载音频采集设备采集的音频进行处理,获得高品质的处理后音频,从而使车载终端应用所获取的音频质量更好,有利于车载终端应用进行后续的处理。
进一步参考图3,其示出了用于处理信息的方法的又一个实施例的流程300。该用于处理信息的方法的流程300,包括以下步骤:
s301,响应于确定预设的音频采集接口被车载终端应用调用,接收车载音频采集设备采集的音频。
在本实施例中,s301与图1所示实施例的s101类似,此处不再赘述。
s302,将车载扬声器所播放的音频确定为参考音频。
在本实施例中,执行主体可以将车载扬声器所播放的音频确定为参考音频。通常,车载终端中要播放的音频在通过音频功率放大器处理之后,可以通过车载扬声器进行播放。此时,可以将车载扬声器播放的音频确定为参考音频。举例来说,可以将音频功率放大器处理后音频作为参考音频。
s303,根据参考音频,对车载音频采集设备采集的音频进行回声消除处理。
在本实施例中,执行主体可以根据s302中确定的参考音频,对车载音频采集设备采集的音频进行回声消除。作为示例,可以采用aec(acousticechochancellor,声学回声消除器)进行回声消除处理。aec是对扬声器信号与由它产生的多路径回声的相关性为基础,建立远端信号的语音模型,利用远端信号的语音模型对回声进行估计,并不断地修改滤波器的系数,使得估计值更加逼近真实的回声。然后,将回声估计值从车载音频采集设备采集的音频中减去,从而达到消除回声的目的,aec还将车载音频采集设备采集的音频与扬声器过去的值相比较,从而消除延长延迟的多次反射的声学回声。
s304,基于预设的降噪算法对回声消除处理后的音频进行降噪处理,得到处理后音频。
在本实施例中,执行主体可以基于预设的降噪算法对回声消除处理后的音频进行降噪处理,得到处理后音频。作为示例,可以将预设的降噪算法集成在音频编解码器中,以实现降噪处理。实践中,车载音频采集设备在采集车内的音频时,会采集到车内的噪声,例如,车辆行驶的气流噪声、发动机噪声等等。因此,需要对音频进行降噪处理。这里,降噪算法可以是能够对音频进行降噪处理的各种算法。
在本实施例的一些可选的实现方式中,上述预设的降噪算法可以是通过以下方式确定的:
首先,获取测试用车辆在行驶过程中采集的噪声音频。
在本实现方式中,用于确定降噪算法的算法确定执行主体与用于处理信息的执行主体可以相同,也可以不同。算法确定执行主体可以获取测试用车辆在行驶过程中采集的噪声音频。这里,测试用车辆可以是指通过实车路测采集噪声音频的车辆。实践中,可以控制测试用车辆在预设条件(例如,预设车速、预设路况等等)下行驶,并在行驶过程中采集车内的噪声音频。
然后,使用至少一种候选降噪算法对噪声音频进行降噪处理,得到降噪处理结果。
在本实现方式中,算法确定执行主体可以使用至少一种候选降噪算法分别对上述噪声音频进行降噪处理,从而得到各种候选降噪算法对应的降噪处理结果。
最后,基于至少一种候选降噪算法的降噪处理结果,从至少一种候选降噪算法中确定候选降噪算法作为预设的降噪算法。
在本实现方式中,算法确定执行主体可以根据至少一种候选降噪算法的降噪处理结果,从上述至少一种候选降噪算法中确定一种候选降噪算法作为预设的降噪算法。作为示例,算法确定执行主体可以选取降噪处理结果中降噪效果最好的降噪处理结果对应的候选降噪算法作为预设的降噪算法。通过本实现方式,可以基于测试用车辆在行驶过程中采集的噪声音频,从多种候选降噪算法中选取一种候选降噪算法作为预设的降噪算法,从而使预设的降噪算法更加适合车辆行驶的噪声环境。
s305,将处理后音频发送至调用音频采集接口的车载终端应用,以供车载终端应用基于处理后音频进行预设的处理。
在本实施例中,s305与图1所示实施例的s103类似,此处不再赘述。
从图3中可以看出,与图1对应的实施例相比,本实施例中的用于处理信息的方法的流程300突出了对车载音频采集设备采集的音频进行回声消除和降噪的步骤。由此,本实施例描述的方案可以生成回声消除和降噪后的处理后音频,从而使车载终端应用所获取的音频不包括声学回声和噪声,更加有利于车载终端应用的后续处理。
进一步参考图4,作为对上述各图所示方法的实现,本公开提供了一种用于处理信息的装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的用于处理信息的装置400包括:接收单元401、处理单元402和发送单元403。其中,接收单元401被配置成响应于确定预设的音频采集接口被车载终端应用调用,接收车载音频采集设备采集的音频;处理单元402被配置成对上述车载音频采集设备采集的音频进行处理,得到处理后音频;发送单元403被配置成将上述处理后音频发送至调用上述音频采集接口的车载终端应用,以供上述车载终端应用基于上述处理后音频进行预设的处理。
在本实施例中,用于处理信息的装置400的接收单元401、处理单元402和发送单元403的具体处理及其所带来的技术效果可分别参考图1对应实施例中s101、s102和s103的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述处理单元402进一步被配置成:将车载扬声器所播放的音频确定为参考音频;根据上述参考音频,对上述车载音频采集设备采集的音频进行回声消除处理;基于预设的降噪算法对回声消除处理后的音频进行降噪处理,得到处理后音频。
在本实施例的一些可选的实现方式中,上述预设的降噪算法是通过以下方式确定的:获取测试用车辆在行驶过程中采集的噪声音频;使用至少一种候选降噪算法对上述噪声音频进行降噪处理,得到降噪处理结果;基于至少一种候选降噪算法的降噪处理结果,从上述至少一种候选降噪算法中确定候选降噪算法作为预设的降噪算法。
在本实施例的一些可选的实现方式中,调用上述音频采集接口的车载终端应用包括媒体播放器;以及上述发送单元403进一步被配置成:将上述处理后音频发送至上述媒体播放器,以供上述媒体播放器执行以下操作:对上述处理后音频进行语音识别,得到语音识别结果;基于上述语音识别结果,从预设的信息集合中获取待播放信息,以及播放上述待播放信息。
在本实施例的一些可选的实现方式中,上述音频采集接口用于被至少一个车载终端应用调用。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图5所示,是根据本申请实施例的用于处理信息的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的用于处理信息的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用于处理信息的方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用于处理信息的方法对应的程序指令/模块(例如,附图4所示的接收单元401、处理单元402和发送单元403)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于处理信息的方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于处理信息的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至用于处理信息的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于处理信息的方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与用于处理信息的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,在将车载音频采集设备采集的音频发送至车载终端应用之前,先将车载音频采集设备采集的音频进行处理,获得高品质的处理后音频,从而使车载终端应用所获取的音频质量更好,有利于车载终端应用进行后续的处理。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除