语音控制方法、装置、电子设备及存储介质与流程
本申请涉及数据处理技术领域中的语音技术,尤其涉及一种语音控制方法、装置、电子设备及存储介质。
背景技术:
随着信息技术的迅速发展,电子设备的智能化程度越来越高,与用户的交互也日益人性化。例如,在当前智能汽车领域,车辆的车载终端安装有语音助手,这样车载终端可以通过语音助手实现与用户的语音交互。在电子技术领域,移动终端上安装有语音助手能够与用户进行语音交互的语音助手。
目前,电子设备需要在联网状态下接收到用户的语音指令,进而根据接收到的语音指令执行相应的操作。然而,当电子设备处于某些网络质量较差的环境中时,用户发出语音指令后,电子设备上安装的语音助手需要较长的时间才对其进行响应,而通常情况下,若用户没有立即得到响应,会重复发出语音指令,存在交互效率低、用户体验差的问题。
技术实现要素:
本申请提供了一种语音控制方法、装置、电子设备及存储介质。
根据本申请的一方面,提供了一种语音控制方法,包括:
获取音频信号流;
对所述音频信号流进行能量估计,确定所述音频信号流中每帧音频信号的能量值;
根据所述音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示所述音频信号流的能量值。
根据本申请的另一方面,提供了一种语音控制装置,包括:
获取模块,用于获取音频信号流;
处理模块,用于对所述音频信号流进行能量估计,确定所述音频信号流中每帧音频信号的能量值;
控制模块,用于根据所述音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示所述音频信号流的能量值。
根据本申请的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的语音控制方法。
根据本申请的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的语音控制方法。
根据本申请的又一方面,提供了一种语音控制方法,包括:
确定获取到的音频信号流中每帧音频信号的能量值;
在语音交互界面上显示所述音频信号流中每帧音频信号的能量值。
根据本申请的技术方案,通过对获取到的音频信号流进行能量估计,可以确定出音频信号流中每帧音频信号的能量值,进而可以根据音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示该音频信号流的能量值,解决了用户与电子设备的交互效率低,用户体验差的问题。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的语音控制方法的应用场景示意图;
图2是本申请第一实施例提供的语音控制方法的流程示意图;
图3是本申请第二实施例提供的语音控制方法的流程示意图;
图4是电子设备具有的语音交互界面的示意图;
图5是语音交互界面上显示的音频信号流的能量值变化示意图;
图6是本申请第三实施例提供的语音控制方法的流程示意图;
图7是本申请第四实施例提供的语音控制方法的流程示意图;
图8是本申请提供的语音控制方法的架构示意图;
图9是本申请实施例提供的语音控制装置的结构示意图;
图10是用来实现本申请实施例的语音控制方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
随着信息技术的快速发展、人工智能技术的兴起和人们生活水平的提高,手机、平板、智能音箱等移动终端的应用越来越广泛,以及居民家庭的车辆拥有量也快速增加,智能语音控制在移动终端、车辆上的车载终端等电子设备上的应用越来越广泛,车载语音控制已经成为电子设备的标准配置,能够使用户通过语音来控制电子设备的功能,尤其应用在车辆时,用户可以通过语音控制越来越多的车辆部件,为用户带来了便捷,提高了用户体验。
目前,用户与电子设备的语音交互过程中,用户发出语音指令后,电子设备可以基于接收到的语音指令执行相应的操作,例如,播放音乐、查询信息、提供导航等,并将通过语音助手向用户作出响应。在实际应用中,电子设备处于网络质量较好的场景时,会通过语音助手较快的对用户的语音指令作出响应,但是在网络质量较差的环境中,用户发出一次语音指令后,语音助手需要较长的时间才对其进行响应,这时用户可能会针对同一语音指令发出多次,存在交互效率低的问题,使得用户体验感差。
此外,电子设备的发出的音量大小仅由用户感知,可能存在噪声太大、太吵的情况,其有可能伤害用户听力,危害用户身体健康。
进一步的,在车辆场景下,若用户多次发出语音指令,会分散用户的注意力,影响行车安全性;而且,虽然现有车载终端能够根据车内音乐的灯光效果调整氛围灯的灯光效果,但也只能按照估计的程序变化颜色和灯光强度,调整方式过于简单。车辆内音乐或噪声的音量大小仅由用户感知,可能存在噪声太大、太吵的情况,其有可能影响行车或者伤害用户听力,即目前车辆中可能存在播放的音频超过健康阈值的情况,危害用户身体健康。
针对上述技术问题,本申请提供了一种语音控制方法,技术构思过程如下:首先电子设备上通常设置有语音采集装置,例如,麦克风,利用该麦克风可以采集用户或扬声设备发出的音频信号流,通过对语音采集装置采集到的音频信号流进行能量估计,可以确定出采集到的音频信号流中每帧音频信号的能量值,其次电子设备大多具有语音交互界面,这样电子设备可以控制语音交互界面上信息的显示,例如,根据音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示音频信号流的能量值,即依次显示音频信号流中每帧音频信号的能量值,这样用户根据语音交互界面上显示的信息,能够获知音频信息已被采集,尤其在发出语音指令时,无需重复发出,提高了用户与电子设备的交互效率,从而提升了用户体验。
基于上述技术构思,本申请提供一种语音控制方法、装置、电子设备及存储介质,应用于数据处理技术领域中的语音技术,以提高用户与电子设备的交互效率,从而提升用户体验。具体的,通过对语音采集装置采集到的音频信号流进行能量估计,可以确定出音频信号流中每帧音频信号的能量值,进而可以根据音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示该音频信号流的能量值。
本申请的技术方案以应用于车辆中的车载终端为例进行说明。可以理解的是,该技术方案同样适用于安装有语音助手,具有语音交互界面的电子设备,关于方案的具体实现类似,本实施例中不对其进行赘述。
示例性的,图1是本申请实施例提供的语音控制方法的一种应用场景示意图。参照图1所示,在该应用场景示出的车辆10中,具有语音采集设备11、车载终端12以及坐在该车辆10中的用户13。
其中,语音采集设备11是用于采集音频信号的设备,例如,麦克风、传声器等。具体的,该语音采集设备11可以采集用户发出的语音指令,也可以采集车辆内扬声设备发出的音频信息,例如,用户交流信息、噪声、音乐等。
车载终端12是能够与语音采集装置11进行通信的设备,其安装有车载语音助手,车载终端12可以通过该车载语音助手与用户进行交互,当该车载语音助手被唤醒时,车载终端12能够获取语音采集设备11采集的音频信号流,并对该音频信号流进行滤波、分帧和能量估计,进而利用确定的音频信号流中每帧音频信号的能量值,在车载终端12具有的语音交互界面120上动态显示采集到的音频信号流的能量值。
可以理解的是,图1示出的应用场景图仅是一种示例性说明。在实际应用中,可以根据实际需求进行调整,例如,车辆内乘坐有多个乘客,车辆具有多个语音采集装置等,本申请实施例并不对其进行限定。
下面,通过具体实施例对本申请的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2是本申请第一实施例提供的语音控制方法的流程示意图。如图2所示,该语音控制方法可以包括如下步骤:
s201、获取音频信号流。
示例性的,电子设备上具有语音采集装置,例如,麦克风等。电子设备可以获取该语音采集装置采集的音频信号流。
示例性的,以车辆内的车载终端进行举例说明。车辆内设置有语音采集装置,例如,麦克风、传声器等用户采集音频信息的装置。可选的,语音采集装置的数量可以为一个,也可以为多个,语音采集装置可以设置在车载终端的语音交互界面上,也可以设置在车座的前排头顶位置,本申请实施例并不限定语音采集装置的数量和设置位置,其可以根据实际场景确定,此处不再赘述。
在本申请的一种可能设计中,语音采集装置可以持续采集车辆内存在的音频信息,例如,人声、音乐声、噪声等各种声音,生成音频信息流。在本申请的另一种可能设计中,语音采集装置还可以在车载语音助手被唤醒的状态下采集用户的语音指令等音频信息,生成音频信号流。可选的,语音指令可以是用户发出的天气问询请求、导航请求、道路状况、请求开启多媒体等等,本实施例并不限定语音指令的具体实现,其可以根据实际场景确定,此处不再赘述。
在实际应用中,电子设备的处理单元与语音采集装置之间能够通信,故语音采集装置基于采集到的音频信息生成音频信号流后,可以将其传输至电子设备的处理单元,相应的,电子设备能够获取该语音采集装置采集到的音频信号流,进而对该音频信号流进行处理。
s202、对音频信号流进行能量估计,确定音频信号流中每帧音频信号的能量值。
示例性的,音频信号流包括连续的多帧音频信号,为了计算并显示音频信号流的能量值信息,电子设备获取到音频信号流后,便可以对该音频信号流包括的每帧音频信号进行能量估计,例如,在确定出每帧信号的幅度值后,通过计算该幅度值的平方,得到每帧音频信号的能量值。
s203、根据音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示该音频信号流的能量值。
在本实施例中,电子设备确定出音频信号流中每帧音频信号的能量值后,便可以基于音频信号流中每帧音频信号的能量值,控制该音频信号流在语音交互界面上进行动态显示,即按照音频信号流中多帧音频信号的顺序,依次在语音交互界面上显示每帧音频信号的能量值,从而实现在语音交互界面上动态显示该音频信号流的能量值的目的,以便用户能够及时获知车内语音的声音强度。
示例性的,电子设备可以首先确定音频信号流在语音交互界面上的显示位置,然后确定出音频信号流能量值的显示方式,最后基于该显示方式在该显示位置上动态显示音频信号流的能量值。关于该步骤的具体实现可以参见下述图3所示实施例中的记载,此处不再赘述。
本申请实施例提供的语音控制方法,通过对获取到的音频信号流进行能量估计,可以确定出音频信号流中每帧音频信号的能量值,进而可以根据音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示该音频信号流的能量值,这样用户根据语音交互界面上显示的信息,能够及时获知音频信息的采集结果,尤其在发出语音指令时,无需重复发出,提高了用户与电子设备的交互效率。进一步的,在车辆场景中,用户无需重复发出语音指令,从而在一定程度上避免了驾驶人注意力分散,提高了行车安全性。
示例性的,在上述实施例的基础上,图3是本申请第二实施例提供的语音控制方法的流程示意图。如图3所示,在本实施例中,在上述s203之前,该方法还可以包括如下步骤:
s300、确定音频信号流对应的语音采集装置。
s301、根据语音采集装置的属性信息,将该语音采集装置在所述语音交互界面上的图标位置确定为音频信号流在语音交互界面上的显示位置。
在本实施例中,当电子设备上设置多个语音采集装置时,语音交互界面上可以显示每个语音采集装置的图标,而且电子设备内设置有语音采集装置与音频信号流显示位置之间的对应关系,所以,每个语音采集装置采集的音频信号流在语音交互界面上的显示位置为该语音采集装置在语音交互界面上的图标位置。
示例性的,电子设备可以基于语音采集装置的数量确定出语音交互界面上的图标数量以及每个图标的位置。这样,电子设备可以根据语音采集装置的属性信息,例如,标识、所在位置等,确定出该语音采集装置在语音交互界面上的图标位置,进而确定出该语音采集装置采集的音频信号流在语音交互界面上的显示位置。
例如,图4是电子设备具有的语音交互界面的示意图。本实施例以电子设备具有两个语音采集装置进行举例说明。如图4所示,在电子设备具有两个语音采集装置(例如,麦克风41和麦克风42)时,该语音交互界面上会显示这两个语音采集装置的图标。例如,在本实施例中,采集到音频信号流的语音采集装置为麦克风41,则音频信号流在语音交互界面上的显示位置是麦克风41在语音交互界面上的图标位置。
在本申请的实施例中,音频信号流的能量值可以采用声波图形表示,具体的,通过声波图形的属性信息表征能量值的大小,例如,声波图形大小、声波图形颜色等。根据采用的声波图形的属性信息,上述s203可以通过不同的实现方式实现。
如图3所示,作为一种示例,若利用声波图形大小表征能量值的大小,则上述s203可以通过s302实现:
s302、在语音交互界面上显示的声波图形大小,跟随每帧音频信号的能量值大小变换。
可选的,电子设备中可以设置声波图形大小和能量值大小的对应关系,即声波图形越大,能量值越高,声波图形越小,能量值越低。因而,在本示例中,电子设备可以控制语音交互界面上显示的声波图形,使该声波图形的大小跟随每帧音频信号的能量值大小变换,从而使得用户能够及时获知电子设备采集音频信息的状态。
示例性的,图5是语音交互界面上显示的音频信号流的能量值变化示意图。在图5所示的示意图中,以三帧音频信号的能量值变化为例进行说明,如图5所示,第一帧音频信号对应的声波图形大小大于第二帧音频信号对应的声波图形大小,但小于第三帧音频信号对应的声波图形大小,则表明第一帧音频信号的能量值高于第二帧音频信号的能量值,但低于第三帧音频信号的能量值。
可以理解的是,上述三帧音频信号的能量值大小和音频信号流包括的音频信号帧数均是一种示例性说明,关于具体的大小或数值需要根据实际场景确定,此处不作赘述。
作为另一种示例,若利用声波图形颜色表征能量值的大小,则上述s203可以通过s303实现:
s303、在语音交互界面上显示的声波图形颜色,跟随每帧音频信号的能量值大小变换。
可选的,电子设备中可以设置声波图形颜色和能量值大小的对应关系,例如,红色的声波图形表示能量值过高,灰色的声波图形表示能量值过低,绿色的声波图形表示能量值处于正常范围。因而,在本示例中,电子设备可以控制语音交互界面上显示的声波图形颜色,使该声波图形颜色跟随每帧音频信号的能量值大小变换,从而使得用户能够及时获知电子设备采集音频信息的状态。
可以理解的是,该示例中以红色的声波图形颜色为红、绿、灰进行解释说明,关于不同能量值使用的具体颜色可以根据实际场景确定,此处不作赘述。
本申请实施例提供的语音控制方法,通过控制在语音交互界面上显示的声波图形大小,跟随每帧音频信号的能量值大小变换,或者,控制在语音交互界面上显示的声波图形颜色,跟随每帧音频信号的能量值大小变换,均可以直观的体现音频信号流的能量大小,以便用户及时获知到语音指令已被采集,提高了交互效率,进而提升了用户体验。
示例性的,在本申请的一种可能设计中,在上述s201之后,该方法还包括如下步骤:
在语音交互界面上显示等待框,该等待框用于指示音频信号流正处于被处理状态。
在该可能设计中,电子设备在获取到语音采集装置采集到的音频信号流,对音频信号流进行处理或解析时,还可以在语音交互界面上显示等待框,以指示音频信号流正处于被处理状态,从而使得用户感知到发出的语音指令已经被录入,在网络质量较差的环境中,避免了用户重复发出语音指令的现象,从而提高了交互效率,也避免了驾车场景中,由于多次发出指令导致驾驶员的注意力分散而存在的行车安全无法保证的问题,提高了行车安全性。
示例性的,在上述实施例的基础上,图6是本申请第三实施例提供的语音控制方法的流程示意图。如图6所示,在本实施例中,上述s202可以通过如下步骤实现:
s601、对音频信号流进行预处理,得到音频信号流包括的多帧音频信号,该预处理包括如下至少一种:滤波降噪、信号分帧。
在本实施例中,电子设备首先可以对获取到音频信号流进行滤波降噪处理,以消除高频信号的影响和改善信噪比,其次,还可以对经过降噪处理后的音频信号流进行分帧处理,得到音频信号流包括的多帧音频信号,从而避免音频信号流的频率和幅值在不同时间出现较大波动的问题。
可选的,经过预处理得到的多帧音频信号可以是长度一致的音频信号帧,每个音频信号帧对应一个序号,这样多个音频信号帧按照序号顺序排列即为音频信号流。可选的,本申请实施例并不限定音频信号流包括的音频信号帧数,其可以根据实际场景确定,此处不再赘述。
s602、对音频信号流包括的每帧音频信号进行幅频分析,计算出音频信号流中每帧音频信号的能量值。
示例性的,电子设备可以首先计算出每帧音频信号的幅值,然后利用能量值为幅值平方的原理,依次计算出音频信号流中每帧音频信号的能量值,进而表征不同帧音频信号的能量差异。
本申请实施例提供的语音控制方法,通过对音频信号流进行滤波降噪和/或信号分帧处理,得到音频信号流包括的多帧音频信号,进而对音频信号流包括的每帧音频信号进行幅频分析,计算出音频信号流中每帧音频信号的能量值。该技术方案,通过对音频信号流进行预处理为得到准确的能量值奠定了基础。
示例性的,在上述实施例的基础上,图7是本申请第四实施例提供的语音控制方法的流程示意图。如图7所示,在本实施例中,在上述s202之前,该语音控制方法还可以包括如下步骤:
s701、判断音频信号流的时长是否小于能够被识别的最短时长;若是,执行s703;若否,执行s202。
在本实施例中,基于电子设备具有的识别能力,电子设备能够识别时长大于能够被识别的最短时长的音频信号流,因而,电子设备获取到音频信号流后,首先需要判断音频信号流的时长是否小于该音频信号流能够被识别的最短时长,若是,则无法执行能量值的计算,这时输出提示信息;若否,则对音频信号流进行能量估计,确定音频信号流中每帧音频信号的能量值。
如图7所示,在上述s203之后,该语音控制方法还可以包括如下步骤:
s702、判断音频信号流中每帧音频信号的能量值是否小于能够被识别的最小能量阈值或者大于最大健康分贝阈值;若是,转到s703;若否,结束。
作为一种示例,当车内的声音强度太小,即每帧音频信号的能量值小于能够被识别的最小能量阈值时,电子设备无法对其识别,因而,电子设备在确定出每帧音频信号的能量值,首先需要判断每帧音频信号的能量值与能够被识别的最小能量阈值的关系,并基于判断结果输出提示信息或结束。
作为另一种示例,当车内的声音强度太高,即每帧音频信号的能量值大于最大健康分贝阈值时,可能会危害车内成员的身体健康,因而,电子设备在确定出每帧音频信号的能量值,还需要判断每帧音频信号的能量值与最大健康分贝阈值的关系,并基于判断结果确定是否需要输出提示信息。
s703、输出提示信息。
示例性的,该提示信息为语音提示信息,和/或,为叠加在音频信号流对应的语音采集装置图标位置上的文字提示信息。
示例性的,在音频信号流的时长小于能够被识别的最短时长时,电子设备可以通过发出语音提示信息的方式和/或在语音交互界面上音频信号流对应的语音采集装置图标位置上叠加文字提示信息,以提示音频信号流的时长过短,无法被识别。可选的,该文字提示信息可以为时长过短,无法被识别等内容。
同理,在音频信号流中每帧音频信号的能量值是否小于能够被识别的最小能量阈值时,电子设备也可以通过发出语音提示信息的方式和/或在语音交互界面上音频信号流对应的语音采集装置图标位置上叠加文字提示信息,以提示音频信号流中音频信号的能量值过低无法被识别。可选的,该文字提示信息可以为能量值过低,无法被识别等内容。
在音频信号流中每帧音频信号的能量值大于最大健康分贝阈值时,电子设备还可以通过发出语音提示信息的方式和/或在语音交互界面上音频信号流对应的语音采集装置图标位置上叠加文字提示信息,以提示电子设备的声音过大,影响了用户身体健康。可选的,该文字提示信息可以为能量值过高,会影响身体健康等内容。
本申请实施例提供的语音控制方法,在音频信号流的时长小于能够被识别的最短时长,和/或,音频信号流中每帧音频信号的能量值小于能够被识别的最小能量阈值或者大于最大健康分贝阈值时,均输出提示信息,从而及时提示用户。
进一步的,在本申请的实施例中,该语音控制方法应用于车载终端时,还包括:
控制车辆内氛围灯的颜色,跟随每帧音频信号的能量值大小变换。
可选的,车载终端确定出音频信号流中每帧音频信号的能量值后,还可以基于每帧音频信号的能量值大小实时控制车辆内氛围灯的颜色,使得氛围灯节奏根据能量值不停的变化,从而避免了氛围灯的显示呆板单一,提高了车内氛围。
综上各实施例介绍了本申请的具体实现方案,下面通过一个具体示例进行说明。
示例性的,图8是本申请提供的语音控制方法的架构示意图。该示意图以车辆的场景进行说明。如图8所示,在本实施例中,语音采集装置为麦克风,车载终端获取到麦克风采集到的音频信号流后进行能量估计,并将得到的每帧音频信号的能量值传输至语音助手,通过语音助手输出提示信息或控制氛围灯的变化。关于该方案的具体实现原理和技术效果可以参见上述实施例中的记载,此处不再赘述。
上述介绍了本申请实施例提到的语音控制方法的具体实现,下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图9是本申请实施例提供的语音控制装置的结构示意图。如图9所示,在本实施例中,该语音控制装置90可以包括:
获取模块901,用于获取音频信号流;
处理模块902,用于对所述音频信号流进行能量估计,确定所述音频信号流中每帧音频信号的能量值;
控制模块903,用于根据所述音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示所述音频信号流的能量值。
在本申请实施例的一种可能设计中,控制模块903,具体用于在语音交互界面上显示的声波图形大小,跟随每帧音频信号的能量值大小变换,和/或,在语音交互界面上显示的声波图形颜色,跟随每帧音频信号的能量值大小变换。
可选的,处理模块902,还用于在控制模块903根据所述音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示所述音频信号流的能量值之前,确定所述音频信号流对应的语音采集装置,根据所述语音采集装置的属性信息,将所述语音采集装置在所述语音交互界面上的图标位置确定为所述音频信号流在语音交互界面上的显示位置。
在本申请实施例的另一种可能设计中,控制模块903,还用于在所述获取模块获取音频信号流之后,在所述语音交互界面上显示等待框,所述等待框用于指示所述音频信号流正处于被处理状态。
在本申请实施例的再一种可能设计中,处理模块902,具体用于:
对所述音频信号流进行预处理,得到所述音频信号流包括的多帧音频信号,所述预处理包括如下至少一种:滤波降噪、信号分帧;
对所述音频信号流包括的每帧音频信号进行幅频分析,计算出所述音频信号流中每帧音频信号的能量值。
在本申请实施例的又一种可能设计中,控制模块903,还用于在所述音频信号流的时长小于能够被识别的最短时长时,输出提示信息。
在本申请实施例的又一种可能设计中,控制模块903,还用于在每帧音频信号的能量值小于能够被识别的最小能量阈值,或者,大于最大健康分贝阈值时,输出提示信息。
可选的,所述提示信息为语音提示信息,和/或,为叠加在所述音频信号流对应的语音采集装置图标位置上的文字提示信息。
在本申请实施例的又一种可能设计中,在语音控制装置为车载终端时,控制模块903,还用于在控制车辆内氛围灯的颜色,跟随每帧音频信号的能量值大小变换。
本申请实施例提供的装置,可用于执行上述方法实施例所述的技术方案,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
进一步的,根据本申请的实施例,本申请还提供了一种电子设备和一种计算机可读存储介质。
图10是用来实现本申请实施例的语音控制方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,台式计算机、工作台和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图10所示,该电子设备包括:一个或多个处理器1001、存储器1002,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器一起使用。图10中以一个处理器1001为例。
存储器1002即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的方法。
存储器1002作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的方法对应的程序指令/模块。处理器1001通过运行存储在存储器1002中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器1002可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储电子设备的使用所创建的数据等。此外,存储器1002可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1002可选包括相对于处理器1001远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述电子设备还可以包括:输入装置1003和输出装置1004。处理器1001、存储器1002、输入装置1003和输出装置1004可以通过总线或者其他方式连接,图10中以通过总线连接为例。
输入装置1003可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1004可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算机程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
本申请实施例还提供一种语音控制方法,包括:
确定获取到的音频信号流中每帧音频信号的能量值;
在语音交互界面上显示所述音频信号流中每帧音频信号的能量值。
关于该方案的具体实现和有益效果可以参见上述方法实施例中的记载,此处不再赘述。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除