语音输出控制方法、电子装置及计算机可读存储介质与流程
本发明涉及语音控制,具体而言,主要涉及一种针对语音输出的控制方法、电子装置及计算机可读存储介质。
背景技术:
随着社会科技的发展,人们生活水平的提高,智能设备越来越多地出现在日常生活中。人们通过无线网络诸如蓝牙、wifi等,将各种智能家电例如冰箱、洗衣机、空调、台灯、电视等连接起来,并通过指定语音输入接口进行统一的语音控制。例如,使用音箱来接语音指令,对家电进行控制等。
然而,目前的智能音箱接收用户指令后,反馈执行结果都是通过语音播放的方式反馈给用户,兼容性不强,适用场景单一,用户体验度低。
技术实现要素:
有鉴于此,本发明提出一种语音输出控制方法、电子装置及计算机可读存储介质,能够提高智能设备语音输出的效果,提供用户体验。
为了实现上述目的,本发明提出如下的技术方案:
第一方面,提出一种语音输出控制方法,应用于电子装置中,包括:
获取用户语音输入,识别所述输入中的语音指令;
执行所述语音指令,并接收反馈的执行结果;
检测所述电子装置的声音环境是否正常;
若否,则同时调用语音输出设备和显示单元输出所述执行结果;以及
若是,则调用语音输出设备输出所述执行结果。
优选地,所述检测所述电子装置的声音环境是否正常的步骤,具体包括:
获取所述电子装置所处环境的声音音量;
在所述声音音量超出预设音量时,判定所述声音环境不正常;以及
在所述声音音量未超出预设音量值时,判定所述声音环境正常。
优选地,在所述检测所述电子装置的声音环境是否正常的步骤之前,还包括:
检测所述语音输出设备是否正常;
若是,则检测所述电子装置的声音环境是否正常;以及
若否,则调用所述显示单元输出所述执行结果。
优选地,在所述若否,则同时调用语音输出设备和显示单元输出所述执行结果的步骤之前,还包括:
判断所述声音环境的声音音量是否超出所述语音输出设备的最大音量;若是,则调用所述显示单元输出所述执行结果;以及
若否,则同时调用语音输出设备和显示单元输出所述执行结果。
优选地,在所述若是,则调用语音输出设备输出所述执行结果的步骤之前,还包括:
判断当前时间是否为用户预设时间;
若是,则调用所述语音输出设备输出所述执行结果;以及
若否,则调用所述显示单元输出所述执行结果。
优选地,所述调用语音输出设备输出所述执行结果的步骤,具体包括:
获取所述语音输出设备的默认音量;
根据所述声音环境的声音音量和所述默认音量,设置所述语音输出设备的输出音量,所述输出音量不低于所述声音环境的声音音量;以及调用所述语音输出设备,以所述输出音量输出所述执行结果。
优选地,所述同时调用语音输出设备和显示单元输出所述执行结果的步骤,具体包括:
同时调用所述显示单元和所述语音输出设备,分别以文字显示的方式和以最大音量输出的方式,输出所述执行结果。
优选地,所述调用显示单元输出所述执行结果的步骤,具体包括:
调用所述显示单元以文字显示的方式输出所述执行结果。
第二方面,提出一种电子装置,包括存储器、处理器、以及存储在所述存储器上并可被所述处理器运行的计算机程序指令,所述计算机程序指令被所述处理器执行时,可实现如上文所述的语音输出控制方法。
第三方面,提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被至少一个处理器执行时,可实现如上文所述的语音输出控制方法。
本发明的有益效果:
相较于现有技术,本发明所提供的语音输出控制方法、电子装置及计算机可读存储介质,通过在输出语音指令的执行结果时,针对声音环境是否嘈杂、硬件设备是否完好、用户预设模式的时间分析、输出音量的选择等方面进行自动检测和设定,为用户提供多样化、智能化的执行结果输出方法,满足用户的不同需求,提高用户体验。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施方式,因此不应被看作是对本发明范围的限定。
图1为本发明所述的电子装置的硬件架构示意图;
图2为本发明所述的语音输出控制方法实施例1的流程示意图;
图3为图2中步骤s150的细化流程示意图;
图4为图2中步骤s130的细化流程示意图;
图5为本发明所述的语音输出控制方法实施例2的流程示意图;
图6为本发明所述的语音输出控制方法实施例3的流程示意图;
图7为本发明所述的语音输出控制方法实施例4的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
在下文中,将更全面地描述本发明的各种实施方式。本发明可具有各种实施方式,并且可在其中做出调整和改变。然而,应理解:不存在将本发明的各种实施方式限于在此公开的特定实施方式的意图,而是应将本发明理解为涵盖落入本发明的各种实施方式的精神和范围内的所有调整、等同物和/或可选方案。
在下文中,可在本发明的各种实施方式中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在本发明的各种实施方式中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
在本发明的各种实施方式中,表述“a或/和b”包括同时列出的文字的任何组合或所有组合,例如,可包括a、可包括b或可包括a和b二者。
在本发明的各种实施方式中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施方式中的各种组成元件,不过可不限制相应组成元件。例如,以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如,第一用户装置和第二用户装置指示不同用户装置,尽管二者都是用户装置。例如,在不脱离本发明的各种实施方式的范围的情况下,第一元件可被称为第二元件,同样地,第二元件也可被称为第一元件。
应注意到:在本发明中,除非另有明确的规定和定义,“安装”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接、也可以是可拆卸连接、或者一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也是可以通过中间媒介间接相连;可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,本领域的普通技术人员需要理解的是,文中指示方位或者位置关系的术语为基于附图所示的方位或者位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或者元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的各种实施方式中使用的术语仅用于描述特定实施方式的目的并且并非意在限制本发明的各种实施方式。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施方式所述领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施方式中被清楚地限定。
请参考图1,是本发明所述的电子装置1的硬件架构示意图。
本实施例中,所述电子装置1可以是服务器,诸如机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等;也可以是终端设备,例如包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字tv、台式计算机、智能音箱、电视机等等的固定终端。该电子装置1可以是独立的电子设备,也可以是多个电子装置1组成的电子设备集群。需要说明的是,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
所述的电子装置1可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、显示单元13、语音采集设备14、语音输出设备15、以及通信接口16。需要指出的是,图1示出了具有各种组件的电子装置1,但是应当理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述电子装置1的元件。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子装置1的外部存储设备,例如该电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,所述存储器11还可以既包括所述电子装置1的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述电子装置1的操作系统和各类应用软件,例如本实施例中与语音输出控制相关的计算机可读程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12,在一些实施例中,可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述的与语音输出控制相关的计算机可读程序代码等。
所述显示单元13,可以显示在电子装置1中处理的信息。例如,当电子装置1处于电话通话模式时,显示单元13可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(ui)或图形用户界面(gui)。当电子装置1处于视频通话模式或者图像捕获模式时,显示单元13可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的ui或gui等等。同时,当显示单元13和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元13可以用作输入装置和输出装置。显示单元13可以包括液晶显示器(lcd)、薄膜晶体管lcd(tft-lcd)、有机发光二极管(oled)显示器、柔性显示器、三维(3d)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为toled(透明有机发光二极管)显示器等等。根据特定想要的实施方式,电子装置1可以包括两个或更多显示单元13(或其它显示装置),例如,电子装置1可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
所述语音采集设备14,一般指在电子装置1中用于接收用户输入各种类型的语音信息,采集用户语音输入中的声音信号,并存储为音频数据的的音频输入组件。其中,所述音频数据可被传输至语音识别接口,进行语音指令的识别、执行或其他处理。具体地,所述语音采集设备14,可以是,但不限于,麦克风、录音笔、录音机、随身听、mp3等音频采集设备。
所述语音输出设备15,一般指可以在电子装置1处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将接收的或者在所述存储器11中存储的音频数据转换音频信号并且输出为声音的音频输出组件。而且,所述语音输出设备15可以提供与所述电子装置1执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。具体地,所述语音输出设备15,可以是,但不限于,扬声器、喇叭、音响、音箱、蜂鸣器等等。
所述通信接口16,可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(globalsystemofmobilecommunication,gsm)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi等无线或有线网络的通信接口。该通信接口16通常用于在所述电子装置1与其他智能设备之间的通信连接。
至此,己经详细介绍了本发明相关设备的硬件结构和功能。下面,将基于上述硬件结构和功能,提出本发明的各个实施例。
首先,本发明提出一种语音输出控制方法。
请参考图2,是本发明所述的语音输出控制方法实施例1的流程示意图。在本实施例中,根据不同的需求,图2所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。所述的语音输出控制方法包括:
步骤s110,获取用户语音输入,识别所述输入中的语音指令。
本实施例中,所述电子装置1可以是单独的内置有语音识别功能智能音箱、智能手机、智能电视、平板电脑等设备。一方面,所述电子装置1可以仅连接网络而不与其他智能设备通信连接,该电子装置1仅用于响应用户针对所述电子装置1的语音输入,并根据所述语音输入控制该电子装置1执行与所述电子装置1本身相关的功能。另一方面,所述电子装置1还可以与至少一个智能设备建立连接,并通过物联网(iot)协议与所述至少一个智能设备进行数据传输和通信。此时,该电子装置1用于响应用户针对所述电子装置1、和/或所述至少一个智能设备的语音输入,并根据所述语音输入控制该电子装置1、和/或所述至少一个智能设备,执行与该电子装置1、和/或所述至少一个智能设备相关的功能。
工作时,所述电子装置1首先检测用户声音,若检测到则调用所述语音采集设备14(例如麦克风)采集用户的语音输入;然后,将用户的语音输入转化为音频数据并传输至内置的语音识别模块进行识别,以解析生成预设的标准语音指令;最后,识别所述标准语音指令的内容,若所述标准语音指令是用于控制所述电子装置1本身执行预设操作的指令,则存储所述标准语音指令至所述存储器11,以便后续直接执行;若所述标准语音指令是用于控制与所述电子装置1通信连接的其他智能设备执行预设操作的指令,则发送所述标准语音指令至该智能设备,以便该智能设备执行所述预设操作。
举例而言,假设所述电子装置1为智能音箱、与智能音箱通过wifi和tcp/ip协议连接的是一扫地机器人,则当该智能音箱检测到用户发出“开始扫地”的声音信息时,智能音箱首先调用内置的麦克风对用户声音进行采集;然后,将所采集到的音频数据发送给音箱内设置的语音识别模块进行解析,生成用于控制扫地机器人进行扫地的标准语音指令;最后,根据所述标准语音指令的内容,发送所述标准语音指令至所述扫地机器人。
需要补充的是,本实施例中,所述智能设备可以是智能电视、智能开关、智能空调、智能灯具、窗帘、扫地机器人等。所述连接可包括,但不限于,近场通信(nfc)、射频识别(rfid)、蓝牙(bluetooth)、紫蜂(zigbee)、红外、wi-fi等无线通信方式。所述物联网协议可包括,但不限于,tcp/ip协议、rest/http协议、coap协议、mqtt协议、dds协议、amqp协议、xmpp协议、jms协议等。
步骤s120,执行所述语音指令,并接收反馈的执行结果。
如上文所述,当解析出的标准语音指令为用于控制所述电子装置1本身执行预设操作的指令时,所述电子装置1从所述存储器11中读取所述标准语音指令,并控制所述处理器12执行该标准语音指令,完成与之对应的预设操作。反之,当解析出的标准语音指令为用于控制与所述电子装置1通信连接的其他智能设备执行预设操作的指令时,所述电子装置1发送所述标准语音指令至该智能设备,控制该智能设备执行所述预设操作。
同时,需要说明的是,不管所述语音指令是执行成功还是执行失败,均会生成执行结果。所述执行结果可以是,但不限于,所述预设操作失败、所述预设操作失败成功等。其中,当所述语音指令为控制所述电子装置1本身执行预设操作的指令时,所述执行结果可以从所述电子装置1中直接获取;当所述语音指令为控制与所述电子装置1相连的智能设备执行预设操作的指令时,所述执行结果可以是从所述智能设备接收的其反馈的执行结果。
例如,假设电子装置1为智能音箱、与智能音箱通信连接的是扫地机器人。如果智能音箱接收到的语音指令为控制智能音箱的“播放音乐”指令,则其执行结果可以是“播放成功”或“播放失败”,且该执行结果可以从智能音箱直接获得。如果智能音箱接收到的语音指令为控制扫地机器人的“开始扫地”指令,则其执行结果可以是“扫地启动成功”或“扫地启动成功失败”,且该执行结果一般只能由扫地机器人执行所述语音指令后,负反馈至智能音箱。
步骤s130,检测所述电子装置1的声音环境是否正常。若是,则进入步骤s150;若否,则进入步骤s140。
一般地,语音控制对环境噪音有一定的要求,若电子装置1所处环境的声音环境非常恶劣和嘈杂,例如噪音非常大,声源非常多,则所述电子装置1的语音采集设备14一方面可能无法完成用户语音输入的采集,另一方面则即使完成用户语音输入的采集,后续也无法进行识别和解析。故,本实施例中,需要对所述电子装置1的声音环境进行检测。
具体而言,如图4所示,为步骤s130的细化流程示意图。其中,步骤s130具体包括:
步骤s131,获取所述电子装置1所处环境的声音音量。
步骤s132,在所述声音音量超出预设音量时,判定声音环境不正常。
步骤s133,在所述声音音量未超出预设音量值时,判定声音环境正常。
本实施例中,所述预设音量可以是65分贝或其他任意适宜的值。其中,若所述声音环境的声音音量超出所述预设音量,则说明该声音环境比较嘈杂,不适宜通过语音的方式进行执行结果的输出。换句话说,即在该声音环境条件下,若使用语音的方式输出所述执行结果,用户可能听不到,所述输出可能为无效输出。此时,需要变更执行结果的输出方式。
步骤s140,同时调用所述语音输出设备15和显示单元13输出所述执行结果。
如上文所述,当所述电子装置1的声音环境不正常时,单纯的语音方式已无法满足输出的需求。故,本实施例中,在调用所述语音输出设备15来进行所述执行结果的输出的同时,还调用所述显示单元13来输出所述执行结果。具体而言,可以同时调用所述显示单元13和所述语音输出设备15,分别以文字显示的方式和以最大音量输出的方式,输出执行结果。其中,所述语音输出设备15可以是所述电子装置1的扬声器等。所述显示单元13可以是所述电子装置1的显示屏幕等。
步骤s150,调用所述语音输出设备15输出所述执行结果。
如上文所述,当所述电子装置1的声音环境正常时,使用语音的方式进行所述执行结果的输出即可。其中,需要注意的是,若所述语音输出设备15的默认音量过小,则需要调节去输出音量后,再进行所述执行结果的输出。具体地,如图3所示,为步骤s150的细化流程示意图。所述的步骤s150具体包括:
步骤s151,获取所述语音输出设备15的默认音量;
步骤s152,根据所述声音环境的声音音量和所述默认音量,设置所述语音输出设备15的输出音量,所述输出音量不低于所述声音环境的声音音量;以及
步骤s153,调用所述语音输出设备15,以所述输出音量输出所述执行结果。
通过上述步骤s110-s150,本发明所提出的语音输出控制方法,通过采集和识别用户语音输入,执行所述语音输入中的语音指令而生成执行结果,并在进行执行结果的输出时,分析和检测设备所处的声音环境,在声音环境不正常时使用语音+显示的方式输出执行结果,而在正常时则仅使用语音的方式输出执行结果。这样,既保证了语音交互的效果,又保证了复杂声音环境下的语音交互有效性,提高了用户体验。
进一步地,基于上述本发明所述的语音输出控制方法的实施例1,提出本发明所述的语音输出控制方法的实施例2。
如图5所示,为本发明所述的语音输出控制方法实施例2的流程示意图。根据不同的需求,图2所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
本实施例中,在所述步骤s130之前,所述的语音输出控制方法还包括:
步骤s210,检测所述语音输出设备15是否正常;若是,则执行步骤s130;若否,则进入步骤s220。
步骤s220,调用所述显示单元13输出所述执行结果。
一般地,所述电子装置1与用户之间的语音交互,必须该电子装置1上配备的语音采集设备14和语音输出设备15的支持。故,在进行所述执行结果的输出前,对相关设备机械能检测,是十分必要的。具体而言,本实施例对所述语音输出设备15进行检测,若所述语音输出设备15不正常,无法支持语音输出,则放弃所述执行结果的语音输出方式,转而通过所述显示单元13来进行显示输出。若所述语音输出设备15正常,则继续进入上文实施例1中对所述电子装置1的声音环境的进行检测的步骤。
通过上述步骤s210-s220,本发明所提出的语音输出控制方法,通过在输出执行结果前,预先对语音输出设备进行检测,并在语音输出设备不正常时,及时使用显示单元来完成执行结果的输出。这样,进一步提高语音交互的有效性,提高了用户体验。
更进一步地,基于上述本发明所述语音输出控制方法的实施例1和实施例2,提出本发明所述的语音输出控制方法的实施例3。
如图6所示,为本发明所述的语音输出控制方法实施例3的流程示意图。根据不同的需求,图6所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
本实施例中,在所述步骤s140之前,所述的语音输出控制方法还包括:
步骤s230,判断所述声音环境的声音音量是否超出所述语音输出设备15的最大音量。若是,则执行步骤s220;若否,则进入步骤s130。
一般情况下,当声音环境不正常时,说明所述声音环境中的声源多且声音音量大。此时,若所述声音环境中的声音音量并没有超过所述电子装置1的最大音量,则使用语音的方式输出所述执行结果,对用户而言,可能还是有效的。因而,本实施例对所述声音环境的声音音量进行检测,若所述声音音量未超出所述语音输出设备15的最大音量,则采取语音+显示的方式进行执行结果的输出。反之,所述声音音量已经超出所述语音输出设备15的最大音量,则说明语音方式肯定失效了,仅使用所述显示单元13以显示的方式输出即可。
通过上述步骤s230,本发明所提出的语音输出控制方法,在声音环境恶劣的情况下,根据环境声音进一步进行细分,在语音交互存在有效可能性的情况下,同时支持语音和显示双方式的输出,保证语音交互体验。
再进一步地,基于上述本发明所述语音输出控制方法的实施例1-3,提出本发明所述的语音输出控制方法的实施例4。
如图7所示,为本发明所述的语音输出控制方法实施例4的流程示意图。根据不同的需求,图2所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
本实施例中,在所述步骤s140之前,所述的语音输出控制方法还包括:
步骤s240,判断当前时间是否为用户预设时间。若是,则执行步骤s140;若否,则执行s220。
本实施例中,所述电子装置1可以支持设定多种时间段,用于对应用户的不同时间。例如,可以设定9:00-18:00为工作时间,18:00-22:00为娱乐时间,22:00-9:00为睡眠时间等。当然,在其他实施例中,并不限于上述的时间划分方式,还可以是其他任何适宜的方式,或支持用户自定义。
显而易见地,若当前时间属于睡眠时间,使用语音方式输出所述执行结果的方式是不合时宜的。故,本实施例中,在进行所述执行结果的输出之前,预先判断当前时间是否为用户预设时间,所述预设时间优选为睡眠时间、休息时间等不方便使用语音方式的时间段。此时,若所述当前时间为用户预设时间,则仅支持以显示输出的方式进行所述执行结果的输出。若所述当前时间不为所述用户预设时间,则同时支持语音和显示两种方式输出所述执行结果。
通过上述步骤s240,本发明所提出的语音输出控制方法,进一步考虑用户的时间规划,根据用户时间规划自动选择不同的执行结果输出方式,为用户提供多样化的服务,提高用户体验。
其次,本发明还提出一种电子装置1。
所述电子装置1包括所述存储器11、所述处理器12、以及存储在所述存储器上并可被所述处理器运行的计算机程序指令,所述计算机程序指令被所述处理器12执行时,可实现如下步骤:
步骤s110,获取用户语音输入,识别所述输入中的语音指令。
本实施例中,所述电子装置1可以是单独的内置有语音识别功能智能音箱、智能手机、智能电视、平板电脑等设备。一方面,所述电子装置1可以仅连接网络而不与其他智能设备通信连接,该电子装置1仅用于响应用户针对所述电子装置1的语音输入,并根据所述语音输入控制该电子装置1执行与所述电子装置1本身相关的功能。另一方面,所述电子装置1还可以与至少一个智能设备建立连接,并通过物联网(iot)协议与所述至少一个智能设备进行数据传输和通信。此时,该电子装置1用于响应用户针对所述电子装置1、和/或所述至少一个智能设备的语音输入,并根据所述语音输入控制该电子装置1、和/或所述至少一个智能设备,执行与该电子装置1、和/或所述至少一个智能设备相关的功能。
工作时,所述电子装置1首先检测用户声音,若检测到则调用所述语音采集设备14(例如麦克风)采集用户的语音输入;然后,将用户的语音输入转化为音频数据并传输至内置的语音识别模块进行识别,以解析生成预设的标准语音指令;最后,识别所述标准语音指令的内容,若所述标准语音指令是用于控制所述电子装置1本身执行预设操作的指令,则存储所述标准语音指令至所述存储器11,以便后续直接执行;若所述标准语音指令是用于控制与所述电子装置1通信连接的其他智能设备执行预设操作的指令,则发送所述标准语音指令至该智能设备,以便该智能设备执行所述预设操作。
举例而言,假设所述电子装置1为智能音箱、与智能音箱通过wifi和tcp/ip协议连接的是一扫地机器人,则当该智能音箱检测到用户发出“开始扫地”的声音信息时,智能音箱首先调用内置的麦克风对用户声音进行采集;然后,将所采集到的音频数据发送给音箱内设置的语音识别模块进行解析,生成用于控制扫地机器人进行扫地的标准语音指令;最后,根据所述标准语音指令的内容,发送所述标准语音指令至所述扫地机器人。
需要补充的是,本实施例中,所述智能设备可以是智能电视、智能开关、智能空调、智能灯具、窗帘、扫地机器人等。所述连接可包括,但不限于,近场通信(nfc)、射频识别(rfid)、蓝牙(bluetooth)、紫蜂(zigbee)、红外、wi-fi等无线通信方式。所述物联网协议可包括,但不限于,tcp/ip协议、rest/http协议、coap协议、mqtt协议、dds协议、amqp协议、xmpp协议、jms协议等。
步骤s120,执行所述语音指令,并接收反馈的执行结果。
如上文所述,当解析出的标准语音指令为用于控制所述电子装置1本身执行预设操作的指令时,所述电子装置1从所述存储器11中读取所述标准语音指令,并控制所述处理器12执行该标准语音指令,完成与之对应的预设操作。反之,当解析出的标准语音指令为用于控制与所述电子装置1通信连接的其他智能设备执行预设操作的指令时,所述电子装置1发送所述标准语音指令至该智能设备,控制该智能设备执行所述预设操作。
同时,需要说明的是,不管所述语音指令是执行成功还是执行失败,均会生成执行结果。所述执行结果可以是,但不限于,所述预设操作失败、所述预设操作失败成功等。其中,当所述语音指令为控制所述电子装置1本身执行预设操作的指令时,所述执行结果可以从所述电子装置1中直接获取;当所述语音指令为控制与所述电子装置1相连的智能设备执行预设操作的指令时,所述执行结果可以是从所述智能设备接收的其反馈的执行结果。
例如,假设电子装置1为智能音箱、与智能音箱通信连接的是扫地机器人。如果智能音箱接收到的语音指令为控制智能音箱的“播放音乐”指令,则其执行结果可以是“播放成功”或“播放失败”,且该执行结果可以从智能音箱直接获得。如果智能音箱接收到的语音指令为控制扫地机器人的“开始扫地”指令,则其执行结果可以是“扫地启动成功”或“扫地启动成功失败”,且该执行结果一般只能由扫地机器人执行所述语音指令后,负反馈至智能音箱。
步骤s130,检测所述电子装置1的声音环境是否正常。若是,则进入步骤s150;若否,则进入步骤s140。
一般地,语音控制对环境噪音有一定的要求,若电子装置1所处环境的声音环境非常恶劣和嘈杂,例如噪音非常大,声源非常多,则所述电子装置1的语音采集设备14一方面可能无法完成用户语音输入的采集,另一方面则即使完成用户语音输入的采集,后续也无法进行识别和解析。故,本实施例中,需要对所述电子装置1的声音环境进行检测。
具体而言,如图4所示,为步骤s130的细化流程示意图。其中,步骤s130具体包括:
步骤s131,获取所述电子装置1所处环境的声音音量。
步骤s132,在所述声音音量超出预设音量时,判定声音环境不正常。
步骤s133,在所述声音音量未超出预设音量值时,判定声音环境正常。
本实施例中,所述预设音量可以是65分贝或其他任意适宜的值。其中,若所述声音环境的声音音量超出所述预设音量,则说明该声音环境比较嘈杂,不适宜通过语音的方式进行执行结果的输出。换句话说,即在该声音环境条件下,若使用语音的方式输出所述执行结果,用户可能听不到,所述输出可能为无效输出。此时,需要变更执行结果的输出方式。
步骤s140,同时调用所述语音输出设备15和显示单元13输出所述执行结果。
如上文所述,当所述电子装置1的声音环境不正常时,单纯的语音方式已无法满足输出的需求。故,本实施例中,在调用所述语音输出设备15来进行所述执行结果的输出的同时,还调用所述显示单元13来输出所述执行结果。具体而言,可以同时调用所述显示单元13和所述语音输出设备15,分别以文字显示的方式和以最大音量输出的方式,输出执行结果。其中,所述语音输出设备15可以是所述电子装置1的扬声器等。所述显示单元13可以是所述电子装置1的显示屏幕等。
步骤s150,调用所述语音输出设备15输出所述执行结果。
如上文所述,当所述电子装置1的声音环境正常时,使用语音的方式进行所述执行结果的输出即可。其中,需要注意的是,若所述语音输出设备15的默认音量过小,则需要调节去输出音量后,再进行所述执行结果的输出。具体地,如图3所示,为步骤s150的细化流程示意图。所述的步骤s150具体包括:
步骤s151,获取所述语音输出设备15的默认音量;
步骤s152,根据所述声音环境的声音音量和所述默认音量,设置所述语音输出设备15的输出音量,所述输出音量不低于所述声音环境的声音音量;以及
步骤s153,调用所述语音输出设备15,以所述输出音量输出所述执行结果。
通过上述步骤s110-s150,本发明所提出的电子装置1,通过采集和识别用户语音输入,执行所述语音输入中的语音指令而生成执行结果,并在进行执行结果的输出时,分析和检测设备所处的声音环境,在声音环境不正常时使用语音+显示的方式输出执行结果,而在正常时则仅使用语音的方式输出执行结果。这样,既保证了语音交互的效果,又保证了复杂声音环境下的语音交互有效性,提高了用户体验。
进一步地,基于上述本发明所述的电子装置1的实施例1,提出本发明所述的电子装置1的实施例2。
本实施例中,所述计算机程序指令被所述处理器12执行时,还可在所述步骤s130之前,实现如下步骤:
步骤s210,检测所述语音输出设备15是否正常;若是,则执行步骤s130;若否,则进入步骤s220。
步骤s220,调用所述显示单元13输出所述执行结果。
一般地,所述电子装置1与用户之间的语音交互,必须该电子装置1上配备的语音采集设备14和语音输出设备15的支持。故,在进行所述执行结果的输出前,对相关设备机械能检测,是十分必要的。具体而言,本实施例对所述语音输出设备15进行检测,若所述语音输出设备15不正常,无法支持语音输出,则放弃所述执行结果的语音输出方式,转而通过所述显示单元13来进行显示输出。若所述语音输出设备15正常,则继续进入上文实施例1中对所述电子装置1的声音环境的进行检测的步骤。
通过上述步骤s210-s220,本发明所提出的电子装置1,通过在输出执行结果前,预先对语音输出设备进行检测,并在语音输出设备不正常时,及时使用显示单元来完成执行结果的输出。这样,进一步提高语音交互的有效性,提高了用户体验。
更进一步地,基于上述本发明所述电子装置1的实施例1和实施例2,提出本发明所述的电子装置1的实施例3。
本实施例中,所述计算机程序指令被所述处理器12执行时,还可在所述步骤s140之前,实现如下步骤:
步骤s230,判断所述声音环境的声音音量是否超出所述语音输出设备15的最大音量。若是,则执行步骤s220;若否,则进入步骤s130。
一般情况下,当声音环境不正常时,说明所述声音环境中的声源多且声音音量大。此时,若所述声音环境中的声音音量并没有超过所述电子装置1的最大音量,则使用语音的方式输出所述执行结果,对用户而言,可能还是有效的。因而,本实施例对所述声音环境的声音音量进行检测,若所述声音音量未超出所述语音输出设备15的最大音量,则采取语音+显示的方式进行执行结果的输出。反之,所述声音音量已经超出所述语音输出设备15的最大音量,则说明语音方式肯定失效了,仅使用所述显示单元13以显示的方式输出即可。
通过上述步骤s230,本发明所提出的电子装置1,在声音环境恶劣的情况下,根据环境声音进一步进行细分,在语音交互存在有效可能性的情况下,同时支持语音和显示双方式的输出,保证语音交互体验。
再进一步地,基于上述本发明所述语音输出控制方法的实施例1-3,提出本发明所述的语音输出控制方法的实施例4。
本实施例中,所述计算机程序指令被所述处理器12执行时,还可在所述步骤s140之前,实现如下步骤:
步骤s240,判断当前时间是否为用户预设时间。若是,则执行步骤s140;若否,则执行s220。
本实施例中,所述电子装置1可以支持设定多种时间段,用于对应用户的不同时间。例如,可以设定9:00-18:00为工作时间,18:00-22:00为娱乐时间,22:00-9:00为睡眠时间等。当然,在其他实施例中,并不限于上述的时间划分方式,还可以是其他任何适宜的方式,或支持用户自定义。
显而易见地,若当前时间属于睡眠时间,使用语音方式输出所述执行结果的方式是不合时宜的。故,本实施例中,在进行所述执行结果的输出之前,预先判断当前时间是否为用户预设时间,所述预设时间优选为睡眠时间、休息时间等不方便使用语音方式的时间段。此时,若所述当前时间为用户预设时间,则仅支持以显示输出的方式进行所述执行结果的输出。若所述当前时间不为所述用户预设时间,则同时支持语音和显示两种方式输出所述执行结果。
通过上述步骤s240,本发明所提出的电子装置1,进一步考虑用户的时间规划,根据用户时间规划自动选择不同的执行结果输出方式,为用户提供多样化的服务,提高用户体验。
最后,本发明还提出一种算机可读存储介质。
本实施例中,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被至少一个处理器执行时,可实现如权利要求前文所述的语音输出控制方法。因前文已介绍非常详细,此处不再赘述。
基于上述在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施方式的其他示例可以具有不同的值。
应注意:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本领域普通技术人员可以理解实现上述实施方式方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取可读存储介质中,该计算机程序在执行时,可包括如上述各方法的实施方式的流程。其中,本申请所提供的各实施方式中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)以及存储器总线动态ram(rdram)等。
以上所述实施方式仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除