音量调节方法、装置、设备和存储介质与流程

2021-01-28 13:01:47|

302|

起点商标网

本发明实施例涉及语音交互
技术领域：
，尤其涉及一种音量调节方法、装置、设备和存储介质。
背景技术：
：随着人工智能技术的快速发展，人机语音交互也取得了长足的进步，具备语音交互功能的智能设备也得到了越来越多的用户的青睐。目前，用户与智能设备进行人机交互时，智能设备的播报音量为上一次设置的音量，导致当前的播报音量不适用于当前的情境，比如：过大或过小，因此需要用户进行手动或者语音调整，导致用户体验不好。技术实现要素：本发明实施例提供一种音量调节方法、装置、设备和存储介质，用于根据环境噪音和用户的语音指令调节音量。第一方面，本发明实施例提供一种音量调节方法，包括：获取所述智能设备所处环境的环境噪音；获取到用户输入的语音指令时，根据所述环境噪音和所述语音指令，获取第一音量；将所述智能设备的输出语音的音量调节至所述第一音量。可选的，所述根据所述环境噪音和所述语音指令，获取第一音量，包括：获取所述语音指令的音量；若所述语音指令的音量大于第一音量阈值，根据所述环境噪音，获取所述第一音量。可选的，所述获取所述语音指令的音量，包括：获取所述语音指令的振幅值；根据所述语音指令的振幅值，计算得到所述语音指令的音量。可选的，所述根据所述环境噪音，获取所述第一音量，包括：获取所述环境噪音的振幅值；根据所述环境噪音的振幅值，计算得到所述环境噪音的音量；根据第一映射关系，获取与所述环境噪音的音量对应的第一音量，所述第一映射关系包括环境噪音的音量与第一音量的对应关系。可选的，所述方法还包括：若所述语音指令的音量小于第二音量阈值，根据第二映射关系，获取与所述语音指令的音量对应的第一音量，所述第二映射关系包括语音指令的音量与第一音量的对应关系。第二方面，本发明实施例提供一种代码生成装置，其特征在于，包括：第一获取模块，用于获取所述智能设备所处环境的环境噪音；所述第一获取模块，还用于获取到用户输入的语音指令时，根据所述环境噪音和所述语音指令，获取第一音量；调节模块，用于将所述智能设备的输出语音的音量调节至所述第一音量。可选的，所述第一获取模块，具体用于：获取所述语音指令的音量；若所述语音指令的音量大于第一音量阈值，根据所述环境噪音，获取所述第一音量。可选的，所述第一获取模块，具体用于：获取所述语音指令的振幅值；根据所述语音指令的振幅值，计算得到所述语音指令的音量。可选的，所述第一获取模块，具体用于：获取所述环境噪音的振幅值；根据所述环境噪音的振幅值，计算得到所述环境噪音的音量；根据第一映射关系，获取与所述环境噪音的音量对应的第一音量，所述第一映射关系包括环境噪音的音量与第一音量的对应关系。可选的，所述装置还包括：第二获取模块，用于若所述语音指令的音量小于第二音量阈值，根据第二映射关系，获取与所述语音指令的音量对应的第一音量，所述第二映射关系包括语音指令的音量与第一音量的对应关系。第三方面，本发明实施例提供一种智能设备，包括：存储器和处理器；所述存储器，用于存储程序代码；所述处理器，用于调用所述程序代码执行如第一方面本发明实施例所述的音量调节方法。第四方面，本发明实施例提供一种可读存储介质，所述可读存储介质上存储有计算机程序；所述计算机程序在被执行时，实现如第一方面本发明实施例所述的音量调节方法。本发明实施例提供一种音量调节方法、装置、设备和存储介质，该方法包括：获取智能设备所处环境的环境噪音，获取到用户输入的语音指令时，根据所述环境噪音和所述语音指令，获取第一音量，将所述智能设备的输出语音的音量调节至所述第一音量。在该技术方案中，根据用户的语音指令和环境噪音，来控制智能设备的输出音量，使得智能设备的输出音量与当前情境相匹配，提高了用户体验。附图说明图1为本发明一实施例提供的音量调节的场景示意图；图2为本发明一实施例提供的音量调节方法的流程图；图3为本发明另一实施例提供的音量调节方法的流程图；图4为本发明一实施例提供的音量调节装置的结构示意图；图5为本发明另一实施例提供的音量调节装置的结构示意图；图6为本发明一实施例提供的智能设备的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。图1为本发明一实施例提供的音量调节的场景示意图，如图1所示，本发明实施例提供的音量调节方法可以应用于智能设备中，该智能设备可以为智能手机、智能音箱、智能机器人等，本实施例对此不做限制。目前，用户与智能设备进行人机交互时，智能设备的播报音量为上一次设置的音量，例如，用户在前一天使用智能设备时，因为当时使用环境较吵闹，将智能设备的音量调节的比较高，第二天再使用该智能设备时，播报音量与前一天的音量一致，然而，由于当前较安静，采用上一次的播报音量会使得用户感到刺耳，因此，需要用户手动或者语音进行调节，这样导致用户体验不好。针对该问题，本发明实施例提供了一种音量调节方法，该方法包括：获取智能设备所处环境的环境噪音，获取到用户输入的语音指令时，根据所述环境噪音和所述语音指令，获取第一音量，将所述智能设备的输出语音的音量调节至所述第一音量。在该技术方案中，根据用户的语音指令和环境噪音，来控制智能设备的输出音量，使得智能设备的输出音量与当前情境相匹配，提高了用户体验。下面以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。图2为本发明一实施例提供的音量调节方法的流程图，该方法可以由任意执行音量调节方法的装置来执行，该装置可以通过软件和/或硬件实现。本实施例中，该装置可以集成在智能设备中。如图2所示，该方法包括以下步骤：s101、获取智能设备所处环境的环境噪音。通常情况下，智能设备所处环境的环境噪音不是一成不变的，而是随着时间的推移，该环境噪音可以是增大的，也可以是减小的，因此，s101可以包括：获取第一预设时长内智能设备所处环境的环境噪音。其中，第一预设时长的起始点可以为该智能设备的开机时刻，第一预设时长的终点可以为获取到用户输入的语音指令的时刻。示例性地，智能设备安装有环境噪音采集应用程序(application，app)，当智能设备开机后，环境噪音采集app启动，通过用户授权，允许开启环境噪音采集权限，开始采集环境噪音。相应的，智能设备即实时获取到环境噪音，直至获取到用户输入的语音指令。可选的，智能设备具有定位功能，若检测到其所处位置发生变化，则重新开始采集环境噪音，即，从开机时刻开始采集的环境噪音清零，从新的位置重新采集环境噪音，那么第一预设时长的起始点则为位于新位置的时刻。这样，避免引入其它环境的环境噪音，使得智能设备的输出音量和当前环境不相匹配。s102、获取到用户输入的语音指令时，根据环境噪音和语音指令，获取第一音量。在本实施例中，智能设备安装有语音采集应用程序(application，app)，当智能设备开机后，语音app启动，通过用户授权，允许开启语音采集权限，则可获取用户输入的语音指令。在人机语音交互过程中，用户通常给智能设备输入语音指令，例如“今天天气怎么样”、“播放青花瓷”、“打电话给小王”，智能设备可以根据该语音指令，播报对应的语音。获取到用户输入的语音指令时，可以获取环境噪音的音量和语音指令的音量，并根据环境噪音的音量和该语音指令的音量，获取第一音量，第一音量为智能设备的输出语音的音量，输出语音包括语音指令对应的应答语音。其中，第一音量为用户可以听见的、且不会对用户造成刺耳等不适感的音量。s103、将智能设备的输出语音的音量调节至第一音量。获取到第一音量之后，将智能设备的输出语音的音量调节至第一音量，这样，使得用户既可以听见输出语音，还不会产生不适感，提高了用户体验。可选的，所述方法还包括：s104、未获取到用户输入的语音指令时，根据环境噪音，获取第一音量。在实际应用过程中，还可以使用智能设备执行一些重要事件的提醒，例如，闹钟等，现有技术中，提醒语音的音量也都会依赖于上一次设置的音量，例如，上一次设置的音量比较大，而当前是清晨，大的音量会使人产生不适感。因此，在本实施例中，未获取待用户输入的语音指令时，还可以根据环境噪音，获取第一音量，第一音量为智能设备的输出语音的音量，输出语音包括预先设置的提醒语音。可选的，从智能设备开机便采集其所处环境的环境噪音，则未获取到用户输入的语音指令时，根据环境噪音，获取第一音量，包括：未获取到用户输入的语音指令时，根据第二预设时长的环境噪音，获取提醒语音的音量，其中，第二预设时长的终点为提醒语音的播放时刻，第二预设时长的起始点为与提醒语音的播放时刻相差预设时间间隔的时刻，即，从提醒语音的播放时刻往前预设时间间隔的时刻，本实施例对预设时间间隔不做特别限制，根据实际情况确定即可。其中，根据环境噪音，获取第一音量的一种具体实现参见图3实施例，在此不再赘述，然后执行s103。本实施例提供的音量调节方法，该方法包括：获取智能设备所处环境的环境噪音，获取到用户输入的语音指令时，根据环境噪音和语音指令，获取第一音量，将智能设备的输出语音的音量调节至第一音量。在该技术方案中，根据用户的语音指令和环境噪音，来控制智能设备的输出音量，使得智能设备的输出音量与当前情境相匹配，提高了用户体验。在上述实施例的基础上，图3为本发明另一实施例提供的音量调节方法的流程图，如图3所示，上述s102可以通过如下步骤实现：s201、获取语音指令的音量。其中，语音指令的音量以分贝(decibel，db)表示。在本实施例中，智能设备可以具有音量检测功能，获取到语音指令之后，可以直接获取该语音指令的音量。可选的，步骤s201具体包括：a1：获取语音指令的振幅值。在本实施例中，调用多媒体录音mediarecoder中的振幅amplitude计算方法，获取语音指令的振幅值，语音指令的振幅值为振幅最大值或者振幅平均值。a2：根据语音指令的振幅值，计算得到语音指令的音量。通过公式(1)计算得到语音指令的音量：其中，ldb为语音指令的音量，a1为语音指令的振幅值，a0为参考振幅值，a0例如可以设为1，表示智能设备能够获取的最小声音振幅。s202、若语音指令的音量大于第一音量阈值，根据环境噪音，获取第一音量。在本实施例中，若语音指令的音量大于第一音量阈值，则根据环境噪音，获取第一音量，这样用户方可听见智能设备的输出语音，第一音量阈值可以根据实际情况选取，本实施例不做特别限制。步骤s202具体包括：b1：获取环境噪音的振幅值。在本实施例中，环境噪音的振幅值可以为第一预设时长内的振幅最大值或者第一预设时长内的振幅平均值，可以调用多媒体录音mediarecoder中的振幅amplitude计算方法，获取环境噪音的振幅值。b2：根据环境噪音的振幅值，计算得到环境噪音的音量。具体地，通过公式(1)计算得到环境噪音的音量，其中，ldb为环境噪音的音量，将环境噪音的振幅值代入a1，a0为参考振幅值，例如可以设为1，表示智能设备能够获取的最小声音振幅。b3、根据第一映射关系，获取与环境噪音的音量对应的第一音量。在本实施例中，第一映射关系包括环境噪音的音量与第一音量的对应关系，查询第一映射关系，获取与环境噪音的音量对应的第一音量，该第一音量不仅使用户可以听得见，还不会使用户产生不适感。示例性地，第一映射关系以表格的形式进行存储，表1为第一映射关系的示意图。表1环境噪音的音量(单位db)具体描述第一音量0-20环境很静，能听见落叶落地大于环境噪音的音量，且不超过20db20-40环境安静，犹能听清轻声絮语大于环境噪音的音量，且不超过40db40-60有一般噪音，能听清普通室内谈话大于环境噪音的音量，且不超过60db60-70环境吵闹，长时间有损听力神经大于环境噪音的音量，且不超过70db>70环境异常吵闹，长时间有损听力神经不低于70db如表1所示，根据第一映射关系，能够获取与环境噪音对应的第一音量，例如，若语音指令的音量大于第一音量阈值，环境噪音的音量为30db，根据第一映射关系，确定第一音量大于30db且不超过40db，例如，35db。可选的，所述方法还包括：s203、若语音指令的音量小于第二音量阈值，根据第二映射关系，获取与语音指令的音量对应的第一音量。在实际应用中，若语音指令小于第二音量阈值，表明用户在较小声的说话，例如，当时有人在睡觉，则根据第二映射关系，获取与语音指令的音量对应的第一音量，第二映射关系包括语音指令的音量与第一音量的对应关系，若根据环境噪音确定第一音量，得到的第一音量可能会比较大，影响用户体验。其中，第一音量阈值可以根据实际情况选取，本实施例不做特别限制。示例性地，第二映射关系以表格的形式进行存储，表2为第二映射关系的示意图。表2语音指令的音量(单位db)具体描述第一音量0-20用户在用极低音量说话，如悄声细语说话，大于环境噪音的音量，且不超过20db20-40用户在用较低音量说话，如在安静办公室里说话大于环境噪音的音量，且不超过40db40-60用户在用正常音量，如在办公室里说话大于环境噪音的音量，且不超过60db60-70用户在用极大音量说话，如在户外说话大于环境噪音的音量，且不超过70db>70用户在用超级大音量说话，如在工厂厂房呼喊远处的人不低于70db举例来说，若语音指令的音量小于第二音量阈值，语音指令的音量为50db，根据第二映射关系，确定第一音量为大于50db且不超过60db，例如，第一音量为55db。示例性地，第一音量阈值可以为60db，即，语音指令的音量大于60db时，根据环境噪音，获取第一音量；第二音量阈值可以为40db，即，语音指令的音量小于40db时，根据第二映射关系，获取与语音指令的音量对应的第一音量。进一步地，若语音指令的音量处于第一音量阈值与第二音量阈值之间，即，大于40db小于60db时，表明用户语音正常、环境噪音也正常，则可以根据语音指令或者环境噪音确定第一音量，可以通过上述公式(1)计算得到第一音量。本实施例提供的音量调节方法，该方法包括：获取语音指令的音量，若语音指令的音量大于第一音量阈值，根据环境噪音，获取第一音量，若语音指令的音量小于第二音量阈值，根据第二映射关系，获取与语音指令的音量对应的第一音量。根据用户的语音指令和环境噪音，来控制智能设备的输出音量，使得智能设备的输出音量与当前情境相匹配，提高了用户体验。图4为本发明一实施例提供的音量调节装置的结构示意图，如图4所示。本实施例提供的音量调节装置40包括：第一获取模块41，用于获取所述智能设备所处环境的环境噪音；所述第一获取模块41，还用于获取到用户输入的语音指令时，根据所述环境噪音和所述语音指令，获取第一音量；调节模块42，用于将所述智能设备的输出语音的音量调节至所述第一音量。可选的，所述第一获取模块41，具体用于：获取所述语音指令的音量；若所述语音指令的音量大于第一音量阈值，根据所述环境噪音，获取所述第一音量。可选的，所述第一获取模块41，具体用于：获取所述语音指令的振幅值；根据所述语音指令的振幅值，计算得到所述语音指令的音量。可选的，所述第一获取模块41，具体用于：获取所述环境噪音的振幅值；根据所述环境噪音的振幅值，计算得到所述环境噪音的音量；根据第一映射关系，获取与所述环境噪音的音量对应的第一音量，所述第一映射关系包括环境噪音的音量与第一音量的对应关系。本实施例的音量调节装置，可以用于执行上述各方法实施例中的技术方案，其实现原理和技术效果类似，此处不再赘述。图5为本发明另一实施例提供的音量调节装置的结构示意图，如图5所示，所述装置40还包括：第二获取模块43，用于若所述语音指令的音量小于第二音量阈值，根据第二映射关系，获取与所述语音指令的音量对应的第一音量，所述第二映射关系包括语音指令的音量与第一音量的对应关系。本实施例的音量调节装置，可以用于执行上述各方法实施例中的技术方案，其实现原理和技术效果类似，此处不再赘述。图6为本发明一实施例提供的智能设备的结构示意图，如图6所示，本实施例的智能设备50可以包括：存储器51和处理器52。其中，存储器51与处理器52例如可以通过总线53连接。所述存储器51，用于存储程序代码；所述处理器52，用于通过执行所述计算机程序来实现前述方法实施例中任一实现方式提供的代码生成方法。本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现前述方法实施例中任一实现方式提供的音量调节方法。在本发明所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本申请各个实施例所述方法的部分步骤。应理解，上述处理器可以是中央处理单元(英文：centralprocessingunit，简称：cpu)，还可以是其他通用处理器、数字信号处理器(英文：digitalsignalprocessor，简称：dsp)、专用集成电路(英文：applicationspecificintegratedcircuit，简称：asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。存储器可能包含高速ram存储器，也可能还包括非易失性存储nvm，例如至少一个磁盘存储器，还可以为u盘、移动硬盘、只读存储器、磁盘或光盘等。总线可以是工业标准体系结构(industrystandardarchitecture，isa)总线、外部设备互连(peripheralcomponent，pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture，eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(applicationspecificintegratedcircuits，简称：asic)中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页1 2 3

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。