一种语音播报方法、装置、电子设备和存储介质与流程

2021-01-28 13:01:06|

228|

起点商标网

本申请涉及人工智能技术领域，尤其涉及语音播报技术，具体涉及一种语音播报方法、装置、电子设备和存储介质。

背景技术：

随着语音技术的发展，越来越多的领域都实现了语音交互，而从文本到语音的方式被广泛用于一些不适合通过视觉获取信息的场景，例如，在车载导航的场景中，文字数据可以被转换成自然语音进行输出。

但是目标市场上大多数地图类语音播报产品都未做到个性化，大多数语音播报都是采用相同的文案或者音频，尚未做到用户级别的个性化播报；同时在端内播报时并未考虑播报内容的一致性，这样的播报体系容易让用户感觉产品非常呆板，不够灵活。由于完全没有个性化的音频和文案，所有用户都使用一样的方式播报，这样的方式显然不能吸引用户的注意；另外，在不同播报场景下相似的播报文案来回重复，非常容易造成用户反感非常容易造成用户反感。

技术实现要素：

本申请实施例提供了一种语音播报方法、装置、电子设备和存储介质，使得用户获得多个场景下连贯的个性化体验，从而提升用户对于语音播报的满意度。

第一方面，本申请实施例提供了一种语音播报方法，应用于客户端，该方法包括：

向服务端发送语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；

接收所述服务端返回的所述语音播报请求对应的语音播报指令；

在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。

第二方面，本申请实施例还提供了一种语音播报方法，应用于服务端，该方法包括：

接收客户端发送的语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；

基于所述语音播报请求向所述客户端返回所述语音播报请求对应的语音播报指令，使得所述客户端在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。

第三方面，本申请实施例提供了一种语音播报装置，该装置包括：请求模块、第一接收模块和播报模块；其中，

所述请求模块，用于向服务端发送语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；

所述第一接收模块，用于接收所述服务端返回的所述语音播报请求对应的语音播报指令；

所述播报模块，用于在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。

第四方面，本申请实施例提供了一种语音播报装置，该装置包括：第二接收模块和播报控制模块；其中，

所述第二接收模块，用于接收客户端发送的语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；

所述播报控制模块，用于基于所述语音播报请求向所述客户端返回所述语音播报请求对应的语音播报指令，使得所述客户端在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。

第五方面，本申请实施例提供了一种电子设备，该电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本申请任意实施例所述的语音播报方法。

第六方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本申请任意实施例所述的语音播报方法。

本申请实施例提供了一种语音播报方法、装置、电子设备和存储介质，向服务端发送语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；接收所述服务端返回的所述语音播报请求对应的语音播报指令；在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。本申请实施例能够使用户获得在多个场景下的个性化语音播报体验，从而提升用户对于语音播报的满意度。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请实施例提供的语音播报方法的第一流程图；

图2是本申请实施例提供的语音播报方法的第二流程图；

图3是本申请实施例提供的语音播报系统的框架结构图；

图4是本申请实施例提供的语音播报方法的第三流程图；

图5是本申请实施例提供的语音播报方法的第四流程图；

图6是本申请实施例提供的语音播报的统一性、关联性以及多样性的示意图；

图7是本申请实施例提供的语音播报装置的第一结构示意图；

图8是本申请实施例提供的语音播报装置的第二结构示意图；

图9是用来实现本申请实施例的语音播报方法的电子设备的框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例一

图1是本申请实施例提供的语音播报方法的第一流程图，本实施例可适用于智能语音播报场景下对语音进行播报的情况。本实施例提供的一种语音播报方法可以由本申请实施例提供的语音播报装置或者电子设备来执行，该装置或者电子设备可以通过软件和/或硬件的方式实现，并集成在执行本申请的服务端和客户端中。如图1所示，本实施例的方法包括但不限于如下步骤：

s101、向服务端发送语音播报请求。

在本申请的具体实施例中，服务端可以向客户端提供语音播报服务，服务的内容可以包括诸如向客户端提供资源，保存客户端数据等。客户端也称为用户端，与服务端相对应，服务端可以控制客户端进行个性化语音播报。在智能语音播报的场景下，客户端需要对当前语音播报场景信息进行处理。具体地，客户端可以先解析当前场景需要播报的场景信息、用户信息等相关内容；然后向服务端发送语音播报请求；其中，语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息。

s102、接收服务端返回的语音播报请求对应的语音播报指令。

在本申请的具体实施例中，客户端可为手机、平板、智能手表、可穿戴设备等。用户可以在客户端上可以安装具有语音播报功能的app软件；其中，app软件可以包括app前端和app后端两部分。app前端可以用户提供显示给用户进行语音录制，app后端可以包含文本语音朗读软件开发工具包、播报控制模块以及播报文本接入层。另外，服务端可以设置一个专门用于生成个性化语音包的模块，即语音播报生成中心，语音播报生成中心可以为客户端提供个性化播报服务。服务端接收到客户端发送的语音播报请求之后，可以向客户端返回语音播报请求对应的语音播报指令，由app后端接收语音播报指令。其中，语音播报指令可以包含个性化语音包信息，例如：语音包音频id、文本信息等。

s103、在本地数据库中获取语音播报指令对应的个性化语音包，并将个性化语音包进行播报。

在本申请的具体实施例中，本地数据库用于存储个性化语音包。客户端可以从服务端的语音播报生成中心获取语音播报指令，在语音包信息存储中心下载所获取语音播报指令对应的个性化语音包，并使用个性化语音包中相应的文案或者音频对个性化语音包进行播报。示例性的，在驾车导航软件的语音播报的场景下，app端可以发起导航服务，通过app端播报控制模块访问语音播报生成中心，并且获取导航服务相关的个性化语音包。

可选的，客户端还可以负责异常处理相关的任务，例如：播报异常检测、播报异常处理、播报异常容错、语音包内容更新等。示例性的，客户端从语音播报生成中心接收到语音播报指令，客户端首先会检测语音播报指令中的音频id是否在本地数据库中存在；若存在，客户端会根据此音频id去获取与其对应的音频，最终进行个性化播报。

本实施例提供的技术方案，通过解析当前场景的场景信息、用户信息以及语音包设置信息，获取语音播报指令对应的个性化语音包，并将个性化语音包进行播报。本实施例解决了现有技术中采用相同的文案或音频的播报体系，容易让用户感觉产品非常呆板，不够灵活，造成用户体验差的问题，可以使用户获得在多个场景下的个性化语音播报体验，从而提升用户对于语音播报的满意度。

实施例二

图2是本申请实施例提供的语音播报方法的第二流程图。本申请实施例是在上述实施例的基础上，进一步增加了原始语音包录制以及信息存储。可选的，本实施例对语音播报过程进行详细的解释说明。如图2所示，本实施例的方法包括但不限于如下步骤：

s201、获取用户在语音录制界面上录制的原始语音包。

在本申请的具体实施例中，原始语音包是指语音包的基础信息。例如，语音包的版本信息、语音包的生成时间信息、语音包的文本信息、语音包的声音信息等。客户端可以在app前端向用户提供一个语音录制界面，该界面可以多种选择或者个性化选项，例如，场景选择、称呼选择、风格选择、剧本选择以及录制语音等个性化选项。用户在语音录制界面上能够根据个人喜欢选择录制生成的语音包生效在哪些场景、语音播报的风格和称呼、录制自己的音频或文本并生效在指定的场景下等多种多样的播报玩法。示例性的，当用户达到一个咖啡馆时，客户端的定位装置可以检测到该用户的位置信息，然后将该位置信息携带在语音播报请求中发送至服务端，服务端可以将该位置信息对应的语音播报指令发送至客户端，然后客户端基于该语音播报指令在本地数据库中获取到该位置信息对应的提示语音，例如：少喝咖啡注意休息。

较佳地，客户端可以根据个人偏好、当前场景信息等多种信息选择不同的播报内容。例如，用户设置了当前语音包生效的风格为俏皮，当前为导航拥堵场景，此时会根据风格和场景信息，召回相应的播报内容“拥堵真的不是因为前方有事故”。同时支持运营活动或者商业化活动的定向播报内容推送。

s202、将原始语音包和用户在语音录制界面上选择的个性化设置信息发送至服务端，使得服务端基于原始语音包和个性化设置信息生成一个或者多个个性化语音包。

在本申请的具体实施例中，用户在语音录制界面上设置的一些个性化设置信息，该个性化设置信息可以包括以下其中之一：生效场景、播报风格、播报称呼。客户端将原始语音包和用户在语音录制界面上选择的个性化信息并发送至服务端；然后服务端可以根据用户选择或设置的信息，服务端将原始语音包和个性化设置信息进行语音包打包，生成一个或者多个个性化语音包，提供给用户下载。可选的，语音包可为压缩文件的形式，也可为不做压缩处理的文件形式。

s203、接收服务端返回的一个或者多个个性化语音包的网络地址。

在本申请的具体实施例中，客户端向服务端发送语音播报请求，其中，语音播报请求包含至少包括以下其中之一：场景信息、用户信息以及语音包设置信息。服务端响应于客户端的语音播报请求，并向客户端发送一个或者多个个性化语音包的网络地址；然后客户端可以基于服务端返回的一个或者多个个性化语音包的网络地址，得到压缩文件形式的一个或者多个个性化语音包；基于压缩文件形式的一个或者多个个性化语音包，得到一个或者多个个性化语音包；将一个或者多个个性化语音包保存至本地数据库中。

s204、基于一个或者多个个性化语音包的网络地址，得到压缩文件形式的一个或者多个个性化语音包。

在本申请的具体实施例中，基于一个或者多个个性化语音包的网络地址，客户端在服务端下载压缩文件形式的一个或者多个个性化语音包。

s205、基于压缩文件形式的一个或者多个个性化语音包，得到一个或者多个个性化语音包；将一个或者多个个性化语音包保存至本地数据库中。

在本申请的具体实施例中，客户端可以基于用户针对压缩文件的形式的一个或者多个个性化语音包的下载操作，将一个或者多个个性化语音包存储至本地数据库中。当用户下载到本地数据库之后，app端播报控制模块则会使用该语音包内的信息进行个性化播报。可选的，除了将语音包进行打包存储在本地数据库中，还可将语音包进行云备份存储在云端空间。

s206、向服务端发送语音播报请求；其中，语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息。

s207、接收服务端返回的语音播报请求对应的语音播报指令。

s208、在本地数据库中获取语音播报指令对应的个性化语音包，并将个性化语音包进行播报。

图3是本申请实施例提供的语音播报系统的框架结构图。本申请实施例是在上述实施例的基础上，对语音播报的系统整体的框架图进行详细的解释说明。

本实施例的技术方案主要依托于用户录制的个性化语音包，系统核心架构主要包括三个子模块，分别为：语音播报录制中心、语音播报生成中心和app端。如图3所示，语音播报系统的整体框架如下：语音播报录制中心和app端为客户端中的子模块；语音播报生成中心为服务端中的子模块；其中，语音包录制中心由语音包信息存储单元和语音包录制单元两部分构成；语音播报生成中心由个性化播报服务单元和语音包打包服务单元两部构成。语音播报生成中心为语音播报录制中心和app端提供个性化的语音播报服务。

在本申请的具体实施例中，在客户端上安装具有语音播报功能的app软件，其中，app软件包含app前端和app后端两部分。其中，app前端包含场景、称呼、风格、剧本、录制语音等选项。app后端包含文本语音朗读软件开发工具包、播报控制模块以及播报文本接入层。

在本申请的具体实施例中，语音播报录制中心、语音播报生成中心和app端之间语音播报交互流程为：在app端上生成个性化语音包前端录制界面，该界面中可以包含场景选择、称呼选择、风格选择、剧本选择以及录制语音等个性化选项。在个性化语音包前端录制界面内，用户可以根据个人喜好选择录制生成的语音包生效在哪些场景、语音播报的风格和称呼、录制自己的音频或文本并生效在指定的场景下等多种多样的播报玩法；然后客户端可以将原始语音包和用户在语音录制界面上选择的个性化设置信息发送至服务端，使得服务端基于原始语音包和个性化设置信息生成一个或者多个个性化语音包；当用户在预定场景下时，客户端会向服务端发送语音播报请求；然后服务端响应于客户端发送的语音播报请求，向客户端发送个性化语音包的网络地址；客户端可以接收服务端返回的个性化语音包的网络地址，并基于该网络地址在服务端下载压缩文件形式的个性化语音包，得到个性化语音包，将个性化语音包保存至本地数据库中。较佳地，服务端还可将个性化语音包发送至云端空间进行存储和备份。

示例性的，用户在app端发起导航或者检索请求时，客户端可以通过app端播报控制模块访问语音播报生成中心，并且获取导航服务相关的个性化语音包，并使用个性化语音包中相应的文案或者音频对个性化语音包进行播报。

本实施例提供的技术方案，通过在语音录制界面上设置的生效场景、播报风格、播报称呼等一些个性化信息录制和生成语音包服务以及存储语音包信息，解决了个性化语音包生成以及存储问题，实现了语音播报更加符合用户的习惯和风格，从而提升了用户对于具有语音播报功能类的产品的粘性。

实施例三

图4为本申请实施例提供的语音播报方法的第三流程图。本申请实施例是在上述实施例的基础上，将语音播报方法应用于服务端，对语音播报过程进行解释说明。如图4所示，本实施例的方法包括但不限于如下步骤：

s401、接收客户端发送的语音播报请求。

在本申请的具体实施例中，在智能语音播报场景下，客户端解析当前场景相关信息，并且向服务端发送语音播报请求。相对应的，服务端接收客户端发送的语音播报请求；其中，语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息。

s402、基于语音播报请求向客户端返回语音播报请求对应的语音播报指令，使得客户端在本地数据库中获取语音播报指令对应的个性化语音包，并将个性化语音包进行播报。

可选的，当用户满足预先设置的个性化播报条件时，将预先设置的语音播报指令发送至客户端，使得客户端在本地数据库中获取预先设置的语音播报指令对应的定向播报内容，并将定向播报内容进行播报；或者，当用户满足预先设置的个性化播报条件时，将预先保存的个性化播报文本发送至客户端，使得客户端基于个性化播报文本进行播报。

本实施例提供的技术方案，通过在服务端实现语音播报功能，解决了播报体系容易让用户感觉产品非常呆板，不够灵活，用户体验差等问题，达到了语音播报的统一性、关联性以及多样性效果。

实施例四

图5是本申请实施例提供的语音播报方法的第四流程图。本申请实施例是在上述实施例的基础上，将语音播报方法应用于服务端。可选的，本实施例对语音播报过程进行详细的解释说明。如图5所示，本实施例的方法包括但不限于如下步骤：

s501、接收客户端发送的原始语音包和用户在语音录制界面上选择的个性化设置信息。

在本申请的具体实施例中，用户在语音录制界面上设置的一些个性化信息，客户端将原始语音包和用户在语音录制界面上选择的个性化信息并发送至服务端。服务端接收客户端发送的原始语音包和用户在语音录制界面上选择的个性化设置信息。

s502、基于原始语音包和个性化设置信息生成一个或者多个个性化语音包。

在本申请的具体实施例中，服务端基于原始语音包和个性化设置信息生成一个或者多个个性化语音包。其中，个性化设置信息至少包括以下其中之一：生效场景、播报风格、播报称呼。

s503、接收客户端发送的语音播报请求。

s504、基于语音播报请求向客户端返回语音播报请求对应的语音播报指令，使得客户端在本地数据库中获取语音播报指令对应的个性化语音包，并将个性化语音包进行播报。

可选的，根据原始语音包和预先存储的用户的历史播报信息，调整各个候选个性化语音包对应的权重系数。

在本申请的具体实施例中，为了达到保持语音播报内容的一致性、连贯性和关联性目的。首先，获取用户当前session内的播报信息，初次筛选出一些候选的待播放的个性化语音包；其次，根据客户端中的历史播报信息，进行播报去重、连贯性校验、场景对齐等策略，生成一系列权重系数，对这些候选的待播放的个性化语音包进行再次筛选。

可选的，根据各个候选个性化语音包对应的权重系数，计算得到最优的一个候选语音包，将最优的一个候选语音包作为用户的个性化设置信息对应的语音包。

在本申请的具体实施例中，根据所生成的一系列权重系数，对各个候选的待播放的个性化语音包进行权重计算，最终生效在候选个性化播报内容上，进行相应的播报内容排序，取排序top1播报内容对应的个性化语音包作为最优的语音包下发给app端播报控制模块，并且其对应的标识将为语音播报请求对应的语音播报指令。

图6是本申请实施例提供的语音播报的统一性、关联性以及多样性的示意图。如图6所示，下面对语音播报的统一性、关联性以及多样性的全部过程进行具体说明解释。

在本申请的具体实施例中，客户端可以分别设置了公共出行组件、语音sdk、景区组件、导航组件、检索组件、播报中控服务等等各类组件可以体现出语音播报的统一性、关联性以及多样性。其中，在播报中控服务中，通过设置各种语音播报的内容或文本形式体现播报的多样性，包含温馨内容、纯文本形式、运营内容、自录制形式、商业内容、明星录制形式等等；通过设置各种特征体现语音播报的关联性，包含用户特征分析、用户query拟合、组件联动决策、内容信息决策等等。示例性的，当某一个吃货年轻程序员到某某酒店，语音播报通过用户设置的个性化语音包以及上述各组件筛选出用户满意的语音播报提示。

本实施例提供的技术方案，通过在服务端实现语音播报功能以及在app端播报控制模块中设置了各类组件，解决了播报体系容易让用户感觉产品非常呆板，不够灵活，用户体验差等问题，达到了语音播报的统一性、关联性以及多样性效果。

实施例五

图7是本申请实施例提供的语音播报装置的第一结构示意图。如图7所示，该装置700可以包括：请求模块701、第一接收模块702和播报模块703；其中，

所述请求模块701，用于向服务端发送语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；

所述第一接收模块702，用于接收所述服务端返回的所述语音播报请求对应的语音播报指令；

所述播报模块703，用于在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。

进一步的，所述装置还包括：录制模块704(图中未示出)，用于获取用户在语音录制界面上录制的原始语音包；将所述原始语音包和所述用户在所述语音录制界面上选择的个性化设置信息发送至所述服务端，使得所述服务端基于所述原始语音包和所述个性化设置信息生成一个或者多个个性化语音包；其中，所述个性化设置信息至少包括以下其中之一：生效场景、播报风格、播报称呼。

进一步的，所述装置还包括：存储模块705(图中未示出)，用于接收所述服务端返回的所述一个或者多个个性化语音包的网络地址；基于所述一个或者多个个性化语音包的网络地址，得到压缩文件形式的一个或者多个个性化语音包；基于所述压缩文件形式的一个或者多个个性化语音包，得到所述一个或者多个个性化语音包；将所述一个或者多个个性化语音包保存至所述本地数据库中。

进一步的，所述播报模块703，具体用于响应于所述语音播报指令在本地数据库中查找所述语音播报指令对应的音频id；若在所述本地数据库中查找到所述语音播报指令对应的音频id，基于所述音频id在所述本地数据库中获取所述语音播报指令对应的个性化语音包。

上述语音播报装置可执行本申请实施例一和实施例二所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例一和实施例二提供的语音播报方法。

实施例六

图8是本申请实施例提供的语音播报装置的第二结构示意图，如图8所示，该装置800可以包括：第二接收模块801和播报控制模块802；其中，

所述第二接收模块801，用于接收客户端发送的语音播报请求；其中，所述语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；

所述播报控制模块802，用于基于所述语音播报请求向所述客户端返回所述语音播报请求对应的语音播报指令，使得所述客户端在本地数据库中获取所述语音播报指令对应的个性化语音包，并将所述个性化语音包进行播报。

进一步的，所述装置还包括：生成模块803(图中未示出)，用于接收所述客户端发送的原始语音包和所述用户在语音录制界面上选择的个性化设置信息；基于所述原始语音包和所述个性化设置信息生成一个或者多个个性化语音包；其中，所述个性化设置信息至少包括以下其中之一：生效场景、播报风格、播报称呼。

进一步的，所述生成模块803，还用于根据所述原始语音包和预先存储的所述用户的历史播报信息，调整各个候选语音包对应的权重系数；根据各个候选语音包对应的权重系数，计算得到最优的一个候选语音包，将所述最优的一个候选语音包作为所述用户的个性化设置信息对应的语音包。

进一步的，所述播报控制模块802，还用于当所述用户满足预先设置的个性化播报条件时，将预先设置的语音播报指令发送至所述客户端，使得所述客户端在所述本地数据库中获取所述预先设置的语音播报指令对应的定向播报内容，并将所述定向播报内容进行播报；或者，当所述用户满足预先设置的个性化播报条件时，将预先保存的个性化播报文本发送至所述客户端，使得所述客户端基于所述个性化播报文本进行播报。

上述语音播报装置可执行本申请实施例三和实施例四所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例三和实施例四提供的语音播报方法。

实施例七

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图9所示，是根据本申请实施例的语音播报方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图9所示，该电子设备包括：一个或多个处理器901、存储器902，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。

存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的语音播报方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的语音播报方法。

存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的语音播报方法对应的模块(例如，用于语音播报装置中的请求模块701、第一接收模块702和播报模块703)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的语音播报方法。

存储器902可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据语音播报方法的电子设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器902可选包括相对于处理器901远程设置的存储器，这些远程存储器可以通过网络连接至语音播报的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

语音播报方法的电子设备还可以包括：输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接，图9中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息，以及产生与语音播报方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如，led)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务中，存在的管理难度大，业务扩展性弱的缺陷。

根据本申请实施例的技术方案，向服务端发送语音播报请求；其中，语音播报请求至少包括以下其中之一：场景信息、用户信息以及语音包设置信息；接收服务端返回的语音播报请求对应的语音播报指令；在本地数据库中获取语音播报指令对应的个性化语音包，并将个性化语音包进行播报。本申请实施例能够使用户获得在多个场景下的个性化语音播报体验，从而提升用户对于语音播报的满意度。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除