基于移动终端的语音录入方法及装置、移动终端、服务器和存储介质与流程

2021-01-28 16:01:44|

300|

起点商标网

本发明涉及计算机技术领域，具体涉及一种基于移动终端的语音录入方法及装置、移动终端、服务器和存储介质。

背景技术：

随着计算机技术的不断发展，为了使用户能够方便快捷在个人计算机端录入所需的文字信息，可直接在个人计算机端录入用户的语音信息，并将语音信息转换成文字信息。

在现有技术中，用户录入的语音信息通常是由个人计算机端的外接麦克设备。

显然，现有的语音录入需要携带并插入麦克设备，过度依赖麦克设备，不仅成本高，操作起来也不够便利。

技术实现要素：

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于移动终端的语音录入方法及装置、移动终端、服务器和存储介质。

根据本发明的第一方面，提供了一种基于移动终端的语音录入方法，所述移动终端内安装有第三方应用，所述第三方应用上运行有目标应用端，所述方法包括：

所述目标应用端通过所述移动终端获取个人计算机端的标识符；

通过所述移动终端采集用户录入的语音信息；

将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器，使所述服务器根据所述语音信息生成文字信息，并根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

根据本发明的第二方面，提供了一种基于移动终端的语音录入方法所述方法包括：

接收目标应用端发送的携带有所采集的语音信息和个人计算机端的标识符的语音识别请求；

根据所述语音信息生成文字信息；

根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

根据本发明的第三方面，提供了一种基于移动终端的语音录入装置，所述移动终端内安装有第三方应用，所述第三方应用上运行有目标应用端，所述装置包括：

获取模块，用于所述目标应用端通过所述移动终端获取个人计算机端的标识符；

采集模块，用于通过所述移动终端采集用户录入的语音信息；

发送模块，用于将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器，使所述服务器根据所述语音信息生成文字信息，并根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

根据本发明的第四方面，提供了一种基于移动终端的语音录入装置，所述装置包括：

接收模块，用于接收目标应用端发送的携带有所采集的语音信息和个人计算机端的标识符的语音识别请求；

生成模块，用于根据所述语音信息生成文字信息；

发送模块，用于根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

根据本发明的第五方面，提供了一种移动终端，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行第一方面中任一项所述的基于移动终端的语音录入方法对应的操作。

根据本发明的第六方面，提供了一种服务器，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行第二方面中任一项所述的基于移动终端的语音录入方法对应的操作。

根据本发明的第七方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使所述处理器执行第一方面中任一项所述的基于移动终端的语音录入方法对应的操作。

根据本发明的第八方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使所述处理器执行第二方面中任一项所述的基于移动终端的语音录入方法对应的操作。

根据本发明提供的基于移动终端的语音录入方法及装置，该方法包括：目标应用端通过所述移动终端获取个人计算机端的标识符，通过所述移动终端采集用户录入的语音信息，将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器，使所述服务器根据所述语音信息生成文字信息，并根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。利用上述发明，当用户想要在个人计算机端录入所需的文字信息在个人计算机端录入语音信息，可直接通过移动终端来采集用户的语音信息，并将语音信息转换成文字信息，无需使用个人计算机端的外接麦克设备来录入语音信息，这样可以摆脱对麦克设备的依赖，大大降低了成本，提高了操作的便利性，并且不受空间的限制。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明一个实施例的移动终端侧的基于移动终端的语音录入方法的流程图；

图2示出了根据本发明一个实施例的服务器侧的基于移动终端的语音录入方法的流程图；

图3示出了根据本发明一个实施例的第一种基于移动终端的语音录入装置的示意图；

图4示出了根据本发明一个实施例的第二种基于移动终端的语音录入装置的示意图；

图5示出了根据本发明一个实施例的移动终端的结构示意图；

图6示出了根据本发明一个实施例的服务器的结构示意图；

图7示出了根据本发明实施例的一种移动终端与服务器之间的交互示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的基于移动终端的语音录入的流程图。如图1所示，该方法包括如下步骤：

s101：第三方应用通过所述移动终端获取个人计算机端的标识符。

s102：通过所述移动终端采集用户录入的语音信息。

在实际应用中，由于移动终端方便携带，并且通常都会内置有麦克风，因此，在本说明书实施例中，当用户想要方便快捷的在个人计算机端录入所需的文字信息时，可通过移动终端来录入用户的语音信息，也就是说，用移动终端替代现有技术中的麦克设备来录入用户的语音信息。

进一步的，由于将语音信息转换成文字信息是由服务器实现的，并且服务器具体是与移动终端内应用端实现语音信息等数据的交互，因此，在本说明书实施例中，步骤s101-步骤s103均是由移动终端内应用端实施的。

在此需要说明的是，本说明书实施例将移动终端内应用端定义为目标应用端，用于与服务器进行语音信息等数据的交互，该目标应用端运行在第三方应用上，这样可以缩短开发周期，节省开发人力物力，第三方应用被安装到移动终端内。

进一步的，由于所录入的语音信息需要在个人计算机端显示成文字信息，因此，在本说明书实施例中，在通过移动终端来录入用户的语音信息之前，需要先确定所采集的语音信息再转换成文字信息之后发送给哪个个人计算机端。

进一步的，由于个人计算机端的标识符能够表示个人计算机端的唯一性，因此，在本说明书实施例中，可使用个人计算机端的标识符来确定接收文字信息的个人计算机端是哪个。

综上所述，目标应用端通过移动终端获取个人计算机端的标识符，其次，在获取到个人计算机端的标识符之后，可通过移动终端采集用户录入的语音信息。

进一步的，本说明书实施例给出了一种通过移动终端获取个人计算机端的标识符的实施方式，具体如下：

扫描所述个人计算机端的二维码，获取所述个人计算机端的标识符。

在此需要说明的是，目标应用端的二维码识别程序可调用移动终端的摄像头扫描个人计算机端的二维码，以此得到个人计算机端的标识符，后续，可以根据扫描得到的个人计算机端的标识符建立该个人计算机端的账号并登陆，这样只要该个人计算机端的账号一直处于登陆状态，那么目标应用端在任何时段所采集到的语音信息在转换成文字信息后均会发给该个人计算机端。

s103：将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器。

进一步的，由于本发明是需要将语音信息转换成文字信息发送并显示在个人计算机端上，因此，在本说明书实施例中，在采集用户录入的语音信息之后，需要将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器。

在此需要说明的是，本说明书实施例在将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器的过程中，不一定必须等到全部采集完成，可以边采集边发送给服务器，也就是说，在采集用户录入的语音信息的同时，实时将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器，如，假设用户想要输入的语音信息为“123”，当目标应用端采集到语音信息“1”时就开始发送给服务器，后续，服务器接收到携带有所采集的语音信息和个人计算机端的标识符的语音识别请求后，可执行步骤s201-s203。

通过上述方法，当用户想要在个人计算机端录入所需的文字信息在个人计算机端录入语音信息，可直接通过移动终端来采集用户的语音信息，并将语音信息转换成文字信息，无需使用个人计算机端的外接麦克设备来录入语音信息，这样可以摆脱对麦克设备的依赖，大大降低了成本，提高了操作的便利性，并且不受空间的限制。

在此需要说明的是，目标应用端包括即时通信小程序，第三方应用包括即时通信。

上述是本说明书实施例在移动终端一侧所实施的基于移动终端的语音录入方法，以下为本说明书实施例在服务器一侧所实施的基于移动终端的语音录入方法。

s201：接收目标应用端发送的携带有所采集的语音信息和个人计算机端的标识符的语音识别请求。

进一步的，服务器接收目标应用端发送的携带有所采集的语音信息和个人计算机端的标识符的语音识别请求，并执行步骤s202。

s202：根据所述语音信息生成文字信息。

进一步的，由于本发明是需要将语音信息转换成文字信息显示在个人计算机端上，因此，在本说明书实施例中，在接收到目标应用端发送的携带有所采集的语音信息和个人计算机端的标识符的语音识别请求之后，提取该语音识别请求内的语音信息，并将语音信息转换成文字信息。

在此需要说明的是，本说明书实施例提供了一种根据所述语音信息生成文字信息的实施方式，具体如下：

将所述语音信息进行降噪处理，确定所述语音信息的语言种类，通过所述语言种类对应的预先训练的语音识别模型，将所述语音信息生成文字信息。

在此需要说明的是，语言种类指的是用户当前讲的语言是什么类型的，如，中文类型、英语类型等，不同的语言类型会各自对应一个语音识别模型，每个语音识别模型是由语音样本及其对应的文字样本，通过深度神经网络训练而成的。

s203：根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

进一步的，服务器在将语音信息转换成文字信息后，可直接根据个人计算机端的标识符，将文字信息发送到个人计算机端。

在此需要说明的是，除了直接根据个人计算机端的标识符，将文字信息发送到个人计算机端，也可以接收用户所使用的个人计算机端周期性发送的信息获取请求，其中，该信息获取请求中携带有待验证的个人计算机端的标识符，根据所述目标应用端发送的个人计算机端的标识符和所述待验证的个人计算机端的标识符，验证所述个人计算机端的合法性，在所述个人计算机端合法的情况下，将所述文字信息发送给个人计算机端。

在此还需要说明的是，验证个人计算机端的合法性指的是服务器所接收到的信息获取请求是否是用户当前正在使用的个人计算机端，也就是说，发送信息获取请求的个人计算机端是否是正确的。

另外，在本说明书实施例中，服务器除了向个人计算机端发送文字信息，还可以将文字信息同时发送给目标应用端，并显示。

以上是本说明书实施例提供的两种基于移动终端的语音录入的方法，基于此，本说明书实施例提供了一种基于移动终端的语音录入的装置，如图3和图4所示。

图3为本说明书实施例提供了第一种基于移动终端的语音录入的装置30，所述移动终端内安装有第三方应用，所述第三方应用上运行有目标应用端，该装置包括：

获取模块301，用于所述目标应用端通过所述移动终端获取个人计算机端的标识符；

采集模块302，用于通过所述移动终端采集用户录入的语音信息；

发送模块303，用于将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器，使所述服务器根据所述语音信息生成文字信息，并根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

所述获取模块301具体用于，扫描所述个人计算机端的二维码；获取所述个人计算机端的标识符。

所述发送模块303具体用于，在采集用户录入的语音信息的同时，实时将携带有所采集的语音信息和个人计算机端的标识符的语音识别请求发送给服务器。

所述目标应用端包括：即时通信小程序。

图4为本说明书实施例提供了第二种基于移动终端的语音录入的装置40，该装置包括：

接收模块401，用于接收目标应用端发送的携带有所采集的语音信息和个人计算机端的标识符的语音识别请求；

生成模块402，用于根据所述语音信息生成文字信息；

发送模块403，用于根据所述个人计算机端的标识符，将所述文字信息发送给个人计算机端。

所述生成模块402具体用于，将所述语音信息进行降噪处理；确定所述语音信息的语言种类；通过所述语言种类对应的预先训练的语音识别模型，将所述语音信息生成文字信息。

所述发送模块403具体用于，接收个人计算机端周期性发送的信息获取请求，其中，所述信息获取请求中携带有待验证的个人计算机端的标识符；根据所述目标应用端发送的个人计算机端的标识符和所述待验证的个人计算机端的标识符，验证所述个人计算机端的合法性；在所述个人计算机端合法的情况下，将所述文字信息发送给个人计算机端。

本说明书实施例还提供了一种非易失性计算机存储介质，所述计算机存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于移动终端的语音录入方法。

图5示出了根据本发明实施例的一种移动终端的结构示意图，本发明具体实施例并不对移动终端的具体实现做限定。

如图5所示，该移动终端可以包括：处理器(processor)502、通信接口(communicationsinterface)504、存储器(memory)506、以及通信总线508。

其中：

处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它设备比如服务器等的网元通信。

处理器502，用于执行程序510，具体可以执行上述基于移动终端的语音录入方法实施例中的相关步骤。

具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器cpu，或者是特定集成电路asic(applicationspecificintegratedcircuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。移动终端包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个cpu；也可以是不同类型的处理器，如一个或多个cpu以及一个或多个asic。

存储器506，用于存放程序510。存储器506可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

图6示出了根据本发明实施例的一种服务器的结构示意图，本发明具体实施例并不对服务器的具体实现做限定。

如图6所示，该服务器可以包括：处理器(processor)602、通信接口(communicationsinterface)604、存储器(memory)606、以及通信总线608。

其中：

处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。

通信接口604，用于与其它设备比如移动终端等的网元通信。

处理器602，用于执行程序610，具体可以执行上述基于移动终端的语音录入方法实施例中的相关步骤。

具体地，程序610可以包括程序代码，该程序代码包括计算机操作指令。

处理器602可能是中央处理器cpu，或者是特定集成电路asic(applicationspecificintegratedcircuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。服务器包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个cpu；也可以是不同类型的处理器，如一个或多个cpu以及一个或多个asic。

存储器606，用于存放程序610。存储器606可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

在此需要说明的是，图3所示的基于移动终端的语音录入的装置30位于移动终端内，图4所示的基于移动终端的语音录入的装置40位于服务器内，终移动终端与服务器之间进行数据交互，具体如图7所示。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的互联网电视调度设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。