基于语音识别用户身份的方法、装置、服务器及存储介质与流程

2021-01-28 17:01:08|

363|

起点商标网

本发明实施例涉及语音识别技术，尤其涉及一种基于语音识别用户身份的方法、装置、服务器及存储介质。

背景技术：

指纹和人脸作为生物特征目前已经广泛用于确认身份的各种技术领域，比如指纹门锁，人脸签到，手机指纹、人脸支付等等，但是另一生物特征却往往被人忽视，那就是声音。一个成年人，声音随年龄的变化是十分微小的，基本可以忽略，男人与女人，儿童与成人，声音的区分度都很大，除此之外，在细颗粒度上，人与人之间的声音差距也很大，利用好这个差距，就能开发出更多更有效的声音生物特征用途。

在人脸识别技术中，随着智能手机设备的快速普及，人脸数据的采集难度才逐渐有所下降，指纹识别技术也发展到屏下采集。对于声纹识别而言，只需要麦克风即可进行采集，不需要添加其他设备。在用户角度，多数人不愿意在摄像头中看到自己的脸，因此对于人脸识别用户的体验效果不高；对于指纹识别而言，指纹识别往往需要识别设备和手指保持清洁，否则识别效果会很差，对于声纹识别来说，只需要发出声音即能完成识别，对于用户而言体验效果更佳。

因此，通过语音进行验证更容易受到用户的欢迎，但是在现有技术的语音识别中，有的只介绍了整个身份确认的方案流程，却为说明流程中各个模块涉及的关键技术，有的采用的技术较为落后，不符合当下深度学习的发展趋势，也不能有效表征人身份的差异性。

技术实现要素：

本发明提供一种基于语音识别用户身份的方法，以实现提高用户账号的安全性，增强了用户的体验。

第一方面，本发明实施例提供了基于语音识别用户身份的方法，包括：

获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；

确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。

可选的，所述获取用户阅读验证信息生成的验证发音之前还包括：

获取用户阅读多条样本信息生成的多条样本发音；

若所述多条样本发音均与对应所述样本信息的预设发音匹配，则根据所述多条样本发音确认用户的声纹范围。

可选的，所述确认所述验证发音是否匹配所述验证信息的预设发音包括：使用第一深度学习模型将所述验证发音转换为验证图形特征，判断所述验证图形特征是否匹配所述验证信息的预设发音对应的预设图形特征。

可选的，所述使用第一深度学习模型将所述验证发音转换为验证图形特征包括：

使用第一深度学习模型将所述验证发音的每个文字、符号或数字单独转换为验证图形特征。

可选的，所述使用第一深度学习模型将所述验证发音转换为验证图形特征包括：

使用第一深度学习模型将所述验证发音的所有文字、符号或数字整体转换为一个验证图形特征进行识别。

可选的，所述根据所述验证发音的声纹确定所述用户身份包括：使用第二深度学习模型将所述验证发音转换为频率分布图，根据所述频率分布图确认用户的声纹以及所述声纹对应的用户身份。

可选的，所述验证信息为随机第一位数的文字、符号或数字中的一种或多种加上第二位数的文字、符号或数字中的一种或多种。

第二方面，本发明实施例还提供了一种基于语音识别用户身份的装置，该装置包括：

语音获取模块，用于获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；

语音识别模块，用于确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。

第三方面，本发明实施例还提供了一种服务器，所述服务器包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述任一所述的基于语音识别用户身份的方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述任一所述的基于语音识别用户身份的方法。

本发明实施例公开了一种基于语音识别用户身份的方法、装置、服务器及存储介质，该方法包括：获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。本发明实施例提供的一种基于语音识别用户身份的方法，通过识别用户阅读验证信息的验证发音识别用户身份，能够在账号登录、交易信息查询、删除交易记录等等常见的涉及隐私操作的环节中有效防范非本人违规操作行为，实现了提高用户账号的安全性，增强了用户的体验。

附图说明

图1为本发明实施例一提供的一种基于动态语音密码的说话人身份识别方法的流程图；

图2为本发明实施例二提供的一种基于动态语音密码的说话人身份识别方法的流程图；

图3为本实施例二中根据波形识别数字的示意图；

图4是本发明实施例中的一种基于语音识别用户身份的装置的结构示意图；

图5为本发明实施例提供的一种计算机服务器的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止，但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。

此外，术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等，但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说，在不脱离本申请的范围的情况下，可以将第一深度学习模型称为第二深度学习模型，且类似地，可将第二深度学习模型称为第一深度学习模型。第一深度学习模型和第二深度学习模型两者都是深度学习模型，但其不是同一深度学习模型。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

实施例一

图1为本发明实施例一提供的一种基于动态语音密码的说话人身份识别方法的流程图，本实施例适用于通过识别用户语音来确认用户身份的情况，具体包括如下步骤：

步骤100、获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种。

本实施例中，验证信息为服务器根据用户的验证请求生成，生成后发送到用户终端以供用户进行语音验证，验证信息类似于手机验证码，例如数字串01273569或者文字串“今天天气不错”，在本实施例中，验证信息以数字验证码为例进行说明，常见的数字验证码有4位、6位和8位数字验证码，考虑之后要采集语音信号，要保证语音长度有效，因此采用8位数字验证码。验证发音为用户阅读验证信息后发出的音频信息，可以通过用户终端的麦克风或者终端app的录音功能等方式进行收集并上传到服务器进行验证。服务器获取到用户的验证发音后，可以通过数据库中的预设发音进行匹配，验证用户的验证发音是否准确。

本实施例中，所述验证信息中的每位文字、符号或数字均随机产生，例如通过随机数发生器对每位文字、符号或数字进行随机产生，也可以通过自定义函数进行随机产生，每位文字、符号或数字通过随机产生避免了验证信息中样本数量太少，导致验证信息数量过少缺乏多样性。替代实施例中，所述验证信息中的每位文字、符号或数字互相独立不重复，例如数字串18475920，该数字串中每位数字均没有重复，保证了每位数字进行单独识别匹配，从而提高了语音识别的准确率。替代实施例中，所述验证信息中声学发音接近的两个文字、符号或数字之间的间隔至少为2位，当出现数字2和数字8时，二者距离需要保持在2位以上，这是由于数字2和数字8在语言学中，声学发音比较接近，易混淆，尤其在二者连续时，因此需要将二者间隔开。替代实施例中，验证信息为随机第一位数的文字、符号或数字中的一种或多种加上第二位数的文字、符号或数字中的一种或多种。为了提高通过率，提升用户体验，通过固定位数的随机数字加上固定位数的固定数字来组成数字验证码，具体举例说明，注册阶段会产生三串验证码，分别为：84672591，07632591，48672591，可以看出，后四位2591会被固定，前四位随机，同样到了验证阶段会得到前四位随机后的新验证码，比如36702591。这样做是为了声纹识别做准备，固定部分文本，将声纹识别限定为文本相关任务，能有效提升识别率，增加验证通过率。

步骤110、确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。

在本实施例中，声纹是指用电声学仪器显示的携带言语信息的声波频谱，声纹具有特定性和稳定性的特点，每个人的声纹都不相同并且随着年龄增长，声纹变化也不大，因此通过声纹识别用户身份成功率较高。预设发音是指文字、符号或数字的标准发音，该标准发音可以通过平均多人的发音来获得，该标准发音用于与用户的验证发音进行对比，判断用户发音是否准确。服务器接收用户根据验证信息生成的验证发音后，若用户发音与预设发音匹配，则说明用户阅读验证信息准确，进行下一步声纹识别进一步确认用户的身份。在声纹识别中，服务器将用户的验证发音与数据库中记录的用户声音备份进行匹配，如果验证发音的声纹与声音备份的声纹相似程度在预设阈值的范围内，则验证通过，如果不在预设阈值的范围内则验证失败。示例性的，用户在登录手机app时需要进行身份验证，此时用户点击开始验证服务器会随机生成一串验证码，用户阅读该验证码的音频信息发送到服务器进行验证匹配，如果通过，则允许用户登录手机app，如果不通过，则不允许该用户登录，保证了用户使用手机app时的安全性。

本实施例公开了一种基于语音识别用户身份的方法，包括：获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。本发明实施例提供的一种基于语音识别用户身份的方法，通过识别用户阅读验证信息的验证发音识别用户身份，能够在账号登录、交易信息查询、删除交易记录等等常见的涉及隐私操作的环节中有效防范非本人违规操作行为，实现了提高用户账号的安全性，增强了用户的体验。

实施例二

图2为本发明实施例二提供的一种基于动态语音密码的说话人身份识别方法的流程图，本实施例适用于通过识别用户语音来确认用户身份的情况，具体包括如下步骤：

步骤200、获取用户阅读多条样本信息生成的多条样本发音。

在本实施例中，样本信息为服务器根据用户的验证请求生成，生成后发送到用户终端以供用户进行语音验证，验证信息类似于手机验证码，例如数字串01273569或者文字串“今天天气不错”。样本语音为用户阅读验证信息后发出的音频信息，可以通过用户终端的麦克风或者终端app的录音功能等方式进行收集并上传到服务器进行验证。在本实施例中，样本信息与实施例一中的验证信息格式和生成规则均相同，具体格式和生成规则详见实施例一。示例性的，在用户第一次使用app时需要收集用户的样本发音用于作为用户在以后登录时的验证音频，服务器会发送多条样本信息到用户手机例如84672591、07632591和48672591，用户需要根据多条样本信息进行阅读以生成多条样本发音发送给服务器进行验证。

步骤210、若所述多条样本发音均与对应所述样本信息的预设发音匹配，则根据所述多条样本发音确认用户的声纹范围。

在本实施例中，服务器接收到用户的多条样本发音然后与预设发音进行匹配，如果多条样本发音都在预设发音的容错范围内，那么验证成功，服务器会将用户多条样本语音对应的声纹的均值与用户的身份信息进行配对存储到数据库中。示例性的，对于用户甲采集多条样本信息为84672591，07632591和48672591，分别对应声纹a、声纹b和声纹c，服务器会计算声纹a、声纹b和声纹c的均值得到声纹d并确认声纹d的阈值范围，并将该声纹d、声纹d的阈值范围与用户甲的各项用户信息例如姓名、电话等等进行存储。当声称为甲的用户提出认证时，采集其声音对应的声纹x，并与数据库中甲的声纹d进行匹配，如果符合声纹d的阈值范围，则说明验证通过，即为用户甲本人。

步骤220、获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种。

步骤230、使用第一深度学习模型将所述验证发音转换为验证图形特征，判断所述验证图形特征是否匹配所述验证信息的预设发音对应的预设图形特征。

在本实施例中，第一深度学习模型为vgg13（轻量版本的vgg模型），用于根据频率谱图识别具体文字、符号或数字。预设图形特征指将验证发音转换为频率分布图形，示例性的，每个数字的频率分布图形均不相同，因此可以通过频率分布图形对每个数字进行区分。在本实施例中，使用第一深度学习模型将验证发音的每个文字、符号或数字单独转换为验证图形特征，即将整个的文字、符号或数字拆分为单个的文字、符号或数字进行逐一识别，如将数字串57043102拆分为5、7、0、4、3、1、0、2八个单独数字逐一识别。在识别过程中，通过去除验证发音中的静音片段切分语音信号，再对每个有声片段进行识别，从而实现对连续语音信号的中文数字识别，在本实施例中，以数字识别为例进行说明。参阅图3，图3为本实施例中根据波形识别数字的示意图，图3中波形为时域信号波形，由于时域信号携带信息比较单一，可供使用特征较少，特别是信号间区分度不高，因此在对语音信号进行分析时常采用傅里叶变换，将时域转化到频域，在频域观察信号分布情况。经过变换后，由于每个数字对应频率分布不同，并且每个数字的共振峰也不相同，因此可以根据在频率图中的频率分布和共振峰情况确认具体数字。在vgg13模型中，训练数据覆盖至少60人以上，有男有女，每一条均为0-9中一个数字的单独发音，并在此基础上进行数据增强，包括修剪、响度补偿、加底噪、调整音高、调整语速，训练过程采用十折交叉验证。

在替代实施例，使用第一深度学习模型将所述验证发音的所有文字、符号或数字整体转换为一个验证图形特征进行识别，即将所有文字、符号或数字作为一个整体进行识别，如将数字串57043102作为整体进行识别。

在替代实施例中，采用语音信号的梅尔能量谱图作为输入特征，第一深度学习模型使用cnn-lstm作为模型，与vgg13模型不同之处在于就是输入、输出不再是单个数字语音信号，都为连续的语音信号，比如，输入为01234567的发音，输出就为01234567八个数字，一种端到端的思想，并加入ctc作为损失函数，它会自动对齐每一帧的预测结果，合并重复项，给出置信度最高的序列结果。

步骤240、使用第二深度学习模型将所述验证发音转换为频率分布图，根据所述频率分布图确认用户的声纹以及所述声纹对应的用户身份。

在本实施例中，第二深度学习模型为采用身份编码模型，模型结构采用cnn、rnn、lstm、gru等的结合，就性能表现择优选用。将声纹输入到身份编码模型中转换为频率分布图，由于每个人的声纹不同，频率分布图也不相同，因此可以通过读频率分布图进行识别来区分每个人的声纹。对于声纹特征的提取阶段，舍弃原始的mfcc特征，主要因为其由人工提取降维而来，主观上筛掉了过多信息，不利于模型自学习，本专利主要采用梅尔能量谱图作为声纹特征，它是在语谱图的基础上用梅尔滤波器组（模拟人的耳蜗）处理之后得到，是对人的听觉系统的描述。梅尔能量谱图表征人能听到的声音的频率分布，是人通过声音辨别事物的深层特征，利用这种在梅尔频域的分布特性，更适合构建说话人识别系统。虽然梅尔频域是非线性的，但普通频域与梅尔频域之间的关系是线性的，在梅尔频域内，人对音调的感知度也是线性的。显然，经过这样的转换，语音信号就变为了携带声纹信息的图像，对于单个信号，其梅尔能量谱图是黑白的，可以理解为单通道的图片。

对于身份编码模型的训练阶段，此阶段更关注模型训练的目标，而非结构，考虑模型复用问题，采用的判别模型不同于生成模型，多个类别只存在一个模型，但也存在类别数固定的问题，一种解决方案为，以交叉熵为损失函数，训练一个千人的分类模型，模型收敛后，可认为其已具备通过输入的声纹特征提取人的身份特征的能力，此时可舍弃最后的分类层，采用倒数第二层的全连接层作为输出层，最终输出的向量即可理解为人的身份编码向量。

在替代实施例一中，直接训练一个身份编码任务，而不再通过分类任务训练一个身份编码任务，具体为采用孪生网络结构，其为结构一样、权重共享的两个模型，每次输入一对两个数据，当二者为同一人时，目标为缩小两个网络输出的差距；当二者为不同人时，目标为增大两个网络输出的差距，最终收敛后，可以理解为模型已经学到了辨别同一个人和不同的人声音的能力，模型输出的结果向量即可作为身份的编码。

在替代实施例二中，基于替代实施例一的思想，采用三元损失函数能得到更好的结果，此时的输入为三个，一个元数据，一个和元数据为同一个人的正例，以及一个和元数据为不同人的负例，目标为对于每次输入，希望元数据和正例间的差距远小于元数据和负例间的差距，这样更利于网络从声纹特征学到不同人的身份特征。

本发明实施例公开了一种基于语音识别用户身份的方法，包括：获取用户阅读多条样本信息生成的多条样本发音；若所述多条样本发音均与对应所述样本信息的预设发音匹配，则根据所述多条样本发音确认用户的声纹范围；获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；使用第一深度学习模型将所述验证发音转换为验证图形特征，判断所述验证图形特征是否匹配所述验证信息的预设发音对应的预设图形特征；使用第二深度学习模型将所述验证发音转换为频率分布图，根据所述频率分布图确认用户的声纹以及所述声纹对应的用户身份。本发明实施例提供的一种基于语音识别用户身份的方法，通过识别用户阅读验证信息的验证发音识别用户身份，能够在账号登录、交易信息查询、删除交易记录等等常见的涉及隐私操作的环节中有效防范非本人违规操作行为，实现了提高用户账号的安全性，增强了用户的体验。

实施例三

本发明实施例所提供的基于语音识别用户身份的装置可以实行本发明任意实施例所提供的基于语音识别用户身份的方法，具备执行方法相应的功能模块和有益效果。图4是本发明实施例中的一种基于语音识别用户身份的装置300的结构示意图。参照图4，本发明实施例提供的基于语音识别用户身份的装置300具体可以包括：

语音获取模块，用于获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；

语音识别模块，用于确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。

可选的，所述获取用户阅读验证信息生成的验证发音之前还包括：

获取用户阅读多条样本信息生成的多条样本发音；

若所述多条样本发音均与对应所述样本信息的预设发音匹配，则根据所述多条样本发音确认用户的声纹范围。

可选的，所述使用第一深度学习模型将所述验证发音转换为验证图形特征包括：

使用第一深度学习模型将所述验证发音的每个文字、符号或数字单独转换为验证图形特征。

可选的，所述使用第一深度学习模型将所述验证发音转换为验证图形特征包括：

使用第一深度学习模型将所述验证发音的所有文字、符号或数字整体转换为一个验证图形特征进行识别。

可选的，所述验证信息为随机第一位数的文字、符号或数字中的一种或多种加上第二位数的文字、符号或数字中的一种或多种。

本实施例公开了一种基于语音识别用户身份的装置，包括：语音获取模块，用于获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；语音识别模块，用于确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。本发明实施例提供的一种基于语音识别用户身份的方法，通过识别用户阅读验证信息的验证发音识别用户身份，能够在账号登录、交易信息查询、删除交易记录等等常见的涉及隐私操作的环节中有效防范非本人违规操作行为，实现了提高用户账号的安全性，增强了用户的体验。

实施例四

图5为本发明实施例提供的一种计算机服务器的结构示意图，如图5所示，该计算机服务器包括存储器410、处理器420，计算机服务器中处理器420的数量可以是一个或多个，图5中以一个处理器420为例；设备中的存储器410、处理器420可以通过总线或其他方式连接，图5中以通过总线连接为例。

存储器410作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的基于语音识别用户身份的方法对应的程序指令/模块(例如，基于语音识别用户身份的装置300中的语音获取模块310和语音识别模块320)处理器420通过运行存储在存储器410中的软件程序、指令以及模块，从而执行设备/终端/设备的各种功能应用以及数据处理，即实现上述的基于语音识别用户身份的方法。

其中，处理器420用于运行存储在存储器410中的计算机程序，实现如下步骤：

获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；

确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。

在其中一个实施例中，本发明实施例所提供的一种计算机设备，其计算机程序不限于如上的方法操作，还可以执行本发明任意实施例所提供的基于语音识别用户身份的方法中的相关操作。

存储器410可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器410可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器410可进一步包括相对于处理器420远程设置的存储器，这些远程存储器可以通过网络连接至设备/终端/设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本实施例公开了一种基于语音识别用户身份的服务器，用于执行以下方法，包括：获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。本发明实施例提供的一种基于语音识别用户身份的服务器，通过识别用户阅读验证信息的验证发音识别用户身份，能够在账号登录、交易信息查询、删除交易记录等等常见的涉及隐私操作的环节中有效防范非本人违规操作行为，实现了提高用户账号的安全性，增强了用户的体验。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种基于语音识别用户身份的方法，该方法包括：

获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；

确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种基于语音识别用户身份的方法中的相关操作。

本发明实施例的计算机可读存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器（ram）、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

存储介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、rf等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

本实施例公开了一种基于语音识别用户身份的存储介质，用于执行以下方法，包括：获取用户阅读验证信息生成的验证发音，所述验证信息包括文字、符号或数字中的一种或多种；确认所述验证发音是否匹配所述验证信息的预设发音，若匹配，则根据所述验证发音的声纹确定所述用户身份。本发明实施例提供的一种基于语音识别用户身份的存储介质，通过识别用户阅读验证信息的验证发音识别用户身份，能够在账号登录、交易信息查询、删除交易记录等等常见的涉及隐私操作的环节中有效防范非本人违规操作行为，实现了提高用户账号的安全性，增强了用户的体验。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。