一种基于对话声音识别情绪的方法及系统与流程

2021-01-28 14:01:44|

217|

起点商标网

本发明涉及情绪识别技术领域，具体涉及一种基于对话声音识别情绪的方法及系统。

背景技术：

情绪是指伴随着认知和意识过程产生的对外界事物的态度，是对客观事物和主体需求之间关系的反应，是以个体的愿望和需要为中介的一种心理活动，在生活中主要表现为喜、怒、哀、乐等几种；而人的上述情绪通过对话过程中的语音可以反应出来。随着ai技术的发展，现有的ai技术能够通过对话语音提取声纹特征达到识别人们的主要情绪类型。

除了生活外，在工作中，情绪的变化对于工作的影响是十分大的。尤其是在依赖人工的需要精细加工的工业化生产领域，员工的情绪对于产品的合格率有着重要的影响。当员工当天的情绪不对时，依赖其生产的产品合格率会大大降低。尤其是在生产环节较多的产品生产时，其中一个环节的员工情绪不对，导致其加工环节不合格，最终后导致其后面的各个环节再怎么努力也得不到合格的产品。这样一来不合格的产品一方面需要返工，另一方面也增加了原料成本。因而生产过程中员工的情绪不能适应其工作岗位的话，间接的增加了产品的生产成本。因此，对于依赖人工的需要精细加工的生产领域对于识别员工的情绪是否适合当前工作有着重要的作用。当员工当前情绪发生变化时，如果能够及时识别并暂停其手中的工作，可以有效的避免其生产的产品合格率过低。

然而目前并无用于工厂生产流水线的员工情绪自动识别技术。尤其是缺乏用于识别工厂生产流水线员工的情绪是否适合其正在进行的工作的技术。

技术实现要素：

为了克服现有的情绪识别方法不能用于工厂生产流水线来识别员工的情绪是否适合其正在进行的工作的不足，本发明提供一种基于对话声音识别情绪的方法。该方法可用于工厂生产流水线，可以识别每个岗位的员工的情绪是否适合其正在进行的工作。

本发明解决上述技术问题的技术方案如下：

一种基于对话声音识别情绪的方法，其包含如下步骤：

获取某一员工工作过程中的对话声音；

基于某一员工工作过程中的对话声音提取该员工的声纹特征；

将该员工的声纹特征与该员工正常工作状态下的标准声纹特征进行对比；判定该员工的情绪是否适合正在进行的工作。

发明人在研究中发现开发该技术的难点在于：对于某特定的岗位特定的员工，由于常规的喜、怒、哀、乐等情绪判断与提高产品的合格率没有直接关系；不能直接用喜、怒、哀、乐等基本的情绪来判断员工是否适合正在进行的工作；用喜、怒、哀、乐等基本的情绪来判断员工是否适正在进行的工作的准确率并不高；因而导致现有的情绪技术并不能用于工厂生产流水线来识别其情绪是否适合当前正在进行的工作。

本发明独创性的通过获取某一员工的对话声音得到该员工的声纹特征，并与该员工正常工作状态下的声纹特征进行对比，用于判定员工的情绪是否适合当前正在进行的工作。该方法无需识别某一员工的情绪是否是喜怒哀乐，直接与其正常工作状态下的声纹特征进行对比，即可判定员工的情绪是否适合正在进行的工作；该方法由于只需与某一员工的标准声纹特征进行对比，大大提高了识别的准确性和便捷程度。该方法成功的克服了现有的情绪识别方法不能用于工厂生产流水线来识别员工的情绪是否适合其正在进行的工作的不足，取得了识别快速准确的识别效果。

本发明还提供一种基于对话声音识别情绪的系统，包括：

对话声音获取模块，所述的对话声音获取模块用于获取某一员工工作过程中的对话声音；

声纹特征提取模块，所述的声纹特征提取模块用于基于某一员工工作过程中的对话声音提取该员工的声纹特征；

情绪判定模块，所述的情绪判定模块用于将该员工的声纹特征与该员工正常工作状态下的标准声纹特征进行对比；判定该员工的情绪是否适合正在进行的工作。

本发明还提供一种终端，所述的终端包括处理器和存储器，所述处理器用于执行存储器中存储的程序，以实现上述方法。

本发明还提供一种存储介质，所述的存储介质存储有一个或多个程序，所述的一个或多个程序可用于被一个或多个处理器执行，以实现上述方法。

有益效果：本发明提供了一种全新的基于对话声音识别情绪的方法和系统。该方法和系统可用于工厂生产流水线，可以识别每个岗位的员工的情绪是否适合其正在进行的工作；解决了现有的情绪识别方法不能用于工厂生产流水线来识别员工的情绪是否适合其正在进行的工作的问题；取得了快速准确的识别效果。

附图说明

图1为本发明基于对话声音识别情绪的方法的流程图。

图2为本发明基于对话声音识别情绪的系统结构示意图。

具体实施方式

以下结合具体实施例来进一步解释本发明，但实施例对本发明不做任何形式的限定。

如图1所述，本发明一种基于对话声音识别情绪的方法，包含如下步骤：

s100.获取某一员工工作过程中的对话声音。

具体的所述的对话声音是通过人工或机器与某一员工进行对话获取。比如可以通过在员工的工位上设置对话装置，与员工进行对话；所述的对话可以通过人工或设定好的语音与员工进行对话，进而获取员工的对话声音，用于提取员工的声纹特征。如，可以在间隔一定时间呼叫员工：“赵某某(员工名字)，工作是否正常？”，员工必须对此呼叫作出规范的回答：“赵某某(员工名字)收到呼叫，工作一切正常……”。

s200.基于某一员工工作过程中的对话声音提取该员工的声纹特征。

具体的，提取该员工的高音声纹特征、中音声纹特征和/或低音声纹特征。本发明从高、中、低音声纹特征角度出发，来解析员工的声音；可以准确且快速的确定员工的当前情绪是否适合正在进行的工作。所述高、中、低音声纹特征的提取可以采用常规的方法予以实现。

在一个优选实施例中，基于某一员工工作过程中的对话声音提取该员工的声纹特征的具体方法为：基于某一员工工作过程中的对话声音，解析出对话声音中该员工的高音部分，提取该员工的高音声纹特征；基于某一员工工作过程中的对话声音，解析出对话声音中该员工的中音部分，提取该员工的中音声纹特征；或，基于某一员工工作过程中的对话声音，解析出对话声音中该员工的低音部分，提取该员工的低音声纹特征。发明人研究发现，在本发明中，进一步将对话声音，解析出对话声音中该员工的高音、中音和低音部分进行组合，可以进一步提高每个岗位的员工的情绪是否适合其正在进行的工作的判断准确性。

在另外一个优选实施例中，基于某一员工工作过程中的对话声音提取该员工的声纹特征的具体方法为：s201.基于某一员工工作过程中的对话声音，解析出对话声音中该员工的高音部分，提取该员工的高音声纹特征；s201.基于某一员工工作过程中的对话声音，解析出对话声音中该员工的中音部分，提取该员工的中音声纹特征；s203.基于某一员工工作过程中的对话声音，解析出对话声音中该员工的低音部分，提取该员工的低音声纹特征；s204.将高音声纹特征、中音声纹特征以及低音声纹特征进行组合得声纹特征。发明人研究发现，在本发明实施例中，进一步将对话声音，解析出对话声音中该员工的高音、中音和低音部分进行组合，可以进一步提高每个岗位的员工的情绪是否适合其正在进行的工作的判断准确性。

s300.将该员工的声纹特征与该员工正常工作状态下的标准声纹特征进行对比；判定该员工的情绪是否适合正在进行的工作。

具体地，该员工正常工作状态下的标准声纹特征为预先储存的该员工正常工作状态下的标准声纹特征；所述的标准声纹特征包括高音声纹特征、中音声纹特征和/或低音声纹特征。

在一个优选实施例中，该员工正常工作状态下的标准声纹特征通过如下方法获取：获取某一员工正常工作过程中的对话声音；基于某一员工正常工作过程中的对话声音，解析出对话声音中该员工的高音部分，提取该员工的高音声纹特征；基于某一员工正常工作过程中的对话声音，解析出对话声音中该员工的中音部分，提取该员工的中音声纹特征；或，基于某一员工正常工作过程中的对话声音，解析出对话声音中该员工的低音部分，提取该员工的低音声纹特征。通过上述方法获得的标准声纹特征，由于是与员工自己的声纹特征进行对比，且从高音、中音或/和低音等声纹特征进行解析；因此，仅需通过一次构建，即可得到可以用于对比的标准声纹特征；避免了现有技术中需要通过大量的人工学习的方法才能得到标准声纹特征的不足。

在另一个优选实施例中，该员工正常工作状态下的标准声纹特征通过如下方法获取：s301.获取某一员工正常工作过程中的对话声音；s302.基于某一员工正常工作过程中的对话声音，解析出对话声音中该员工的高音部分，提取该员工的高音声纹特征；s303.基于某一员工正常工作过程中的对话声音，解析出对话声音中该员工的中音部分，提取该员工的中音声纹特征；s304.基于某一员工正常工作过程中的对话声音，解析出对话声音中该员工的低音部分，提取该员工的低音声纹特征；s305.将高音声纹特征、中音声纹特征以及低音声纹特征进行组合得标准声纹特征。在本发明实施例中，将高音声纹特征、中音声纹特征以及低音声纹特征进行组合可以进一步提高标准声纹特征的准确性。

具体地，判定该员工的情绪是否适合正在进行的工作的具体方法为：该员工的声纹特征与该员工正常工作状态下的标准声纹特征进行对比，若二者声纹特征一致，则判定该员工的情绪适合当前工作，若二者声纹特征不一致，则判定该员工的情绪不适合当前工作。

如图2所述，本发明提供了一种基于对话声音识别情绪的系统，其包含：

对话声音获取模块100，所述的对话声音获取模块100用于获取某一员工工作过程中的对话声音；

声纹特征提取模块200，所述的声纹特征提取模块200用于基于某一员工工作过程中的对话声音提取该员工的声纹特征；

情绪判定模块300，所述的情绪判定模块300用于将该员工的声纹特征与该员工正常工作状态下的标准声纹特征进行对比；判定该员工的情绪是否适合正在进行的工作。

本发明所述的方法和系统独创性的通过获取某一员工的对话声音得到该员工的声纹特征，并与该员工正常工作状态下的声纹特征进行对比，用于判定员工的情绪是否适合当前正在进行的工作。本发明所述的方法系统无需识别某一员工的情绪是否是喜怒哀乐，直接与其正常工作状态下的声纹特征进行对比，即可判定员工的情绪是否适合正在进行的工作；本发明所述的方法和系统由于只需与某一员工的标准声纹特征进行对比，大大提高了识别的准确性和便捷程度。本发明所述的方法成功的克服了现有的情绪识别方法不能用于工厂生产流水线来识别员工的情绪是否适合其正在进行的工作的不足，取得了识别快速准确的识别效果。

在具体应用案例中，如张三工作过程中情绪不佳，系统则可以通过张三工位上的对话装置获取张三的对话声音，然后通过张三的对话声音通过本发明上述方法得到其工作过程中的声纹特征，并将其与张三的标准声纹特征进行对比，若系统识别到张三工作过程中的声纹特征与其标准声纹特征不一致，则可在系统中给出张三的当前情绪不适合正在进行的工作的提示。管理人员则可及时暂停其手头的工作，可以对其进行情绪开导，或将其调至其它受其当前情绪影响较小的岗位；避免产品合格率因员工情绪而降低的问题。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除