HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种基于人工智能的电网快速调度指挥系统及方法与流程

2021-01-28 16:01:47|323|起点商标网
一种基于人工智能的电网快速调度指挥系统及方法与流程

本公开涉及通信技术领域,特别涉及一种基于人工智能的电网快速调度指挥系统及方法。



背景技术:

本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。

上级电力公司(以下简称“公司”)的电网调度是各级电网安全稳定运行的指挥和决策大脑,主要负责电网运行方式调整、停送电检修、新能源消纳、调整电厂出力、处置电网突发事故等工作。作为电网调度指挥的主要手段,调度电话是调度指令上传下达的有效手段,且通话内容需要全程录音,用于电网事故追溯和安全责任界定。目前,随着特高压、500kv变电站日益增多,电网运行方式也日益复杂,省调调度大厅使用调度电话上传下达的调度指令日益增多。因此,电网调度指挥对调度电话的要求越来越高,目前传统的调度电话使用和运维模式已不能适应目前新形势下的智能、高效、迅速的要求。

本公开发明人发现,现有的调度方式存在问题:

一是调度台拨号需满屏找调度对象,耗时长、体验差。调度台作为调度电话语音交换的前台设备,主要应用在省调、地调、特高压站等站点的电网调度指挥中,调度台上存储调度对象的联系方式用于日常调度指挥。随着特高压、500kv站等新建站设备越来越多,电力调度业务不断地丰富,调度员需要联系的调度对象越来越多,目前省调调度对象已达400多个,分布在调度台的十面屏,调度员在下达调度指令前需满屏查找站点,体验差、效率低。在遇到突发事故需紧急通知所涉地调、变电站、电厂时,调度员需查找事故处置应急预案,确定调度对象后再逐一电话通知,耗时长、效率低。

二是调度录音查询需逐条播放,流程繁琐、检索效率低。调度录音主要作用是对电网调度指令、电网事故处置通话内容进行记录,为电网事故分析和责任界定提供依据。按照调度规程要求,为确保调度录音随时可查、能查,目前公司已部署具备省调主调、备调、变电站“三重备份”的调度录音系统,录音保存的完整性和安全性得到了极大提升。调度员一般在电网事故追溯、调度指令听不清、交接班内容记录不完备等场景下查询调度录音,但目前录音查询以时间维度检索为主,通过大概的时间检索出特定范围的录音条目,若精准定位想要查询的录音,需对每条录音逐一播放,通过一遍遍试听进一步确认,查询过程繁琐且耗费时间。



技术实现要素:

为了解决现有技术的不足,本公开提供了一种基于人工智能的电网快速调度指挥系统及方法,实现了对调度员调度语音指令的自动识别、语音转写和智能检索等功能,提高了调度员调度指挥工作效率和准确度,同时便于事故追溯和安全责任界定。

为了实现上述目的,本公开采用如下技术方案:

一种基于人工智能的电网快速调度指挥系统,包括处理器、显示模块和语音采集模块;所述语音采集模块用于采集调度员实时音频数据,所述处理器至少包括语音识别模块和通话控制模块;

所述语音识别模块,用于根据语音采集模块采集的语音数据,识别呼出的站点名称,并将识别结果发送给显示模块和通话控制模块;

所述显示模块,用于实时显示识别到的站点名称和站点确认信息,当站点信息确认时,将确认信息发送给通话控制模块;

所述通话控制模块,用于根据站点识别结果和确认信息对站点发起通话控制,并向电话交换网发起注册、呼叫或接听命令。

作为可能的一些实现方式,所述处理器还包括语音转写模块、关键词提取模块、自然语言处理模块和录音检索模块;

所述语音转写模块,用于将语音数据转写成对应的文字,并将转写的文字结果传递给关键词提取模块;

所述关键词提取模块,用于提取通话的录音文字数据的关键词,并将关键词、通话的录音文字和音频数据以表的形式存储;

所述自然语言处理模块,用于编码所提取的关键词,计算每一组关键词的差值,按照差值的大小,升序排列并返回结果;

所述录音检索模块,用于根据接收到的关键词指令或者语音指令,经自然语言处理模块处理后得到至少一个检索关键词,利用检索关键词检索并提取存储的音频数据和/或录音文字。

本公开第二方面提供了一种基于语音识别的快速呼出方法。

一种基于语音识别的快速呼出方法,利用本公开第一方面所述的基于人工智能的电网快速调度指挥系统,包括以下步骤:

调度员使用语音采集模块录入呼出的站点名称;

语音采集模块采集到站点的语音数据之后传递给语音识别模块,利用语音识别模块将语音数据转化为站点名称,查询站点号码并传递给显示模块;

显示模块展示站点名称和号码进行确认,确认成功时将确认结果发送给通话控制模块,进行呼出操作;否则重新录入呼出的站点名称。

本公开第三方面提供了一种录音快速检索方法。

一种录音快速检索方法,利用本公开第一方面所述的基于人工智能的电网快速调度指挥系统,基于文本关键词进行检索,包括以下步骤:

在录音检索界面选择关键词检索,输入时间、人员、站点名称和调度指令信息;

根据时间、人员、站点名称和调度指令信息进行匹配,返回搜索范围;

匹配调度指令,将每一条调度指令利用word2vec模型编码;

计算输入调度指令的均值和每条预存调度指令的均值,计算输入调度指令的均值与每条预存调度指令的均值的差值;

按照差值的大小,升序排列并返回结果。

作为可能的一些实现方式,基于语音进行检索,包括以下步骤:

在录音检索界面选择语音检索,使用语音采集模块按照提示,依次呼入时间、人员、站点名称和调度指令;

利用语音转写模块将呼入的关键词转写为文字;

根据时间、人员、站点名称和调度指令信息进行匹配,返回搜索范围;

匹配调度指令,将每一条调度指令利用word2vec模型编码;

计算输入调度指令的均值和每条预存调度指令的均值,计算输入调度指令的均值与每条预存调度指令的均值的差值;

按照差值的大小,升序排列并返回结果。

与现有技术相比,本公开的有益效果是:

1、本公开第一方面提供的基于人工智能的电网快速调度指挥系统,通过设置处理器、显示模块和语音采集模块,实现了对调度员调度语音指令的自动识别、语音转写和智能检索等功能,提高了调度员调度指挥工作效率和准确度,同时便于事故追溯和安全责任界定,为调度员带来全新的语音指挥体验。

2、本公开第二方面所述的呼出方法,操作便捷,节约了调度员寻找呼出站点的时间,语音识别的结果经过调度员确认后呼出,具备一定的容错机制,准确率高;通过利用语音识别模块识别麦克风呼入的音频数据,将识别结果发送给通话控制模块,经调度员确认后进行呼出操作,保证了呼出的效率和准确性。

3、本公开第三方面所述的检索方法,提供语音或文本双重检索机制,灵活性强。本发明利用人工智能模块将录音的音频文件转化成文本,保存该录音数据多个关键词以及音频文件,并以表的形式存储,利用音频或者文本两种方式获取关键词进行检索,极大的提高了检索的效率和准确性。

4、本公开第三方面所述的检索方法,使用关键词的方式进行检索,不断地缩小检索空间,最后使用正则表达式将包含调度指令的录音文字以及录音返回,在减少搜索空间的前提下,提高了检索的准确性。

附图说明

图1为本公开实施例1提供的基于人工智能的电网快速调度指挥系统的结构示意图。

图2为本公开实施例2提供的基于语音识别的快速呼出方法流程示意图。

图3为本公开实施例2提供的语音识别模型的构建方法流程示意图。

图4为本公开实施例3提供的录音快速检索方法的流程示意图。

图5为本公开实施例3提供的语音转写模型的构建方法流程示意图。

图6为本公开实施例3提供的word2vec的构建方法流程示意图。

图7为本公开实施例3提供的语音转写显示存储的方法流程图。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。

实施例1:

如图1所示,本公开实施例1提供了一种基于人工智能的电网快速调度指挥系统,包括:处理器、显示模块、麦克风、音响和话机手柄;所述处理器包括核心数据处理模块、通话控制模块、录音检索模块和web管理模块。

所述麦克风为触摸显示器内置麦克风,采集调度员实时音频流,用于语音快速呼出功能和语音智能查询录音功能。

所述音响为触摸显示器内置音响,用于播放处理结果的提示信号。

所述话机手柄为ip话机手柄,所述ip话机用于发送、接收sip消息,满足调度员通话需求,同通话控制模块相联动。

所述核心数据处理模块是系统的核心算法支撑模块,包括语音转写模块、语音识别模块、关键词提取模块和自然语言处理模块。

所述语音转写模块,用于将语音数据转写成对应的文字,并将转写的文字结果作为参数分别传递给关键词提取模块。

所述语音识别模块,用于处理麦克风采集的语音数据,识别呼出的站点名称,并将识别结果作为参数发送给图形界面模块和通话控制模块。

所述关键词提取模块,用于提取通话的录音文字数据的关键词,包括时间,人员,站点名称,调度指令,并将关键词和通话的录音文字和音频数据以表的形式存储。

所述自然语言处理模块用于编码所提取的关键词,并计算每一组关键词的差值,包括word2vec模型。

所述录音检索模块,用于根据接收到的关键词指令或者语音指令,经自然语言处理模块处理后得到至少一个检索关键词,利用检索关键词检索并提取存储的音频数据和/或录音文字。

所述web管理模块,用于调度员查询调度录音和语音呼出管理,包括查询条件,语音转文字模块参数、语音识别模块参数、关键词提取模块参数、新增的站点参数等数据配置。

所述通话控制模块,用于根据语音识别模块传递的参数对站点发起通话进行控制,并向电话交换网发起注册、呼叫、接听等信令和媒体消息。

所述显示模块包括触摸显示屏和图形界面模块,所述图形界面模块,用于控制触摸显示屏显示内容,用户通过操作图形界面进行录音检索、通话呼出确认、通话接听、字幕显示等需求。

所述触摸显示器为触摸电容屏,用于显示录音检索结果和站点信息,显示内容由图形界面展示模块控制。

所述触摸显示屏优选为触摸电容屏,也可以是触摸电阻屏等其他触摸屏形式。

本实施例所述的调度指挥系统兼容性强,本发明支持ims、软交换、程控交换等不同交换体制的接入,同时具备应用延续性,可有效保护现有投资。

实施例2:

如图2所示,本公开实施例2提供了一种基于语音识别的快速呼出方法,包括以下步骤:

步骤(1):调度员使用麦克风录入呼出的站点名称;

步骤(2):麦克风采集到站点的语音数据之后传递给人工智能平台,利用语音识别模型将语音数据转化为站点名称,查询号码并传递给图形界面模块;

步骤(3):图形界面模块根据识别结果,在触摸屏上展示站点名称和号码,提供给调度员确认,调度员确认后成功则进入步骤(4),失败则重复步骤(1)至(3);

步骤(4):图形展示模块将确认结果发送给通话控制模块,进行呼出操作。

采集不同地市公司调度员海量的呼出语音数据和对应的站点名称构建语音识别模型,适用于多种口音的场景。

通过呼出语音数据和对应的站点名称构建语音识别模型,如图3所示,具体步骤如下:

步骤(1):采集调度员呼出语音数据作为训练样本,站点名称的文字作为标签,构建模型训练数据集。

步骤(2):增加训练样本的噪声,并构建交叉熵损失。

步骤(3):训练seq2seq语音识别模型,损失函数收敛即模型训练完成。

本实施例所述的语音识别模型构建所采用的数据集采用全省调度员通话数据,包含不同地市方言和调度上专用名词,具有较强的专业性,语音识别模型采用先进的seq2seq模型,预测精度高。

实施例3:

如图4所示,本公开实施例3提供了一种录音快速检索方法。

包括基于文本关键词的快速检索方法和基于语音的快速检索方法,能够快速地查询存储在数据库中的通话数据。

基于关键词的快速检索方法,包括以下步骤:

步骤(1):在录音检索界面选择关键词检索,输入时间,人员,站点名称,调度指令信息;

步骤(2):根据时间、人员、站点名称进行匹配,返回搜索范围;

步骤(3):匹配调度指令,将每一条调度指令利用word2vec模型编码;

步骤(4):计算输入调度指令的均值m1第i条数据调度指令的均值mi,计算ki=m1-mi。

步骤(5):按照ki的大小,升序排列并返回结果。

基于语音的快速检索方法,包括以下步骤:

步骤(1):在录音检索界面选择语音检索,使用麦克风按照提示,依次呼入关键词时间,人员,站点名称,调度指令;

步骤(2):利用语音转写模型将呼入的关键词转写为文字;

步骤(3):匹配调度指令,将每一条调度指令利用word2vec模型编码;

步骤(4):计算输入调度指令的均值m1第i条数据调度指令的均值mi,计算ki=m1-mi。

步骤(5):按照ki的大小,升序排列并返回结果。

优选的,采集不同地市公司调度员海量的通话语音数据和文字构建语音转写模型。

根据通话语音数据和文字构建通话录音转写模型,如图5所示,包括以下步骤:

步骤(1):采集调度员通话语音数据作为训练样本,对应的文字作为标签,构建模型训练数据集。

步骤(2):增加训练样本的噪声,并构建交叉熵损失。

步骤(3):训练全卷积神经网络语音转写模型,损失函数收敛即模型训练完成。

语音转写模型采用先进的全卷积神经网络模型,预测速度快,准确率高,可以达到实时转换的效果。

优选的,所述word2vec模型的训练方法基于调度语料库,所述调度语料库是调度员呼叫全省范围内各个站点的调度录音文本构成。

所述word2vec模型的训练方法,如图6所示,包括以下步骤:

步骤(1):采集省内不同站点的调度录音文本,构建语料库;

步骤(2):分词,将每一句录音文本拆分成词;

步骤(3):构建基于二元逻辑回归损失函数的word2vec模型,训练模型至损失函数收敛。

优选的,所述基于二元逻辑回归损失函数的word2vec模型使用霍夫曼树来代替传统的神经网络,可以提高模型训练的效率。

所述存储在数据库中的通话数据包括存储通话语音数据、存储通话语音转录的文字数据。

所述存储通话语音转录的文字为通话语音经过转写显示存储操作生成的文字,通话语音数据在转写成文字并存储的同时,可以实时地显示在触摸屏上。

所述转写显示存储过程包括分帧、编码概率、字幕获取、提取关键词四个步骤,如图7所示:

步骤(1):使用滑动窗口,将语音信息按照语音强度进行分段;

步骤(2):将分段后的每一帧,输入到已经训练好的语音转写模型中进行编码。根据编码结果在语料库中返回概率最大的文字;

步骤(3):将转写好的文字所谓参数发送给图形界面模块,实时显示字幕;

步骤(4):提取每一段录音文字对应的关键词,包括时间,人员,站点名称,调度指令,并将该关键词和录音文字以表的形式存储到数据库中。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips