一种传染病监测预警方法及装置与流程
本申请涉及数据处理技术领域疾病监测预警,尤其涉及一种传染病监测预警方法及装置。
背景技术:
目前,传染病主要是在医院首诊发现,由医生对确诊的传染病(infectiousdiseases,是由各种病原体引起的能在人与人、动物与动物或人与动物之间相互传播的一类疾病)患者进行上报至疾控主管部门,其主要针对的已知传染病(指已经发现的传染病,即目前国家疾控中心监测的传染病,中国目前的法定报告传染病分为甲、乙、丙3类,共40种),而对未知传染病(指人们新认识到的或新发现的那些能造成地域性或国际公共卫生问题的新识别的和以往未知的传染病,未知传染病同样具有传染病的特征,有病原体、有传染性、有流行病学特征),例如:新冠肺炎、sars等,均为医生发现在短时间内出现了多例相同临床表征的患者,并且与现有的已知传染病无法对应,才提出怀疑而发现的。然而对未知传染病来说,从第一例就诊患者就诊到医生察觉,已经经过了一段时间,已经造成了传染的扩散,增加了人群感染概率。
因此,如何实现未知传染病的监测和预警,以减少人群感染概率,从而降低病死率,是本领域技术人员亟待解决的问题。
技术实现要素:
本申请提供了一种传染病监测预警方法及装置,实现未知传染病的监测和预警,以减少人群感染概率,从而降低病死率。
为了实现上述目的,本申请提供了以下技术方案:
一种传染病监测预警方法,包括:
从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息;
将所述特征信息与预设特征集中的特征信息进行对比,确定所述待监测电子病历的传染病类型,所述传染病类型包括已知传染病和未知传染病,所述预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合;
监测所述传染病类型中的所述未知传染病的个数是否达到预设阈值;
当传染病类型中的所述未知传染病的个数达到预设阈值时,确定所述未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
优选的,所述从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息,包括:
获取所述待监测电子病历,所述待监测电子病历包括结构化数据和非结构化数据;
通过自然语言处理技术从所述待监测电子病历中提取所述结构化数据和所述后结构化数据;
根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息。
优选的,构建所述预设特征集,具体包括:
根据历史传染病数据进行归集,通过自然语言处理技术对历史传染病数据中的电子病历进行后结构化,构建已知传染病的结构化历史数据集合;
针对所述已知传染病的结构化历史数据集合,按照其传播方式及所属疾病类别进行归类,生成具有相似临床表现的传染病类集,每种所述传染病类集中包含一种或多种已知传染病;
按照疾病聚合其相应的病历归集,并对每种所述传染病类集中的临床表现进行统计分析,确定每种所述传染病类集所对应的临床表现,所述临床表现包括:常见症状、常见体征、常见检验指标变化、常见检查结果;
将每种所述传染病类集所对应的临床表现确定为对应的相关特征,并构建所述预设特征集。
优选的,还包括:
当传染病类型中的所述未知传染病的个数达到预设阈值时,生成监测预警信号,以提醒判断是否有新增的传染病暴发。
一种传染病监测预警装置,包括:
第一处理单元,用于从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息;
第二处理单元,用于将所述特征信息与预设特征集中的特征信息进行对比,确定所述待监测电子病历的传染病类型,所述传染病类型包括已知传染病和未知传染病,所述预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合;
第三处理单元,用于监测所述传染病类型中的所述未知传染病的个数是否达到预设阈值;
第四处理单元,用于当传染病类型中的所述未知传染病的个数达到预设阈值时,确定所述未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
优选的,所述第一处理单元具体用于:
获取所述待监测电子病历,所述待监测电子病历包括结构化数据和非结构化数据;
通过自然语言处理技术从所述待监测电子病历中提取所述结构化数据和所述后结构化数据;
根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息。
优选的,所述第二处理单元具体还用于:
根据历史传染病数据进行归集,通过自然语言处理技术对历史传染病数据中的电子病历进行后结构化,构建已知传染病的结构化历史数据集合;
针对所述已知传染病的结构化历史数据集合,按照其传播方式及所属疾病类别进行归类,生成具有相似临床表现的传染病类集,每种所述传染病类集中包含一种或多种已知传染病;
按照疾病聚合其相应的病历归集,并对每种所述传染病类集中的临床表现进行统计分析,确定每种所述传染病类集所对应的临床表现,所述临床表现包括:常见症状、常见体征、常见检验指标变化、常见检查结果;
将每种所述传染病类集所对应的临床表现确定为对应的相应特征,并构建所述预设特征集。
优选的,所述第四处理单元具体还用于:
当传染病类型中的所述未知传染病的个数达到预设阈值时,生成监测预警信号,以提醒判断是否有新增的传染病暴发。
一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行如上述所述的传染病监测预警方法。
一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上述所述的传染病监测预警方法。
本申请所述的传染病监测预警方法及装置,通过预先构建预设特征集,该预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合,当有监测预警需求时,首先获取待监测电子病历,从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和后结构化数据确定待监测电子病历的特征信息;将特征信息与预设特征集中的特征信息进行对比,确定待监测电子病历的传染病类型,所述传染病类型包括已知传染病和未知传染病;实时监测传染病类型中的未知传染病的个数是否达到预设阈值;当传染病类型中的未知传染病的个数达到预设阈值时,则确定未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
本申请通过对已知传染病数据的实时监测,来及早的发现未知传染病,以减少人群感染概率,从而降低病死率;同时,通过对已知传染病数据的变化监测,确定是否有流行及暴发的可能性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的传染病监测预警方法流程示意图;
图2为本申请实施例公开的构建所述预设特征集的方法流程示意图;
图3为本申请实施例公开的根据已知传染病进行相似临床表现的传染病类集的聚类方式示意图;
图4为本申请实施例公开的根据相似临床表现的传染病类集进行特征集的构建流程示意图;
图5为本申请实施例公开的传染病监测预警装置结构示意图;
图6为本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
本申请提供一种传染病监测预警方法及装置,使用场景为医院内网或医联体内网或区域卫生网,其发明目的在于:如何实现未知传染病的监测和预警,以减少人群感染概率,从而降低病死率。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见附图1,为本申请实施例提供的一种传染病监测预警方法流程示意图。
如图1所示,本申请实施例提供了一种传染病监测预警方法,该方法具体包括如下步骤:
s101:从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息。
本申请实施例中,电子病历为以电子设备保存、管理、传输、重现病人的医疗记录,为传统纸质病历的数字化版本。其中,电子病历中的结构化数据是指存在于电子病历中的计算机可读的数据,包括医嘱、检验数据、病案首页的数据等;而电子病历中的非结构化数据是指存在于电子病历中的自由文本,如首次病程记录、入院记录等文书及其章节内容,亦包括检查报告中的检查所见和检查结论,如心电图报告中的文字描述部分。
本申请实施例中,上述所述从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息,具体包括如下步骤:
获取所述待监测电子病历,所述待监测电子病历包括结构化数据和非结构化数据;
通过自然语言处理技术从所述待监测电子病历中提取所述结构化数据和所述后结构化数据;
根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息。
需要说明的是,上述信息提取是从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。对于本领域技术人员来说,关于信息提取属于信息抽取的常用技术手段,在此不进行详细赘述,具体内容可参考信息抽取的相关技术内容。
s102:将所述特征信息与预设特征集中的特征信息进行对比,确定所述待监测电子病历的传染病类型。
本申请实施例中,所述传染病类型包括已知传染病和未知传染病,所述预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合。
在步骤s101确定出所述待监测电子病历的特征信息后,将所述待监测电子病历的特征信息与预设特征集中的特征信息进行对比,来确定所述待监测电子病历的传染病类型,即确定待监测电子病历属于已知传染病还是未知传染病。
需要说明的是,在进行未知传染病比对之前,需要预先在系统数据库中构建所述预设特征集,具体的,如图2所示,构建所述预设特征集的步骤包括:
s201:根据历史传染病数据进行归集,通过自然语言处理技术对历史传染病数据中的电子病历进行后结构化,构建已知传染病的结构化历史数据集合。
本申请实施例中,举例说明:医院病历包括结构化病历和非结构化病历,结构化病历为医嘱、检验报告等,非结构化病历包括入院记录、病程记录、首次病程记录、检查报告等,对非机构化病历进行自然语言处理,形成后结构化病历,可以方便的提取其中包含的症状、体征、检查特征等,从而实现临床表现特征的结构化。
s202:针对所述已知传染病的结构化历史数据集合,按照其传播方式及所属疾病类别进行归类,生成具有相似临床表现的传染病类集,每种所述传染病类集中包含一种或多种已知传染病。
本申请实施例中,如图3所示,对已知传染病按其传播方式及所属疾病类别进行归类,形成具有相似临床表现的传染病类集,并通过监测不同类集的临床表现数据变化来监测未知传染病的趋势变化。
需要说明的是,上述涉及的传播方式可以分为接触性传播、空气传播、水和食物传播、虫媒传播及其他。本申请实施例中,传染病疾病类别包括(以《gb/t14396-2016疾病分类与代码》为例):肠道传染病、结核病、某些动物源性细菌性疾病、主要为性传播模式的感染、病毒性肝炎、真菌病等等。
举例说明:传染病非典型肺炎和流行性感冒均为空气传播,其在《gb/t14396-2016疾病分类与代码》属于“流行性感冒和肺炎”章节,则其所属归类为“空气-流行性感冒和肺炎类”。
s203:按照疾病聚合其相应的病历归集,并对每种所述传染病类集中的临床表现进行统计分析,确定每种所述传染病类集所对应的临床表现,所述临床表现包括:常见症状、常见体征、常见检验指标变化、常见检查结果。
本申请实施例中,如图4所示,可以按疾病聚合其相应的病历归集,并对每类中的临床表现进行统计分析,得到该分类的常见症状、常见体征、常见检验指标变化、常见检查结果等临床表现。
举例说明:以手足口病类似传染病为例,其按照步骤s202中的归类为“接触性传播-特征为皮肤和粘膜损害的病毒性感染”,该类疾病聚合后的特征集为“年龄为儿童,且主诉(或现病史或门诊就诊记录)中症状为发热且手、足、口、臀等部位出疹且血常规中白细胞偏低或者正常且肠道病毒(cv-a16)特异性核酸检查阳性”。
s204:将每种所述传染病类集所对应的临床表现确定为对应的相关特征,并构建所述预设特征集。
按照步骤s203中得到的不同临床表现来进行特征集设置,特征集即患者主要临床表现的集合,即得到预设特征集。
s103:监测所述传染病类型中的所述未知传染病的个数是否达到预设阈值。
s104:当传染病类型中的所述未知传染病的个数达到预设阈值时,确定所述未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
s105:当传染病类型中的所述未知传染病的个数达到预设阈值时,生成监测预警信号,以提醒判断是否有新增的传染病暴发。
本申请实施例中,预设阈值可以根据具体情况进行自由设定,预设阈值可以设置为10,需要说明的是,该预设阈值可以根据不同医院或其他机构的疾控科来设定,并可以根据具体情况进行调整。通过上述构建的预设特征集来监测医院实时数据中符合特征集变化的人群,从中剔除已经确诊的已知传染病的病例,剩余的为无法确诊的疑似传染病人群,如其数量超过设置的预设阈值,即可确定未知传染病为待确诊新增传染病,同时,在达到预设阈值时,生成监测预警信号,从而提醒医院判断是否有新增的传染病暴发。
举例说明:仍以上述中的例子,以“年龄为儿童,且主诉(或现病史或门诊就诊记录)中症状为发热且手、足、口、臀等部位出疹且血常规中白细胞偏低或者正常且肠道病毒(cv-a16)特异性核酸检查阳性”作为特征集监测医院实时数据,提取其中已经确诊的已知传染病(如手足口病),则剩余的为与手足口病表现类似但无法确诊的疑似传染病人群,如其数量短时间内暴发增长,超过了预设参数,从而提示可能有传染病暴发,类似的sars和新冠肺炎,其表现为“病毒性肺炎类”,如其数量猛增,且无法确定病原体,则提示新型传染病的可能。
本申请实施例所述的传染病监测预警方法,通过预先构建预设特征集,该预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合,当有监测预警需求时,首先获取待监测电子病历,从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和后结构化数据确定待监测电子病历的特征信息;将特征信息与预设特征集中的特征信息进行对比,确定待监测电子病历的传染病类型,所述传染病类型包括已知传染病和未知传染病;实时监测传染病类型中的未知传染病的个数是否达到预设阈值;当传染病类型中的未知传染病的个数达到预设阈值时,则确定未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
本申请实施例通过对已知传染病数据的实时监测,来及早的发现未知传染病,以减少人群感染概率,从而降低病死率;同时,通过对已知传染病数据的变化监测,确定是否有流行及暴发的可能性。
请参阅图5,基于上述实施例公开的一种传染病监测预警方法,本实施例对应公开了一种传染病监测预警装置,该装置包括:
第一处理单元501,用于从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息;
第二处理单元502,用于将所述特征信息与预设特征集中的特征信息进行对比,确定所述待监测电子病历的传染病类型,所述传染病类型包括已知传染病和未知传染病,所述预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合;
第三处理单元503,用于监测所述传染病类型中的所述未知传染病的个数是否达到预设阈值;
第四处理单元504,用于当传染病类型中的所述未知传染病的个数达到预设阈值时,确定所述未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
优选的,进一步所述第一处理单元501具体用于:
获取所述待监测电子病历,所述待监测电子病历包括结构化数据和非结构化数据;
通过自然语言处理技术从所述待监测电子病历中提取所述结构化数据和所述后结构化数据;
根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息。
优选的,进一步所述第二处理单元502具体还用于:
根据历史传染病数据进行归集,通过自然语言处理技术对历史传染病数据中的电子病历进行后结构化,构建已知传染病的结构化历史数据集合;
针对所述已知传染病的结构化历史数据集合,按照其传播方式及所属疾病类别进行归类,生成具有相似临床表现的传染病类集,每种所述传染病类集中包含一种或多种已知传染病;
按照疾病聚合其相应的病历归集,并对每种所述传染病类集中的临床表现进行统计分析,确定每种所述传染病类集所对应的临床表现,所述临床表现包括:常见症状、常见体征、常见检验指标变化、常见检查结果;
将每种所述传染病类集所对应的临床表现确定为对应的相应特征,并构建所述预设特征集。
优选的,进一步所述第四处理单元504具体还用于:
当传染病类型中的所述未知传染病的个数达到预设阈值时,生成监测预警信号,以提醒判断是否有新增的传染病暴发。
所述传染病监测预警装置包括处理器和存储器,上述第一处理单元、第二处理单元、第三处理单元和第四处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过对已知传染病数据的实时监测,来及早的发现未知传染病,以减少人群感染概率,从而降低病死率;同时,通过对已知传染病数据的变化监测,确定是否有流行及暴发的可能性。
本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述传染病监测预警方法。
本申请实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述传染病监测预警方法。
本申请实施例提供了一种电子设备,如图6所示,该电子设备60包括至少一个处理器601、以及与所述处理器连接的至少一个存储器602、总线603;其中,所述处理器601、所述存储器602通过所述总线603完成相互间的通信;处理器601用于调用所述存储器602中的程序指令,以执行上述的所述传染病监测预警方法。
本文中的电子设备可以是服务器、pc、pad、手机等,使用场景为医院内网或医联体内网或区域卫生网。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息;
将所述特征信息与预设特征集中的特征信息进行对比,确定所述待监测电子病历的传染病类型,所述传染病类型包括已知传染病和未知传染病,所述预设特征集为根据已知传染病的特征集确定的,所述特征集为传染病患者主要临床表现的集合;
监测所述传染病类型中的所述未知传染病的个数是否达到预设阈值;
当传染病类型中的所述未知传染病的个数达到预设阈值时,确定所述未知传染病为待确诊新增传染病,以实现未知传染病的监测预警。
优选的,所述从待监测电子病历中提取结构化数据和后结构化数据,并根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息,包括:
获取所述待监测电子病历,所述待监测电子病历包括结构化数据和非结构化数据;
通过自然语言处理技术从所述待监测电子病历中提取所述结构化数据和所述后结构化数据;
根据所述结构化数据和所述后结构化数据确定所述待监测电子病历的特征信息。
优选的,构建所述预设特征集,具体包括:
根据历史传染病数据进行归集,通过自然语言处理技术对历史传染病数据中的电子病历进行后结构化,构建已知传染病的结构化历史数据集合;
针对所述已知传染病的结构化历史数据集合,按照其传播方式及所属疾病类别进行归类,生成具有相似临床表现的传染病类集,每种所述传染病类集中包含一种或多种已知传染病;
按照疾病聚合其相应的病历归集,并对每种所述传染病类集中的临床表现进行统计分析,确定每种所述传染病类集所对应的临床表现,所述临床表现包括:常见症状、常见体征、常见检验指标变化、常见检查结果;
将每种所述传染病类集所对应的临床表现确定为对应的相关特征,并构建所述预设特征集。
优选的,还包括:
当传染病类型中的所述未知传染病的个数达到预设阈值时,生成监测预警信号,以提醒判断是否有新增的传染病暴发。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(cpu)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除