HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种基于机器学习预测预警感染性疾病就医人数突增的方法与流程

2021-01-08 11:01:00|325|起点商标网
一种基于机器学习预测预警感染性疾病就医人数突增的方法与流程

本发明属于数据统计学、人工智能、医疗信息化等领域,涉及一种基于机器学习预测预警感染性疾病就医人数突增的方法。



背景技术:

近年来,利用机器学习技术实现对流感等疾病的预测已经成为热点研究问题,特别是今年新冠状病毒肺炎大流行为全人类带来了巨大灾难。如何做到“早发现,早预防,早治疗,早控制”,特别是“早发现”是一项紧迫任务。目前,业内技术的主要问题是单点静态数据研究多,没有形成多点协同触发、动态灵敏的预警研判模式;缺少环境气候关键数据特征等。造成预测精度不高,预警灵敏度低等问题。



技术实现要素:

本发明的目的在于提供一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。

为了达到上述目的,本发明的实现方式是:

使用k个医疗机构的前n年每日感染性疾病就医人数和前n年每日最低气温作为特征,构成k*(2*n*365)个数据特征训练样本集。

使用上述训练样本,训练构建机器学习lightgbm模型,形成了基于机器学习的预测感染性疾病就医人数的方法。ligthgbm是一种梯度提升框架,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。

使用k个医疗机构的前m天的感染性疾病就医人数和最低气温作为训练后的lightgbm动态模型的输入,动态预测来日的感染性疾病就医人数p预测。

依据预测的感染性疾病就医人数,计算其预警指数,如下:

q=(p预测-p前日)/std(p前m日)

其中,q为预警指数,p预测为来日t的预测值,p前日为t-1天的真实数据,std(p前m日)为t-1,t-2,。。。t-m天的真实数据的样本标准差。

依据预警指数q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增。

将来日的感染性疾病就医人数突增告警通过建设基于机器学习预测预警感染性疾病就医人数突增可视化平台进行及时发布预警。

可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化系统进行多点动态分析预测,灵敏预警和告警呈现的设计思路。

可选地,所述的样本数据通过网络及自定义的接口协议,上传到基于机器学习预测预警感染性疾病就医人数突增可视化系统平台。

可选地,所述的使用前m=9天的感染性疾病就医人数和最低气温作为训练后的lightgbm模型的输入,动态预测来日的感染性疾病就医人数的准确性和预警灵敏度最高。

可选地,所述的预警指数阈值σ,在基于机器学习预测预警感染性疾病就医人数突增可视化系统平台中设定为100%,即预警指数q为样本标准差的一倍以上的,判断为突增。

可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化系统已实现网络化、系统化,可实时在线实现同地或异地的多家医疗机构对感染性疾病就医人数突增预测预警。

由于采用上述方法,本发明的有益效果是:本发明是一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。本发明方法包括:选取多个医疗机构的每日感染性疾病就医人数和每日的最低气温作为输入特征;选用机器学习模型lightgbm作为训练模型预测来日的就医感染性疾病人数;对就医人数预测值与前m天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。本发明方法避免了基于单监测点、单一特征时间序列或时态事件对疾病演化过程建模信息损失问题,有效提升了对感染性疾病就医人数的预测精准性和就医人数突增预警的灵敏性。是建设协同综合、灵敏可靠的公共卫生监测预警体系的核心技术。

附图说明

图1是本发明一种基于机器学习预测预警感染性疾病就医人数突增方法的总流程图;

图2是本发明基于机器学习预测感染性疾病就医人数突增的动态更新预测模型流程图;

具体实施方式

以下结合附图所示实施例对本发明作进一步的说明。

以下实例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。

本发明提供一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。该方法选取多个医疗机构的每日感染性疾病就医人数和每日的最低气温作为输入特征;选用机器学习模型lightgbm作为训练模型预测来日的就医感染性疾病人数;对就医人数预测值与前m天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。告警信息在基于机器学习预测预警感染性疾病就医人数突增可视化系统平台上的告警窗口呈现。该方法包括以下步骤:

(1)使用k个医疗机构的前n年每日感染性疾病就医人数和前n年每日最低气温作为特征,构成k*(2*n*365)个数据特征训练样本集。

本实施例中,计算所述的每日感染性疾病就医人数与当日的最低气温的pearson相关系数其中,cov(x,y)为x、y的协方差,var[x]为x的方差,var[y]为y的方差。可得出每日感染性疾病就医人数与当日的最低气温有较强的负相关性。

(2)使用上述训练样本,训练构建机器学习lightgbm模型,形成了基于机器学习的预测感染性疾病就医人数的方法。ligthgbm是一种梯度提升框架,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。

本实施例中,lightgbm的目标函数是:

其中式中的n代表样本个数,yi代表第i个样本的真实值,·1(yi,yi)代表第i个样本的训练损失,对于回归任务通常选择平方误差损失函数,ω(fk(xi))是正则化惩罚项,k代表树的总数。γ是叶子节点数量的惩罚系数,t是叶子节点的个数,wt是第t个叶子节点的得分,λ是l2正则化系数。因为叶子节点过多时,会有过拟合的风险,因此γt项是为了限制叶子节点的数量。lightgbm在每轮训练中加入一个新的决策树至模型,对于决策树的训练,利用信息增益选择树节点的分裂点。

(3)使用k个医疗机构的前m天的感染性疾病就医人数和最低气温作为训练后的lightgbm模型的输入,预测来日的感染性疾病就医人数p预测。

本实施例中,采用动态预测模型:在测试集上的预测,利用了动态模型,每次有新的测试数据时,加入已有数据重新训练模型,再进行预测。其步骤框图,如图2所示。

可选地,使用前m=9天的感染性疾病就医人数和最低气温作为训练后的lightgbm模型的输入,动态预测来日的感染性疾病就医人数的准确性和预警灵敏度最高。

(4)依据预测的感染性疾病就医人数,计算其预警指数。

本实施例中,采用下式计算,q=(p预测-p前日)/std(p前m日)

其中,q为预警指数,p预测为来日t的预测值,p前日为t-1天的真实数据,std(p前m日)为t-1,t-2,。。。t-m天的真实数据的样本标准差。

(5)依据预警指数q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增。

本实施例中,所述的预警指数阈值σ,在基于机器学习预测预警感染性疾病就医人数突增可视化系统平台中设定为100%,即预警指数q为样本标准差的一倍以上的,判断为突增。

(6)将来日的感染性疾病就医人数突增告警通过建设基于机器学习预测预警感染性疾病就医人数突增可视化平台进行及时发布预警。

本实施例中,所述的基于机器学习预测预警感染性疾病就医人数突增可视化系统已实现网络化、系统化,可实时在线实现同地或异地的多家医疗机构对感染性疾病就医人数突增预测预警。

可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化系统进行多点动态分析预测,灵敏预警和告警呈现的设计思路。

可选地,所述的样本数据通过网络及自定义的接口协议,上传到基于机器学习预测预警感染性疾病就医人数突增可视化系统平台。

上述对实施例的描述是为便于该技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips