基于脂质生物标记物的分类装置及应用的制作方法
本说明书一个或多个实施例涉及脂质组学技术领域,尤其涉及一种基于脂质生物标记物的分类装置及应用。
背景技术:
肺结核病是由结核分枝杆菌引起的慢性肺部传染病,已经困扰人类近7万年。尽管采用经世界卫生组织(worldhealthorganization,缩写who)批准实施的药物敏感型肺结核督导短程化疗治疗方案后,肺结核病治愈率已显著提升,但是全球结核病的治疗转归数据指出,新发结核病6个月标准治疗的成功率仅为85%,全球的结核病复发率从2.3%到6.5%不等。对于肺结核病患者是否痊愈,可以借助痰涂片、临床症状、计算机胸部断层扫描(ct)和药物疗程综合判断。但是,由于痰涂片的涂阳存在随机性,计算机胸部断层扫描(ct)具有放射性不适宜高频、多次使用,因此急需研发新的肺结核病疗效分类方法。
技术实现要素:
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于脂质生物标记物的分类装置及应用,以解决现有技术中肺结核病诊断方法难以满足肺结核病患者疗效评价的技术问题。
基于上述目的,本说明书一个或多个实施例的第一方面,提供了一种基于脂质生物标记物的分类装置,包括:
数据获取模块,被配置为获取患者的特征数据集;其中,所述特征数据集包括:用药特征、血液中脂质生物标记物以及相应的表达量;其中,所述脂质生物标记物包括第一溶血磷脂酸和第二溶血磷脂酸中的至少一者;所述第一溶血磷脂酸如式(ⅰ)所示
所述第二溶血磷脂酸如式(ⅱ)所示
模型匹配模块,被配置为根据所述用药特征,查询所述分类模型库并确定匹配的分类模型;其中,所述分类模型通过不同类型患者血液中脂质生物标记物的表达量对预设的分类算法训练得到;以及
患者分类模块,被配置为根据所述分类模型和所述血液中脂质生物标记物的表达量,得到所述患者针对肺结核病的分类结果。
进一步地,所述脂质生物标记物还包括第一神经酰胺、第二神经酰胺和溶血磷脂酰乙醇胺;其中,
所述第一神经酰胺如式(ⅲ)所示
所述第二神经酰胺如式(ⅳ)所示
所述溶血磷脂酰乙醇胺如式(ⅴ)所示
进一步地,当采用液相色谱串联质谱法测量所述脂质生物标记物时,所述表达量基于色谱峰面积和标准品浓度曲线确定。
进一步地,当所述用药特征为非用药,对应的所述分类模型包括脂质生物标记物特征及其对应的第一预设值和第二预设值,且所述第一预设值小于第二预设值时;
所述患者分类模块,还被配置为:
根据所述脂质生物标记物特征,获得所述血液中对应脂质生物标记物的表达量;
将所述表达量和所述第一预设值以及所述第二预设值进行比较,若所述表达量大于所述第二预设值,则所述患者肺结核病高风险;若所述表达量小于所述第一预设值,则所述患者肺结核病低风险;否则所述患者肺结核病中风险。
进一步地,当所述用药特征为强化用药或强化巩固用药,对应的所述分类模型包括脂质生物标记物特征、第三预设值和基于所述脂质生物标记物特征的逻辑回归模型时;
所述患者分类模块,还被配置为:
根据所述脂质生物标记物特征,获得所述血液中对应脂质生物标记物的表达量;
将所述表达量代入所述逻辑回归模型计算得到概率估算值;
比较所述概率估算值和所述第三预设值,若所述概率估算值小于或等于所述第三预设值,则强化用药或强化巩固用药对所述患者肺结核病有效;否则效果欠佳。
进一步地,当一用药特征对应至少两种不同的分类模型时,则所述分类装置,还包括:
比较模块,被配置为:比较所述至少两种不同的分类模型的分类结果,若分类结果不同,则对所述患者进行标记并输出各分类模型对应的分类结果。
进一步地,所述分类装置,还包括:
校正模块,被配置为:获取带有标记的所述患者所属的类型,根据所述类型以及所述患者血液中脂质生物标记物以及相应的表达量,更新所述分类模型库。
进一步地,所述分类装置,还包括:
方案推荐模块,被配置为:根据所述分类结果,匹配对应的治疗方案并推送。
进一步地,所述分类装置还包括模型训练模块;
所述模型训练模块被配置为:至少通过以下一种方法得到所述分类模型:
根据健康对照和肺结核病初诊患者的血液中第一溶血磷脂酸或第二溶血磷脂酸的表达量,对预设的分类算法训练得到用药特征为非用药对应的分类模型;
根据肺结核病初诊患者和肺结核病强化用药未治愈患者的血液中脂质生物标记物的表达量,对预设的分类算法训练得到用药特征为强化用药对应的分类模型;
根据肺结核病强化用药未治愈患者和肺结核病强化巩固用药治愈患者的血液中脂质生物标记物的表达量,对预设的分类算法训练得到用药特征为强化巩固用药对应的第一分类模型;以及
根据肺结核病初诊患者和肺结核病强化巩固用药治愈患者的血液中脂质生物标记物的表达量,对预设的分类算法训练得到用药特征为强化巩固用药对应的第二分类模型。
本说明书的第二方面,提供检测脂质生物标记物的试剂在制备肺结核病筛查与疗效评价的试剂盒中的应用;其中,所述脂质生物标记物包括第一溶血磷脂酸和第二溶血磷脂酸中的至少一者;所述第一溶血磷脂酸如式(ⅰ)所示
所述第二溶血磷脂酸如式(ⅱ)所示
进一步地,所述脂质生物标记物还包括第一神经酰胺、第二神经酰胺和溶血磷脂酰乙醇胺;其中,
所述第一神经酰胺如式(ⅲ)所示
所述第二神经酰胺如式(ⅳ)所示
所述溶血磷脂酰乙醇胺如式(ⅴ)所示
进一步地,所述试剂盒包括:所述脂质生物标记物的标准品。
从上面所述可以看出,本说明书一个或多个实施例提供的基于脂质生物标记物的分类装置及应用,通过获取患者的特征数据集,基于患者的特征数据集中的用药特征、血液中脂质生物标记物以及相应的表达量,利用与用药特征相对应的分类模型,得到所述患者针对肺结核病的分类结果。这样的技术方案,具有对患者身体伤害低,能够适用于肺结核病早期筛查、评估肺结核病是否治愈,为肺结核病的早期筛查诊断以及疗效评价提供了一种新的、客观的技术方案,可供医生参考。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的5种脂质生物标记物在肺结核病治疗的3个阶段以及健康对照人群中的表达水平散点图;
图2为本说明书一个或多个实施例提供的一种分类装置的结构示意图;
图3a~图3d为本说明书一个或多个实施例提供的患者不同类型间脂质生物标记物及其逻辑回归模型的roc曲线示意图;其中,图3a为hc和tb0之间;图3b为tb2和tb0之间;图3c为tb6和tb0之间;图3d为tb6和tb2之间;
图4为本说明书一个或多个实施例提供的电子设备的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
宿主血浆中含有丰富的脂质,是结核分枝杆菌生长繁殖的营养来源。结核分枝杆菌感染可引起巨噬细胞内积累胆固醇酯和甘油酯,形成泡沫样巨噬细胞,产生结核肉芽肿。结核分枝杆菌和宿主体内甘油三酯(triacylglycerol,简称tag)的脂肪酸组成几乎相同,菌体可利用自身tag合酶与宿主tag结合形成脂质滴。此外结核分枝杆菌还优先向宿主泡沫巨噬细胞中的脂质滴迁移,吞噬脂滴,以作为细菌长期持久性营养的来源。
本申请的发明人,通过检测宿主血浆中脂质分子的变化,发现部分脂质分子具有作为肺结核病的检测标志物的潜力,可用于肺结核病的诊断和疗效评价的实验室指标,下面进行详细说明。
步骤101:样本收集
收集受试者晨起空腹edta抗凝血浆样本。具体地,所述受试者包括:肺结核病确诊未治疗患者(缩写为tb0),肺结核病确诊后强化治疗2个月未治愈患者(缩写为tb2),肺结核病强化治疗2个月+巩固治疗4个月治愈患者(缩写为tb6),健康对照者(缩写为hc)。其中,强化治疗是指:采用利福平,异烟肼,吡嗪酰胺和乙胺丁醇组合药物治疗;巩固治疗是指:采用利福平和异烟肼组合药物治疗。
需要说明的是,肺结核病患者依据中华人民共和国卫生行业标准ws288-2017肺结核诊断标准筛选肺结核病患者:1)痰结核菌涂片阳性或培养阳性;2)结核分枝杆菌核酸检测阳性;3)胸部影像表现有活动性肺结核病相符的表现;4)肺组织病理符合结核病病理改变;5)符合临床诊断病例情况的,对抗结核治疗有反应。健康对照纳入标准:性别年龄与肺结核病患者相匹配,排除免疫系统疾病,排除肿瘤、心血管或其他已知的感染性疾病的志愿者。
可选地,所述edta抗凝血浆样本利用一次性空edta抗凝采血管抽取,于4℃条件下保存且于4小时内3000r/min离心10min,分离上层血浆保存于-80℃备用。这里,取样量可以是5ml。
步骤102:脂质代谢物检测
作为一种可选的实施方式,采用液相色谱和质谱联用的方式,检测收集得到的edta抗凝血浆样本中脂质代谢物的表达量。
可选地,超高效液相色谱(ultraperformanceliquidchromatography,uplc)采集系统为shim-packuflcshimadzucbm30a(https://www.shimadzu.com/),串联质谱(tandemmassspectrometry,ms/ms)采集系统为
进一步地,液相条件主要包括:
1)色谱柱:thermoc30柱,i.d.2.1×100mm,2.6μm;柱温45℃;
2)流动相:a相乙腈/水(60/40,含0.04%乙酸,5mmol/l甲酸铵);b相乙腈/异丙醇(10/90,含0.04%乙酸,5mmol/l甲酸铵);
3)洗脱梯度设置:0mina/b(80:20v/v),3min为a/b(50:50v/v),5min为a/b(35:65v/v),9min为a/b(25:75v/v),15min为a/b(10:90v/v);平衡液为a/b(50:50v/v);这里,a指代a相,b指代b相;
4)流速设置为0.35ml/min;进样量2μl。
进一步地,质谱采用
可选地,esi源运行参数如下:离子源温度设置为550℃;离子喷雾电压设置为5500v;离子源气体i,气体ii,幕气(curtaingas,cur)分别设置为55、60和25psi,碰撞诱导电(collision-activateddissociation,cad)参数设置为中等,分别应用10和100μmol/l聚丙二醇溶液进行仪器调谐和质量ppg校准。
需要说明的是,所述edta抗凝血浆样本在上机进行测试之前,需要进行预处理。
可选地,所述预处理方法包括:将edta抗凝血浆样本在室温下解冻,涡旋10秒钟后4℃3000rpm离心5分钟。应当理解的,当edta抗凝血浆样本采集完成后直接提取脂质进行检测,则无需解冻。将50μl的上清转移到新ep管,与1ml脂质提取溶液混合并涡旋2分钟。将ep管超声5分钟后与500μl水混合,涡旋1分钟,然后4℃条件下12000g离心10分钟。收集500μl上清液并用氮气干燥,用100μl流动相b复溶。将样品涡旋振荡1分钟后4℃条件下14000g离心15分钟,取上清进行uplc-ms/ms分析。
可选地,所述脂质提取溶液包括甲醇和甲基叔丁基醚(mtbe)。可选地,甲醇和甲基叔丁基醚的比例为1:3。
应当理解的,前述的液相色谱以及质谱的条件均是示例性的,本领域技术人员根据检测的需求进行适宜的调整,这里不做具体的限定。
需要说明的是,这里的脂质代谢物检测方法仅是示例性的,本领域技术人员能够采用任何其他能够对脂质代谢物进行检测的方法得到edta抗凝血浆中的脂质代谢物的表达量,例如气相色谱与质谱联用法(gc-ms)、核磁共振技术(nmr)等。
步骤103:脂质代谢物定性定量分析
可选地,利用软件analyst1.6.3处理质谱数据。
经过基线滤波、峰识别、积分、保留时间校正、峰对齐和归一化等处理,获得23大类脂质代谢物,537个脂质物质。其中正离子模式检测到448个峰,负离子模式检测到89个峰。
根据检测物质的保留时间rt、子母离子对信息及二级谱数据与标准品的谱图进行对比分析进行定性分析。在检测器中获得特征离子的信号强度(cps),用multiquant软件打开样本下机质谱文件,进行色谱峰的积分和校正工作,每个色谱峰的峰面积代表对应物质的相对含量进行相对定量。
示例性的,肺结核病治疗的3个阶段与健康对照人群的5种脂质代谢物的色谱峰面积积分结果如表1所示。
表1色谱峰面积积分数据
可选地,根据所述色谱峰的峰面积以及标准品的标准曲线确定所述脂质代谢物的表达量。
步骤104:统计学数据分析:
可选地,应用正交偏最小二乘法(opls)结合t检验进行初步筛选,再用接受者操作特性曲线(roc)的auc、特异性、灵敏度再进行筛选,最终确定脂质生物标记物。
进一步地,所述脂质生物标记物包括第一溶血磷脂酸、第二溶血磷脂酸、第一神经酰胺、第二神经酰胺和溶血磷脂酰乙醇胺。
可选地,第一溶血磷脂酸(lysophosphatidicacid(0:0/16:0),简写为lpa(0:0/16:0))如式(ⅰ)所示;第二溶血磷脂酸(lysophosphatidicacid(0:0/18:0),简写为lpa(0:0/18:0))如式(ⅱ)所示;第一神经酰胺(ceramide(d18:1/24:0)简写为cer(d18:1/24:0))如式(ⅲ)所示;第二神经酰胺(ceramide(d18:1/20:3),简写为cerp(d18:1/20:3))如式(ⅳ)所示;溶血磷脂酰乙醇胺(lysophosphatidylethanolamine(0:0/22:0),简写为lpe(0:0/22:0))如式(ⅴ)所示。
需要说明的是,在本说明书的实施例中,式(ⅲ)~式(ⅳ)中的双键的位置是式例性的。对于具有类似的结构,区别仅在于双键位置不同的化合物,也属于本申请的权利要求保护范围内。
应当理解额的,本说明书中式(ⅰ)~式(ⅴ)仅列举了脂质生物标记的可能结构,其他具有类似结构的化合物同样属于本申请权利要求的保护范围,这里不再详细描述。
可选地,使用graphpadprism8.0.2,依据检测结果绘制散点图。
示例性的,当每一组的样本为30例时,采用graphpadprism8.0.2绘制5种脂质生物标记物在肺结核病治疗的3个阶段以及健康对照人群中的表达水平散点图,其结果如图1所示。相对应的,5种脂质生物标记物在肺结核病治疗的3个阶段以及健康对照人群中的表达量比率如表2所示。应当理解的,这里的表达量基于色谱峰面积和标准品浓度曲线确定。
表2表达量比率
从图1和表2能够明显看出,相比于健康对照者(hc),在肺结核病确诊未治疗患者(tb0)的血液中lpa(0:0/16:0)和lpa(0:0/18:0)的表达量显著上调,分别达到原表达量的3.99倍和5.49倍;在治疗后呈现明显下降趋势,特别是经过强化治疗2个月+巩固治疗4个月治愈患者(tb6)的表达量接近恢复至健康对照者的水平。
相比于健康对照者(hc),在肺结核病确诊未治疗患者(tb0)的血液中cer(d18:1/24:0)、cerp(d18:1/20:3)和lpe(0:0/22:0)的表达量明显下调,分别仅有原表达量的0.79、0.76、0.69;但是随着强化治疗的进行,该3种脂质生物标记物在血液中的表达量逐渐上升,在强化治疗2个月结束时已接近正常水平;在强化治疗2个月+巩固治疗4个月治愈患者(tb6)均能够达到健康对照者(hc)的血浆水平。
由此可见,5种脂质生物标记物在健康对照者(hc)、肺结核病患者抗结核治疗过程中具有明显的变化趋势,具有肺结核病早期筛查和治疗疗效的潜力。
基于此,在本说明书的第一方面,提出一种基于脂质生物标记物的分类装置,能够对患者针对肺结核病进行分类,为医生诊断提供参考。
以下结合图2对本说明书一个或多个实施例提供的分类装置进行详细的说明。所述分类装置包括:
数据获取模块201,被配置为获取患者的特征数据集;其中,所述特征数据集包括:用药特征、血液中脂质生物标记物以及相应的表达量;其中,所述脂质生物标记物包括第一溶血磷脂酸(lpa(0:0/16:0))、第二溶血磷脂酸(lpa(0:0/18:0))、第一神经酰胺(cer(d18:1/24:0))、第二神经酰胺(cerp(d18:1/20:3))和溶血磷脂酰乙醇胺(lpe(0:0/22:0))中的至少一者;并且至少包括第一溶血磷脂酸和第二溶血磷脂酸中的一者。
可选地,所述第一溶血磷脂酸如式(ⅰ)所示
所述第二溶血磷脂酸如式(ⅱ)所示
所述第一神经酰胺如式(ⅲ)所示
所述第二神经酰胺如式(ⅳ)所示
所述溶血磷脂酰乙醇胺如式(ⅴ)所示
示例性的,当所述脂质生物标记物包括lpa(0:0/16:0)时,则所述特征数据集包括用药特征、lpa(0:0/16:0)以及lpa(0:0/16:0)的表达量;当所述脂质生物标记物包括lpa(0:0/16:0)和lpa(0:0/18:0)时,则所述特征数据集包括用药特征、lpa(0:0/16:0)及其表达量和lpa(0:0/18:0)及其表达量;当所述脂质生物标记物包括lpa(0:0/16:0)、lpa(0:0/18:0)、cer(d18:1/24:0)、cerp(d18:1/20:3)和lpe(0:0/22:0)时,则所述特征数据集包括用药特征以及每一脂质生物标记物及其表达量。
其中,所述用药特征可以是非用药,也可以是具体的用药方案,这里不做具体的限定。
本领域技术人员能够理解的,脂质生物标记物的表达量可以根据前述的液相色谱法检测得到,也可以采用其他检测方法,例如:核磁共振技术。
模型匹配模块202,被配置为根据所述用药特征,查询所述分类模型库并确定匹配的分类模型。
需要说明的是,所述分类模型库中包括每一用药类型对应的分类模型。例如,非用药对应的分类模型;强化用药对应的分类模型,这里强化用药是指利福平,异烟肼,吡嗪酰胺和乙胺丁醇组合用药;强化巩固用药对应的分类模型,这里强化巩固用药是指利福平,异烟肼,吡嗪酰胺和乙胺丁醇组合用药2个月后进行利福平和异烟肼组合药物。
可以理解的,这里每一用药类型对应的分类模型的数量可以是一个,也可以是多个,这里不做具体限定。
需要说明的是,所述分类模型通过不同类型患者血液中脂质生物标记物及其表达量对预设的分类算法训练得到。
其中,所述不同类型患者选自肺结核病确诊未治疗患者(缩写为tb0),肺结核病确诊后强化治疗2个月未治愈患者(缩写为tb2),肺结核病强化治疗2个月+巩固治疗4个月治愈患者(缩写为tb6)和健康对照者(缩写为hc)中的一者或多者。例如,根据tb0和hc血液中脂质生物标记物及其表达量,得到适用于非用药患者的肺结核病风险高低的分类模型。例如,根据tb6和tb2血液中脂质生物标记物及其表达量,得到适用于强化巩固用药患者的疗效分类模型。
其中,所述预设的分类算法选自朴素贝叶斯算法、决策树算法、支持向量机算法、knn算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。
患者分类模块203,被配置为根据所述分类模型和所述血液中脂质生物标记物的表达量,得到所述患者针对肺结核病的分类结果。
示例性的,对于非用药的患者,其分类结果包括患肺结核病高风险、低风险和中风险。
示例性的,对于不同用药的患者,其分类结果包括治疗效果有效、无效等。
应当理解的,构建所述分类模型的样本中脂质生物标记物的表达量和患者血液中脂质生物标记物的表达量采用相同的检测方法得到。
由上所述可以看出,本说明书的技术方案通过获取患者的特征数据集,基于患者的特征数据集中的用药特征、血液中脂质生物标记物以及相应的表达量,利用与用药特征相对应的分类模型,得到所述患者针对肺结核病的分类结果。这样的技术方案,具有对患者身体伤害低,能够适用于肺结核病早期筛查、评估肺结核病是否治愈,为肺结核病的早期筛查诊断以及疗效评价提供了一种新的、客观的技术方案,可供医生参考。
在本说明书一个或多个实施例中,当采用液相色谱法测量所述脂质生物标记物时,所述表达量基于色谱峰面积和标准品浓度曲线确定。应当理解的,采用液相色谱法,同一成分色谱峰面积的大小能够代表其含量的相对大小;但是该色谱峰面积不能直接确定所述该成分的浓度,需要通过配置不同浓度的标准品溶液分别进行液相色谱分析,进而得到色谱峰面积和浓度的对应关系。因此,本说明书一个或多个实施例中,当采用液相色谱法检测脂质生物标记物时,所述表达量需要借助标准品浓度曲线及其检测得到的色谱峰面积来确定。
需要说明的是,所述表达量并不限于这里的定义,针对不同的检测方法,所述表达量可以有不同的定义。本领域技术人员能够理解的,所述表达量能够体现血液中所述脂质生物标记物的相对含量即可,其表现形式包括但不限于浓度。例如,对于液相色谱法,直接采用色谱峰面积代表表达量在某些分类模型中也是可行的。
作为一个可选的实施例,当所述用药特征为非用药,对应的所述分类模型包括脂质生物标记物特征及其对应的第一预设值和第二预设值,且所述第一预设值小于第二预设值时;
所述患者分类模块,还被配置为:
根据所述脂质生物标记物特征,获得所述血液中对应脂质生物标记物的表达量;
将所述表达量和所述第一预设值以及所述第二预设值进行比较,若所述表达量大于所述第二预设值,则所述患者肺结核病高风险;若所述表达量小于所述第一预设值,则所述患者肺结核病低风险;否则所述患者肺结核病中风险。
示例性的,所述脂质生物标记物特征包括lpa(0:0/16:0),其对应的第一预设值为色谱峰面积2760.2,第二预设值为色谱峰面积2940.3。若所述患者的表达量为3600,由于3600显然大于2940.3,则确认所述患者肺结核病高风险。
示例性的,所述脂质生物标记物特征包括lpa(0:0/18:0),其对应的第一预设值为色谱峰面积3086.9,第二预设值为色谱峰面积4671。若所述患者的表达量为2700,由于2700显然小于3086.9,则确认所述患者肺结核病低风险。
作为一个可选的实施例,当所述用药特征为强化用药或强化巩固用药,对应的所述分类模型包括脂质生物标记物特征、第三预设值和基于所述脂质生物标记物特征的逻辑回归模型时;
所述患者分类模块,还被配置为:
根据所述脂质生物标记物特征,获得所述血液中对应脂质生物标记物的表达量;
将所述表达量代入所述逻辑回归模型计算得到概率估算值;
比较所述概率估算值和所述第三预设值,若所述概率估算值小于或等于所述第三预设值,则强化用药或强化巩固用药对所述患者肺结核病有效;否则效果欠佳。
示例性的,强化巩固用药对所述患者肺结核病有效,通常可以认为肺结核病已经治愈;对于效果欠佳,则应理解为需要继续治疗。
需要说明的是,若所述分类模型的脂质生物标记物特征包括5种脂质生物标记物,则获取所述血液中5种脂质生物标记物的表达量。这里,若所述血液中仅包含部分脂质生物标记物的表达量,则所述患者分类模型输出脂质生物标记物缺失警报,以便于提醒用户重新输入患者的特征数据集,进而获取需要的脂质生物标记物的表达量。
示例性的,所述用药特征是强化用药,其对应的分类模型的第三预设值为0.7405,所述逻辑回归模型logit(p)=0.11596-0.0000017955(cer(d18:1/24:0)的表达量)+0.00015060(cerp(d18:1/20:3)的表达量)+0.00050612(lpa(0:0/16:0)的表达量)+0.00020827(lpa(0:0/18:0)的表达量)-0.00046199(lpe(0:0/22:0)的表达量);将每一脂质生物标记物的表达量均代入对应的逻辑回归模型即可得到概率估算值,若所述概率估算值小于或等于0.7405,则强化用药对所述患者肺结核病有效;否则效果欠佳。
在本说明书一个或多个实施例中,当一用药特征对应至少两种不同的分类模型时,则所述分类装置,还包括:
比较模块,被配置为:比较所述至少两种不同的分类模型的分类结果,若分类结果不同,则对所述患者进行标记并输出各分类模型对应的分类结果。
需要说明的是,相比于一用药特征对应单一的分类模型时,本实施例中一用药特征对应至少两种不同的分类模型,能够有效提高所述分类装置的分类结果的精准性。通过设置比较模块,能够对至少两种不同的分类模型的分类结果进行处理,以输出正确的结果。
应当理解的,当所述分类结果相同,所述分类装置输出该分类结果即可。当分类结果不同时,通过对患者进行标记能够并输出各分类模型对应的分类结果能够提醒用户特别关注该患者,进行更有针对的检查治疗等。这里用户可以是医生。
可选地,所述分类装置,还包括:
校正模块,被配置为:获取带有标记的所述患者所属的类型,根据所述类型以及所述患者血液中脂质生物标记物以及相应的表达量,更新所述分类模型库。
其中,所述患者所述的类型可以综合其他检查、医生的判断综合确定,这里不做具体限定。所述患者的类型选自tb0、tb2、tb6和hc中的一者。
通过这样的方法,增强对预设的分类算法的训练,使得所述分类模型库中的分类模型更加健壮,适用范围更加广泛。
可选地,所述分类装置,还包括:
方案推荐模块,被配置为:根据所述分类结果,匹配对应的治疗方案并推送。
采用方案推荐模块,不仅向用户提供分类结果,还可以借助计算机强大的处理能力,匹配多种对应的治疗方法并推送,便于医生参考使用,降低医生根据分类结果进一步查找、分析治疗方案的工作强度,提高医生的工作效率。
在本说明书一个或多个实施例中,所述分类装置还包括模型训练模块;
所述模型训练模块被配置为:至少通过以下一种方法得到所述分类模型:
根据健康对照和肺结核病初诊患者的血液中第一溶血磷脂酸或第二溶血磷脂酸的表达量,对预设的分类算法训练得到用药特征为非用药对应的分类模型;
根据肺结核病初诊患者和肺结核病强化用药未治愈患者的血液中脂质生物标记物及其表达量,对预设的分类算法训练得到用药特征为强化用药对应的分类模型;
根据肺结核病强化用药未治愈患者和肺结核病强化巩固用药治愈患者的血液中脂质生物标记物及其表达量,对预设的分类算法训练得到用药特征为强化巩固用药对应的第一分类模型;以及
根据肺结核病初诊患者和肺结核病强化巩固用药治愈患者的血液中脂质生物标记物及其表达量,对预设的分类算法训练得到用药特征为强化巩固用药对应的第二分类模型。
需要说明的是,对于不同的分类模型,其预设的分类算法可以相同,也可以不同。
请参考图3a~图3d,以每一类型患者30例来简单说明本实施例的技术方案。
作为一个具体的示例,根据健康对照和肺结核病初诊患者的血液中式(ⅰ)~式(ⅱ)所示的脂质生物标记物中一者的表达量,对预设的分类算法训练得到用药特征为非用药对应的分类模型。可选地,请参阅图3a,使用medcalc(19.0.7)软件对健康对照和肺结核病初诊患者的血液中式(ⅰ)~式(ⅱ)所示的脂质生物标记物中至少一者的表达量进行受试者操作特征曲线(receiveroperatingcharacteristiccurve,简称roc)分析,其中线下面积(areaundercurve,简写auc)均为1(95%ci,1.000–1.000),灵敏度、特异性均为100%。其中,lpa(0:0/16:0)的色谱峰面积积分第一预设值为2760.2、第二预设值为2940.3;lpa(0:0/18:0)的色谱峰面积第一预设值为3086.9,第二预设值为4671。
作为又一个具体的示例,根据肺结核病初诊患者(tb0)和肺结核病强化用药未治愈患者(tb2)的血液中式(ⅰ)~式(ⅴ)所示的脂质生物标记物的表达量,对预设的分类算法训练得到用药特征为强化用药对应的分类模型。可选地,所述预设的分类算法为二元逻辑回归算法,得到的分类模型为逻辑回归模型。t检验结合受试者操作特征曲线(roc)分别评估筛选出的cer(d18:1/24:0)、cerp(d18:1/20:3)、lpe(0:0/22:0)、lpa(0:0/16:0)、lpa(0:0/18:0)以及5个脂质生物标记物逻辑回归模型对tb0和tb2的分类效果,其结果请参阅图3b。从图中可以看出,5个脂质生物标记物逻辑回归模型对应的auc为0.873(95%confidenceinterval=0.782-0.965),灵敏度为96.7%、特异度为70.0%,能较好地区分tb2与tb0两组患者。
其中,所述脂质生物标记物逻辑回归模型为:logit(p)=0.11596-0.0000017955(cer(d18:1/24:0)的表达量)+0.00015060(cerp(d18:1/20:3)的表达量)+0.00050612(lpa(0:0/16:0)的表达量)+0.00020827(lpa(0:0/18:0)的表达量)-0.00046199(lpe(0:0/22:0)的表达量),其对应的第三预设值为0.7405。若计算得到的概率估计logit(p)值小于或等于0.7405,则认为该患者肺结核病强化治疗有效,若logit(p)值大于0.7405,则认为肺结核病强化治疗效果欠佳,判断可能需要继续使用四联药物进行强化治疗。
作为又一个具体的示例,根据肺结核病强化用药未治愈患者(tb2)和肺结核病强化巩固用药治愈患者(tb6)的血液中式(ⅰ)~式(ⅴ)所示的脂质生物标记物的表达量,对预设的分类算法训练得到用药特征为强化巩固用药对应的第一分类模型。可选地,所述预设的分类算法为二元逻辑回归算法,得到的分类模型为逻辑回归模型。t检验结合受试者操作特征曲线(roc)分别评估筛选出的cer(d18:1/24:0)、cerp(d18:1/20:3)、lpe(0:0/22:0)、lpa(0:0/16:0)、lpa(0:0/18:0)以及5个脂质生物标记物逻辑回归模型对tb6和tb2的分类效果,其结果请参阅图3d。从图中可以看出,5个脂质生物标记物逻辑回归模型对应的auc为0.783(95%confidenceinterval=0.665-0.902),灵敏度为70.0%、特异度为83.3%,能够较好的区分强化巩固治疗对肺结核病是否有效,若有效,则通常可以患者的肺结核病已治愈。
其中,所述脂质生物标记物逻辑回归模型为:logit(p)=1.08055-0.00000060400(cer(d18:1/24:0)的表达量)-0.00043782(cerp(d18:1/20:3)的表达量)+0.0011280(lpa(0:0/16:0的表达量)-0.00017277(lpa(0:0/18:0)的表达量)-0.00017645(lpe(0:0/22:0)的表达量)。其对应的第三预设值为0.5036。若计算得到的概率估计logit(p)值小于或等于0.5036,则认为该患者肺结核病强化巩固治疗有效,达到肺结核病治愈状态;若logit(p)值大于0.5036,则认为肺结核病强化巩固治疗效果欠佳,判断可能需要继续抗结核治疗,不能中断药物。
作为又一个具体的示例,根据肺结核病初诊患者(tb0)和肺结核病强化巩固用药治愈患者(tb6)的血液中式(ⅰ)~式(ⅴ)所示的脂质生物标记物的表达量,对预设的分类算法训练得到用药特征为强化巩固用药对应的第二分类模型。可选地,所述预设的分类算法为二元逻辑回归算法,得到的分类模型为逻辑回归模型。t检验结合受试者操作特征曲线(roc)分别评估筛选出的cer(d18:1/24:0)、cerp(d18:1/20:3)、lpe(0:0/22:0)、lpa(0:0/16:0)、lpa(0:0/18:0)以及5个脂质生物标记物逻辑回归模型对tb6和tb0的分类效果,其结果请参阅图3c。从图中可以看出,5个脂质生物标记物逻辑回归模型对应的auc为1(95%confidenceinterval=1.0–1.0),灵敏度为100.0%、特异度为100.0%,能够较好的区分强化巩固治疗对肺结核病是否有效,若有效,则通常可以患者的肺结核病已治愈。
其中,所述脂质生物标记物逻辑回归模型为:logit(p)=-68.85814+0.0000053173(cer(d18:1/24:0)的表达量)+0.0080798(cerp(d18:1/20:3)的表达量)+0.010486(lpa(0:0/16:0的表达量)+0.013331(lpa(0:0/18:0)的表达量)-0.0083996(lpe(0:0/22:0)的表达量)。其对应的第三预设值为0。若计算得到的概率估计logit(p)值小于或等于0,则认为该患者肺结核病强化巩固治疗有效,达到肺结核病治愈状态;若logit(p)值大于0,则认为肺结核病强化巩固治疗效果欠佳,判断可能需要继续抗结核治疗,不能中断药物。
需要说明的是,以上示例仅用于说明本说明书的技术方案,本领域技术人员能够就理解的,当每一类型患者的数量、预设的分类算法不同时,其得到的分类模型可能存在差异。应当理解的,由于在肺结核病不同的治疗阶段,5个脂质生物标记物的表达量不同,即便分类模型的具体表现形式存在区别,只要其能够满足分类模型对灵敏度、特异性的需求,即能够适用于本说明书的技术方案,这里不再赘述。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
在本说明书的第二方面,还提供检测脂质生物标记物的试剂在制备肺结核病筛查与疗效评价的试剂盒中的应用;其中,所述脂质生物标记物包括第一溶血磷脂酸、第二溶血磷脂酸、第一神经酰胺、第二神经酰胺和溶血磷脂酰乙醇胺中的至少一者;并且至少包括第一溶血磷脂酸和第二溶血磷脂酸中的一者。
可选地,所述第一溶血磷脂酸如式(ⅰ)所示
所述第二溶血磷脂酸如式(ⅱ)所示
所述第一神经酰胺如式(ⅲ)所示
所述第二神经酰胺如式(ⅳ)所示
所述溶血磷脂酰乙醇胺如式(ⅴ)所示
在一些实施例中,所述试剂盒包括:所述脂质生物标记物的标准品。应当理解的,所述脂质生物标记物的标准品可以用于实现对相应脂质生物标记物的定量,例如液相色谱检测所述脂质生物标记物。
可选地,所述标准品的溶剂选自二甲基亚砜(dmso)和甲醇中的一者或两者。可选地,所述标准品保存于-20℃。
进一步地,所述试剂盒还可以包括:甲醇、乙腈、醋酸、甲酸铵、氯仿和甲基叔丁基。可以理解的,前述试剂能够用于液相色谱法检测所述脂质生物标记物。
在本说明书的第三方面,还提供了一种电子设备。图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的cpu(centralprocessingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用rom(readonlymemory,只读存储器)、ram(randomaccessmemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除