一种基因组瘢痕模型的建立方法与流程
2021-01-08 13:01:14|407|起点商标网
本发明属于基因检测
技术领域:
,具体涉及一种基因组瘢痕模型的建立方法。
背景技术:
:同源重组修复(homologousrecombinationrepair,hrr)是dna双链损伤的重要修复方式,常见于细胞精确修复双链dna上的有害断裂。hrr是一条涉及到多个步骤的复杂的信号通路,其中乳腺癌易感基因(brca1/2)作为重要的同源重组功能相关基因。如果brca基因出现突变导致brca1和brca2蛋白失去功能,就会引起hrr功能异常,常被称为同源重组缺陷(homologousrecombinationdeficiency,hrd),hrd作为肿瘤驱动事件广泛的存在于乳腺癌、卵巢癌、前列腺癌和胰腺癌中。通常携带brca1/2突变或表达异常的肿瘤表现为对铂类化疗药物和聚[adp-核糖]聚合酶抑制剂(parpi)敏感。因此对brca1/2基因突变检测作为此类疾病的临床分类与用药指导都有着突出的作用。然而随着研究深入,brca基因突变检测逐渐不能满足现有的临床需求,brca基因突变检测富集的用药有效人群偏低,会遗漏部分治疗受益人群。例如,在三阴性乳腺癌中,20%的患者携带brca基因突变,然而患者人群对铂类药物整体响应率约为30%。同时在高级别浆液性卵巢癌中,30%的患者携带brca基因突变,然而患者人群对parpi药物整体响应率约为50%,表明一部分brca检测阴性患者对铂类或parpi仍有应答,因此brca检测会遗漏部分治疗受益人群。遗漏的原因主要包括:首先,brca基因突变检测相对局限。hrr功能相关基因众多,brca1/2是其中突变频率较高的两个。从药物作用原理上分析,只要能和铂类以及parpi形成合成致死效应的hrr基因都值的关注(统称brcaness事件),如profound临床研究结果表明hrr相关基因atm缺陷对prapi奥拉帕利治疗前列腺癌具有效果,因此越来越多临床实验由关注brca转向其他hrr相关基因。其次,brca基因突变检测,不能覆盖所有引起hrr功能缺失的基因组异常类型。除了基因突变,bcra1启动子区域的甲基化和brca基因区域内部的杂合性缺失(lossofheterozygosity,loh)也是引起hr功能缺陷的主因。最后,brca基因突变检测结果解读复杂,容易遗漏,临床应用门槛较高。目前有很多权威机构如美国医学遗传学与基因组学学会(acmg)和欧洲分子基因诊断质量联盟(emqn)都推出了遗传性乳腺癌/卵巢癌分子遗传分析最佳实践指南。对brca突变分类:致病性,可能致病性,意义未明,可能良性和良性,不同指南引用证据等级也略有不同,这会给临床应用造成很大障碍。基于以上原因,新型的可以简单定量评估细胞同源重组修复缺陷的临床分子标记物需求极为迫切。通过寻找因hrr缺陷引发的下游基因组突变(包括突变、拷贝数变异(copynumbervariation,cnv),基因表达异常)特征的分子标记物是目前主要的研究方向。2009年,olafur等人发现cnv突变特征和brcaness紧密相关,2012年,abkevich等人发现全基因组中loh的个数和brcaness事件显著相关。同年,popova等人发现基因中大片段转移事件(large-scalestatetransitions,lst)和brca1/2基因失活相关,而birkbak等人也发现端粒不平衡(telomericallelicimbalance,tai)在三阴性乳腺癌中与brcaness事件相关,并在铂类治疗敏感的人群中显著富集。2016年,美国myriad公司通过统计全基因组loh、lst和tai发生次数,定量计算hrd分数(hrd评分),该统计指标可以准确地预测brcaness事件,同时也可以有效地富集出对铂类和parpi治疗敏感的患者人群。hrd评分相比于单独检测brca基因可以多筛选出40%的潜在受益患者。此外,2017年davies等人,发现全基因组单碱基突变模式,长短片段重排模式以及插入缺失模式都和hrr缺陷紧密相关,并且将这几种模式联合hrd评分,通过罗杰斯特回归可以准确预测brcaness事件。然而以上方法都有各自的局限性,例如,hrd评分只是笼统将loh,lst和tai简单相加,事实上tai和loh在某些情况是有重叠,从而导致重复计数,此外某些cnv类型也未被hrd评分考虑在内。而davies的模型虽然考虑全面,但是该模型需要全基因组测序统计各种突变类型的模式,从而导致检测成本极为昂贵。技术实现要素:本发明的目的在于克服现有技术缺陷,提供一种基因组瘢痕模型的建立方法。本发明的另一目的在于提供上述建立方法所建立的基因组瘢痕模型的应用本发明的技术方案如下:一种基因组瘢痕模型的建立方法,包括如下步骤:(1)收集已知的阳性样本和阴性样本,组成训练集;(2)对上述训练集中的cnv的情况进行分析,确定cnv的类型及相应的数量;(3)确定brcaness阳性事件和brcaness阴性事件;(4)通过机器学习方法,根据训练集中的brcaness阳性事件、brcaness阴性事件,训练获得步骤(2)所确定的不同类型的cnv的权重,然后将不同类型的cnv带权重累加,得到用以计算gss(基因组瘢痕分数)的基因组瘢痕模型;(5)另外收集已知的阳性样本和阴性样本,组成测试集,并按照步骤(2)获得测试集中cnv的类型及相应的数量;(6)将步骤(5)所获得的结果代入步骤(4)得到的基因组瘢痕模型,以计算测试集的gss,并根据gss的分数验证上述基因组瘢痕模型,即成。在本发明的一个优选实施方案中,步骤(2)中,对步骤(1)所获得的训练集进行测序分析,计算上述测序分析结果中的cnv情况,同时将相邻且拷贝数变异相同的区域连接成片段,以避免重复计算,确定cnv的类型及相应的数量;进一步优选的,上述测序分析基于全基因组,全外显子组,靶向捕获测序或拷贝数变异芯片。在本发明的一个优选实施方案中,所述brcaness阳性事件包括:brca1/2中任意之一中,一个等位基因发生致病或疑致病性突变,另一个等位基因发生杂合性缺失;brca1/2中任意之一中,发生两个致病或疑似致病性突变;bcra1中一个等位基因发生杂合性缺失,另一个等位基因启动子区域发生甲基化。在本发明的一个优选实施方案中,所述brcaness阴性事件为:hrr相关基因为野生型,并且对应等位基因没有发生杂合性缺失,或其启动子区域没有甲基化。在本发明的一个优选实施方案中,所述步骤(2)中的cnv的类型根据变异片段长度、变异片段类型以及变异片段在基因组的位置而确定。进一步优选的,所述变异片段的长度分为5-10m的短片段、大于10m且小于等于15m的中片段和大于15m的长片段。进一步优选的,所述变异片段类型包括杂合性缺失、变异片段链不平衡性扩增和变异片段链平衡性扩增。进一步优选的,所述变异片段在基因组上的位置包括变异片段位于端粒侧、变异片段位于着丝粒区域内以及变异片段位于除端粒侧和着丝粒区域内以外的位置。本发明的另一技术方案之一:上述建立方法所建立的基因组瘢痕模型在富集hrr突变相关人群中的应用。本发明的另一技术方案之二:上述建立方法所建立的基因组瘢痕模型在富集铂类用药敏感性人群中的应用。本发明的另一技术方案之三:上述建立方法所建立的基因组瘢痕模型在富集parpi用药敏感性人群中的应用。本发明的有益效果是:1、相比brca基因突变检测,本发明可以不用检测brca1启动子区域的甲基化,以及brca基因的杂合性缺失,准确预测待测样本brcaness状态。此外,相对于brca突变的复杂解读,本发明可以直接根据基因组瘢痕分数直接给出判读结果。2、相比brca基因突变检测,本发明可以富集hrr相关基因突变患者。3、相比brca基因突变检测,本发明可以富集更多的铂类用药敏感性患者。4、相比brca基因突变检测,本发明可以富集更多的parpi用药敏感性患者。附图说明图1为本发明实施例3的实验结果图。图2为本发明实施例4的实验结果图之一。图3为本发明实施例4的实验结果图之二。具体实施方式以下通过具体实施方式结合附图对本发明的技术方案进行进一步的说明和描述。实施例1分别收集110和18例检测样本类型为卵巢癌患者的ffpe样本和对照血液样本,作为构建基因组瘢痕模型的训练集和测试集。后采用厦门艾德生物医药科技股份有限公司同源重组缺陷(hrd)检测试剂盒进行文库构建和捕获,此试剂盒包含35个hrr相关基因以及7万个snp位点作为捕获区域。所捕获和富集的dna最后在illuminanovaseq测序仪上进行测序。原始下机数据通过bwa(lih.anddurbinr.2009),比对到人类参考基因组序列(版本号hg19)。生成比对好的bam文件,作为突变和拷贝数变异的输入文件。其中突变检测利用varscan流程(koboldt,d.2012),链特异性的拷贝数变异利用sequenza(faverof.2015)流程。brcaness样本确认。选择目前最为常见的brcaness事件作为阳性样本标签,具体包括a.brca1/2任意一个基因,一个等位基因发生致病或疑致病性突变,另一个等位基因发生杂合性缺失;b.brca1/2任意一个基因,发生两个致病或疑似致病性突变,即功能性缺失;c.bcra1一个等位基因发生杂合性缺失,另一个等位基因启动子区域发生甲基化,其中bcra1启动子区域类甲基化利用焦磷酸测序技术获得。brcaness阴性样本确认,hrr相关突变基因为野生型,并且对应基因没有发生loh。厦门艾德生物hrd检测试剂包括hrr相关基因如下:atm,fam175a,fanci,nbn,rad51c,atr,fanca,fancl,palb2,rad51d,atrx,fancc,fancm,rad50,rad52,bap1,fancd2,kmt2d,rad51,rad54l,bard1,fance,mdc1,rad51b,slx4,blm,fancf,mre11a,wrn,xrcc2,brca1,fancg,brca2,brip1,emsy。本实施例拷贝数变异片段按着变异长度分类,包括短片段(5-10m)、中型片段(大于10且小于等于15m)和长片段(>15m)。拷贝数变异片段也可以按着变异类型分类,包括杂合性缺失(lossofheterozygosity,loh),变异片段链不平衡性扩增(allelespecificcnv,ascnv),变异片段链平衡性扩增(balancecnv,bcnv)。拷贝数变异片段还可以按着所处基因组位置分类,包括变异片段位于端粒侧,变异片段位于着丝粒区域内和剩余其他区域。最终拷贝数变异片段被分为27种类型(即长度分类×变异类型分类×所处基因组位置分类=27)按上述处理,训练集中brcaness样本68例,阴性样本42例,测试集中brcaness样本10例,阴性样本8例。在训练过程中为了防止过拟合,只保留拷贝数变异片段在训练样本中出现次数大于训练集样本数目的类型。后利用逻辑斯蒂回归根据样本brcaness类型训练拷贝数变异片段类型权重,从而构建基因组瘢痕模型。基因组瘢痕模型计算待测样本gss分数小于0.5样本判定为brcaness阴性样本,gss分数大于0.5样本判定为brcaness阳性样本。在测试集中,利用基因组瘢痕模型计算待测样本gss,判定待测样本的brcaness状态。之后和测试集中样本的之前标记好brcaness状态进行比较,其中10例brcaness阳性样本,基因组瘢痕模型能准确判为阳性,8例brcaness阴性样本,基因组瘢痕模型能准确判为阴性。即基因组瘢痕模型的gss可准确预测样本brcaness状态,其灵敏度为100%,特异性为100%,准确性为100%。实施例2收集191例检测样本类型为卵巢癌患者的ffpe样本和对照血液样本。后采用厦门艾德生物医药科技股份有限公司同源重组缺陷(hrd)检测试剂盒进行文库构建和捕获,并在illuminanovaseq测序仪上进行测序,后采用实施例1中已训练好的基因组瘢痕模型计算待测样本gss。统计gss高分组和hrr突变人群的关系,如下表无hrr相关基因突变组有hrr相关基因突变组gss低分组5219gss高分组5664通过超几何分布检验,gss高分组显著富集hrr相关基因突变的患者,p=0.0003。此外,相比于hrr相关基因,实施例1获得的基因组瘢痕模型的gss可以富集更多基因组不稳患者。实施例3收集44例检测样本类型为卵巢癌患者的ffpe样本和对照血液样本,这些患者术后首次治疗方案为铂类化疗。后采用厦门艾德生物医药科技股份有限公司同源重组缺陷(hrd)检测试剂盒进行文库构建和捕获,并在illuminanovaseq测序仪上进行测序,后采用实施例1中已训练好的基因组瘢痕模型计算待测样本gss。通过比较gss高分组和gss低分组患者的无进展生存期(progression-freesurvival,pfs),评估gss富集铂类用药敏感人群的作用。结果如图1所示。如图所示,gss状态即gss高分(gss+)和gss低分(gss-)分组,患者无进展生存期有显著差异,gss高分组中患者采用铂类治疗无进展生存期显著较长(p=0.05),其中gss高分组患者中位pfs=11个月,gss低分组患者中位pfs=8.5个月。实施例4收集14和20例检测样本类型为卵巢癌患者的ffpe样本和对照血液样本,这些患者分别接受一线维持治疗和后线治疗方案为parpi。后采用厦门艾德生物医药科技股份有限公司同源重组缺陷(hrd)检测试剂盒进行文库构建和捕获,并在illuminanovaseq测序仪上进行测序,后采用实施例1中已训练好的基因组瘢痕模型计算待测样本gss。在接受parpi一线维持治疗的卵巢癌患者中,如图2所示,gss高分(gss+)和gss低分(gss-)分组,患者无进展生存期有显著差异,gss高分组中患者采用parpi治疗无进展生存期显著较长(p=0.03),其中gss高分组患者中位pfs=10.5个月,gss低分组患者中位pfs=7个月在parpi后线治疗卵巢癌患者中,gss高分组中客观缓解率(objectiveresponserate,orr)为38.5%(5/13),相对于hrd高分组(35.7%)和brca突变组(33.3%)中的客观缓解率最高,而gss低分组中orr为14.3%(1/7),相对于hrd低分组(16.7%)和brca野生型组(21.4%)中的客观缓解率最低,结果如图3所示,即实施例1获得的基因组瘢痕模型的gss可富集parpi类用药敏感人群。以上所述,仅为本发明的较佳实施例而已,故不能依此限定本发明实施的范围,即依本发明专利范围及说明书内容所作的等效变化与修饰,皆应仍属本发明涵盖的范围内。当前第1页1 2 3 
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除
热门咨询
tips