HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

基因组甲基化DNA靶向富集的文库构建方法及其应用与流程

2021-02-02 18:02:30|420|起点商标网
基因组甲基化DNA靶向富集的文库构建方法及其应用与流程

技术领域:
】本发明涉及分子生物学领域,更具体的,涉及一种基因组甲基化dna靶向富集的文库构建方法及其应用。
背景技术:
:表观遗传学是对表观基因组的研究,表观基因组的两个主要组分是dna甲基化和组蛋白修饰。目前,dna甲基化是表观遗传学研究的热点方向。dna的甲基化会在不改变dna碱基的种类与数量的前提下,使得被修饰的dna的空间结构发生改变导致基因的沉默或过度表达、逆转录转座子的沉默及哺乳动物肿瘤等多种疾病的发生。在肿瘤细胞中,一些原本在正常细胞中处于低甲基化水平的抑癌基因与细胞周期调控基因却呈现高甲基化状态并失活,而某些因子(如增殖相关的转录因子)的甲基化水平会降低促进其表达。肿瘤细胞内出现的甲基化异常已经成为了一个新的肿瘤生物标志物的研究方向,dna甲基化生物标记可成为多种疾病的早期诊断指标以及对高危个体的评估指标。目前,基于第二代高通量测序仪的甲基化dna的研究方法,常见的是bs-seq(重亚硫酸盐转化测序),rrbs(酶切-重亚硫酸盐转化测序)。这些方法主要是通过物理或生化方式,将样品片段化,然后通过重亚硫酸盐处理来区分甲基化的胞嘧啶残基与未甲基化的胞嘧啶残基。bs处理可将dna中未甲基化的胞嘧啶残基转换为尿嘧啶残基,在后续扩增中会被替换未胸腺嘧啶残基。而5-甲基胞嘧啶(5-mc)和5羟甲基胞嘧啶(5-hmc)会以胞嘧啶残基的状态保留。进而通过单碱基分辨率的二代测序进行dna甲基化状态的评估。但全基因组甲基化测序想要达到20x测序深度的数据,会产生约60gb的测序原始数据,数据处理成本较高,耗时长。使用生物素磁珠结合探针杂交捕获的方法,需要较大的样本量进行重亚硫酸盐处理,杂交探针合成成本较高,仅杂交步骤耗时通常在4~16小时不等,整个实验流程大约需要2天。因此有必要针对现有技术的不足,设计一种新的dna甲基化靶向富集的文库构建方法,并推广于甲基化检测的应用,实现快速、低成本测序。技术实现要素:针对现有技术中存在的问题,本发明提出了一种基因组甲基化dna靶向富集的文库构建方法及其应用,通过设计靶向探针结合重亚硫酸盐处理法获得测序文库,实现快速、低成本测序。为了实现上述目的,本发明公开了一种基因组甲基化dna靶向富集的文库构建方法,包括以下步骤:设计与合成靶向捕获探针、样品转化、靶向捕获文库制备及文库扩增;所述捕获探针的设计包括以下步骤:1.基于参考基因组中的甲基化区域或任意区域,向其上下游拓展100-400bp长度;2.从第一个碱基开始划定,100~200个碱基设定为一个区域,每个区域选取前15-40个碱基作为探针,如探针位置落在重复区域内,则将探针向5’方向移动,使得最后一个碱基落入非重复区域;3.将探针与参考基因组序列进行比对,保留特异性较高的探针;4.将筛选得到的所有探针进行热力学计算,弃掉互补的探针;5.检索每区域是否至少有一条符合要求的探针,如没有,增加或减少探针碱基数量再重复步骤3、4、5,将符合条件的探针进行合成并混合;其中,所述探针设计时序列中所含有的胞嘧啶碱基在合成转变成简并碱基y。优选地,所述步骤2中,探针位置落在重复区域时,将探针设置在5’方向,使探针最后一个碱基落在重复区域5’方向的前一个碱基。进一步地,所述靶区域为基因的启动子区、基因组上任意位置区域或全基因组区域。进一步地,其特征在于,所述的探针库中的捕获探针的长度为30bp至80bp。进一步地,所述靶向捕获文库制备过程包括以下步骤:1)进行dna与t7接头的连接,合成dna-t7;2)对dna-t7进行互补链的合成;3)双链dna纯化;4)使用dna聚合酶反应液,加入捕获探针,通过核酸扩增进行特异性区域富集;其中,步骤1)至3)反应体系选自abclonalrk20220。进一步地,所述dna聚合酶为hotstarttaqdnapolymerase、pfuturbocxhotstartdnapolymerase或kapahifihotstarturacil+readymixkit中的一种。进一步地,所述核酸扩增反应体系包括100mmkcl,90mmtmac,体积分数2.5%dmso,体积分数2.5%formide,20mmtris-hcl,1.5mmmgcl2。本发明的另一个目的在于,提供了上述文库构建方法在基因组甲基化检测试剂盒中的运用。本发明的还有一个目的在于,提供了上述文库构建方法获得的文库在基因组甲基化检测中的运用,所述运用中将所述构建方法获得的文库进行二代测序,进行数据分析获得甲基化结果。进一步地,所述分析步骤为:先使用软件进行质量控制与接头去除再对序列进行trim处理,然后进行测序结果的校正,再进行reads比对,比对后设置过滤参数进行过滤,过滤后的甲基化信息则为实际的dna甲基化信息。相比现有技术,本发明的有益效果为:1)与常规的重亚硫酸盐处理后再进行序列捕获或序列捕获后再进行重亚硫酸盐处理的方法相比,本发明方法对样品起始量要求低(最低50ng),重亚硫酸盐处理后信息丢失少,实验流程少耗时短。2)本发明中的捕获探针设计方案与常规杂交捕获方案相比,从样本处理至文库构建完成可节约6-8小时,同时本发明不涉及探针杂交技术,所需探针数量少,探针总合成成本低,探针覆盖区域更加灵活,捕获率较高,应用范围更广泛。【附图说明】为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本发明文库结构示意图;图2为本发明靶向甲基化捕获技术路线图;图3为本发明靶向甲基化捕获技术示意图;图4为实施例1lambdadna甲基化捕获文库图;图5为实施例1鉴定lambdadna甲基化捕获片段在参考基因组上的分布示意图;图6为实施例2humangdna捕获区域及引物起始位置总览;图7为实施例2humangdna甲基化捕获文库图;图8为实施例2humangdna甲基化捕获片段在参考基因组上的分布。【具体实施方式】以下实例用于说明本发明,但不限制本发明的范围。在不背离本发明精神和实质的前提下,对本发明的方法、步骤或条件所作的修改或替换,均属于本发明的范围。本发明提供了一种基因组甲基化dna靶向富集的文库构建方法,包括设计与合成靶向捕获探针、样品转化、靶向捕获及文库扩增。本发明文库构建结构示意图如图1所示,靶向甲基化捕获技术路线图如图2所示;靶向甲基化捕获技术示意图如图3所示。在以下实施例中,基于本发明路线的基因组甲基化dna靶向富集的文库构建方法中,设计与合成靶向捕获探针步骤包括:(1)使用repeatmasker软件或其他可标记基因组重复序列的软件标记参考基因组中的重复序列;(2)在参考基因组上选择感兴趣的甲基化区域或任意区域,向其上下游拓展100~400bp长度;(3)从第一个碱基开始划定,100~200个碱基设定为一个区域,每个区域选取前15-40个碱基作为探针,如探针位置落在重复区域内,则将探针向5’方向移动,使探针最后一个探针落入非重复区域;优选地,探针位置落在重复区域时,将探针设置在5’方向,使探针最后一个碱基落在重复区域5’方向的前一个碱基。(4)使用blast软件,将探针与参考基因组序列进行比对,保留特异性较高的探针;(5)将筛选得到的所有探针进行热力学计算,弃掉互补的探针,避免形成dimer;(6)检索每区域是否都有至少一条符合要求的探针,如没有,增加或减少探针碱基数量再重复步骤(4)(5)(6)。将符合条件的探针进行合成并混合,保持每条探针浓度在1nm~1μm;其中,所述探针序列中所含有的胞嘧啶碱基在合时成转变成简并碱基y。在以下实施例中,基于本发明提供的基因组甲基化dna靶向富集的文库构建方法获得文库,对其进行测序,测序所得原始数据的分析流程为,先使用fastp软件进行质量控制与接头去除再对序列进行trim处理。使用umitools进行测序结果的校正,再使用bismark软件进行reads与bs处理后的参考基因组序列进行比对,比对后结果以duplication>10作为过滤参数进行过滤,过滤后的甲基化信息则为实际的dna甲基化信息。最后可使用bamdst软件对捕获效率进行统计。得到的dna甲基化信息可用于下游分析与统计。实施例1:基因组dna甲基化捕获本实施例所选用示例物种为lambda噬菌体,靶向捕获探针区域为任意区域,该实例中探针库的设计为针对lambda噬菌体基因组dna设计,标记去除重复序列后,选取了7个目的区域,区间长度范围为200~400bp,优选的区域始末位置分别为:1900~2200,3500~3800,4600~4800,8200~8400,9200~9600,11300~11500,13600~13800;从每区域向5’端拓展100bp,进行探针选择、blast比对和热力学计算,弃除互补的探针,避免形成dimer。最终优选的探针起始位置为:1957,3559,4532,8140,9336,11221,13585,每区域设计了1条探针,共计7条探针,探针序列见表1所示,设计原则按照前文所述探针设计方法进行,探针合成由上海生工生物有限公司提供。表1:引物设计取100ngdna样品,转化处理方式为使用ezdnamethylation-goldkittm(zymo)进行未甲基化的胞嘧啶到尿嘧啶的转化。使用ssdnaqubit(invitrogen)进行定量。靶向捕获文库快速制备及文库扩增包括以下步骤:1)预处理;2)末端修复&t7接头连接;3)二链合成;4)捕获扩增;5)文库扩增,其中步骤;2)与步骤3)使用scalemethyl-dnalibprepkitforillumina(abclonal,rk20220)的末端修复&t7接头连接、二链合成模块,步骤5)中所使用的universalprimer与indexprimer可使用scalemethyl-dnalibprepkitforillumina(abclonal,rk20220)中所含有的也可使用任意适用于二代测序平台的universalprimer与indexprimer。1.预处理热循环仪(pcr仪)提前置于95℃,热盖温度设定为105℃,配制t7tailing&ligation预混液,冰上放置待用;注意:热循环仪(pcr仪)提前置于95℃,待2min结束,要立即置于冰上,保证dna最大程度的以ssdna的形式存在;在进入dna预处理之前,将t7tailing&ligation(选自abclonalrk20220)预混液提前配制好,充分混匀后,冰上放置至少3~5min,防止因为t7tailing&ligation预混液温度过高,导致预处理的dna出现复性,降低t7tailing&ligation效率;1.1取bisulfite处理后的dna50ng,放在0.2ml的pcr管中,加入low-edtate(选自abclonalrk20220)稀释到总体积为15μl;1.2待pcr仪器稳定到95℃后,将pcr管放入pcr仪中,进行95℃孵育2min后,立即将pcr管置于冰上进行冷却,静置2min。2.末端修复&t7接头连接,反应体系如表2所示。表2:反应程序为:37℃/15min,95℃/2min,4℃/hold。3.二链合成,反应体系如表3所示。表3:反应程序为:98℃/1min,60℃/2min,68℃/5min,4℃/hold;使用1.0x磁珠纯化两次,第二次使用20μllow-edta-te回收。4.捕获扩增,使用预设的捕获探针库进行聚合酶链式反应,所选用酶为dna聚合酶家族a的hotstarttaqdnapolymerase(neb,m0495)或dna聚合酶家族b的pfuturbocxhotstartdnapolymerase(agilent,600410)或kapahifihotstarturacil+readymixkit(kapa,kk2800),2.5xpcrbuffer中含有kcl(100mm),tmac(90mm),dmso(2.5%,v/v),formide(2.5%,v/v),tris-hcl(20mm),mgcl2(1.5mm)。反应体系如表4。表4:反应程序如表5。表5:将扩增产物使用1.0x磁珠纯化1次后,20μllow-edta-te回收。5.文库扩增,使用适用于二代测序平台的universalprimer与indexprimer进行扩增,所选用聚合酶为高保真dna聚合酶(kapa,kk2631),反应体系见表6。表6:反应程序如表7。表7:扩增产物用1.0x磁珠纯化1次后使用20μllow-edta-te回收,扩增产物使用qpcr定量后可以在二代测序平台上机测序。实验结果:lambdadna甲基化捕获文库如图4所示,为50ng起始量捕获结果,片段大小集中分布在230~900bp;lambdadna甲基化捕获片段在参考基因组上的分布如图5所示,位置区域2000~2200,3600~3800,4600~4800;lambdadna甲基化捕获效率如表8所示。表8:lambdadna甲基化捕获效率sampletargetratemappingzz-methmix26-c0423-2592.62%65.85zz-methmix26-c0423-4194.87%56.01zz-methmix26-c0423-4572.56%52.76zz-methmix26-c0423-4773.91%51.52甲基化捕获效率在70%以上,代表捕获成功。与常规杂交捕获方案相比,从样本处理至文库构建完成可节约6-8小时,同时本发明不涉及探针杂交技术,所需探针数量少,探针总合成成本低,探针覆盖区域更加灵活。实施例2人gdna甲基化捕获试剂盒本实施例中,所选用的物种为人,靶向探针可以设计为基因的启动子区域或进行整个区域的覆盖,本实例中为针对人基因组中4个甲基化标志物基因(gstp1,twist1,rassf1,otx1)的区域覆盖,标记了基因中的重复序列后,每个基因向5’端拓展100bp区域,再进行探针选择、blast比对与热力学计算,弃除互补的探针,避免形成dimer。最终筛选得到了51条捕获探针。区域及探针位置见图6,探针序列见表9,探针合成由安徽通用生物技术有限公司。表9:探针设计在本实施例中,取200ngdna样品,样品转化处理方式为使用covarism220非接触式超声波破碎仪进行样品的片段化处理,将样品基因组dna打断至200~300bp。再使用ezdnamethylation-goldkittm(zymo)进行未甲基化的胞嘧啶到尿嘧啶的转化。使用ssdnaqubit(invitrogen)进行定量。本实施例靶向捕获文库快速制备及文库扩增包括以下步骤:1)预处理;2)末端修复&t7接头连接;3)二链合成;4)捕获扩增;5)文库扩增,其中步骤2)与步骤3)使用scalemethyl-dnalibprepkitforillumina(abclonal,rk20220)的末端修复&t7接头连接、二链合成模块,步骤5)中所使用的universalprimer与indexprimer可使用scalemethyl-dnalibprepkitforillumina(abclonal,rk20220)中所含有的也可使用任意适用于二代测序平台的universalprimer与indexprimer。1.预处理热循环仪(pcr仪)提前置于95℃,热盖温度设定为105℃,配制t7tailing&ligation预混液,冰上放置待用;注意:热循环仪(pcr仪)提前置于95℃,待2min结束,要立即置于冰上,保证dna最大程度的以ssdna的形式存在;在进入dna预处理之前,将t7tailing&ligation(选自abclonalrk20220;)预混液提前配制好,充分混匀后,冰上放置至少3~5min,防止因为t7tailing&ligation预混液温度过高,导致预处理的dna出现复性,降低t7tailing&ligation效率。1)取bisulfite处理后的dna50ng,放在0.2ml的pcr管中,加入low-edtate稀释到总体积为15μl;2)待pcr仪器稳定到95℃后,将pcr管放入pcr仪中,进行95℃孵育2min后,立即将pcr管置于冰上进行冷却,静置2min。2.末端修复&t7接头连接热循环仪(pcr仪)提前置于37℃,热盖温度105℃。1)按照表10中的体系配制t7tailing&ligation预混液,需要在预处理前配制好,冰上放置时间最好不要超过20min;表10:取25μlt7tailing&ligation预混液加入到冰上放置的预处理dna样本pcr管中(步骤1中2)所得),使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底;3)将pcr管置于pcr仪(热盖105℃)中,进行t7tailing&ligation反应:37℃15min;95℃2min;4℃保持,待反应结束,将pcr管冰上放置,待反应结束,将pcr管冰上放置,准备加入secondstrandsynthesisreaction预混液。3.二链合成反应热循环仪(pcr仪)提前置于98℃,热盖105℃。1)按照表11中配置secondstrandsynthesisreaction预混液,冰上放置时间最好不要超过20min;2)取46μl二链合成反应预混液加入到t7tailing&ligateddna(步骤2中3)所得)中,使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底;表11:3)将pcr管置于pcr仪(热盖105℃)中,进行二链合成反应:98℃1min;60℃2min;68℃5min;4℃保持;4)提前将agencourtampurexpbeads从2-8℃取出,静置平衡至室温,使用前涡旋或者震荡混匀;5)待secondstrandsynthesisreaction结束后,在产物中加入105μlagencourtampurexpbeads(1.2×),吹打混匀;6)室温静置5min,然后转移至磁力架上~5min,直至溶液变澄清,小心弃除上清;7)将离心管保持在磁力架上,加入200μl80%乙醇,静置30s,弃除全部上清;8)重复步骤7),将磁珠用80%乙醇再洗1次,用10μl枪头将残留液体彻底吸干;9)干燥磁珠2-3min,待酒精挥发完全后,将pcr管移出磁力架,加入51μllow-edtate,吹打混匀,然后室温静置2min;10)将pcr管放置到磁力架上,室温静置,直到溶液变澄清,小心吸取50μl上清液至另一新的pcr管中备用;11)在产物中加入60ulagencourtampurexpbeads(1.2x),吹打混匀;12)重复以上步骤6)-8);13)干燥磁珠2-3min,待酒精挥发完全后,将pcr管移出磁力架,加入21μllow-edtate,吹打混匀,然后室温静置2min;14)将pcr管放置到磁力架上,室温静置,直到溶液变澄清,小心吸取20μl上清液至另一新的pcr管中备用。4.捕获及延伸使用预设的捕获探针库进行聚合酶链式反应,所选用酶可为dna聚合酶家族a的hotstarttaqdnapolymerase(neb,m0495)或dna聚合酶家族b的pfuturbocxhotstartdnapolymerase(agilent,600410)或kapahifihotstarturacil+readymixkit(kapa,kk2800),2.5xpcrbuffer中含有kcl(100mm),tmac(90mm),dmso(2.5%,v/v),formide(2.5%,v/v),tris-hcl(20mm),mgcl2(1.5mm)。1)按照表12中的体系配置预混液,冰上放置时间最好不要超过20min;表12:2)将pcr管置于pcr仪(热盖105℃)中,进行反应:94℃10min;94℃15s、72℃6min,3个循环;72℃10min;4℃保持。3)提前将agencourtampurexpbeads从2-8℃取出,静置平衡至室温,使用前涡旋或者震荡混匀;4)待延伸结束后,在产物中加入60μlagencourtampurexpbeads(1.2×),吹打混匀;5)室温静置5min,然后转移至磁力架上~5min,直至溶液变澄清,小心弃除上清;6)将离心管保持在磁力架上,加入200μl80%乙醇,静置30s,弃除全部上清;7)重复步骤6)将磁珠用80%乙醇再洗1次,用10μl枪头将残留液体彻底吸干;8)干燥磁珠2-3min,待酒精挥发完全后,将pcr管移出磁力架,加入21μllow-edtate,吹打混匀,然后室温静置2min;9)将pcr管放置到磁力架上,室温静置,直到溶液变澄清,小心吸取20μl上清液至另一新的pcr管中备用。5.文库扩增使用适用于二代测序平台的universalprimer与indexprimer进行扩增,所选用为高保真dna聚合酶(kapa,kk2631)。1)按照表13配制pcr反应体系。表13:注:*不同的样本应使用不同的pcrindexprimer进行样本标记,在操作pcrindexprimer时,一定要小心操作,避免样本与primer之间的交叉污染。2)使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底,放置到pcr仪中;3)按照如下程序进行pcr反应:98℃45s;98℃15s、60℃30s、72℃30s,13个循环;72℃1min;4℃保持;4)提前将agencourtampurexpbeads从2-8℃取出,静置平衡至室温,使用前涡旋或者震荡混匀;5)反应结束后,加入50μlagencourtampurexpbeads(1.0×)到pcr反应产物,吹打混匀;6)室温静置5min,然后转移至磁力架上~5min,直至溶液变澄清,小心弃除上清;7)将离心管保持在磁力架上,加入200μl80%乙醇,静置30s,弃除全部上清;8)重复步骤7),将磁珠用80%乙醇再洗1次,用10μl枪头将残留液体彻底吸干;9)干燥磁珠2-3min,待酒精挥发完全后,加入21μllow-edtate,吹打混匀;10)室温静置2min,磁力架上1min,直到溶液变澄清,小心吸取20μl文库至另一新的离心管中,-20℃留存备用。对回收产物进行qpcr定量后可以在二代测序平台上机测序。实验结果:humangdna甲基化捕获文库图如图7所示,捕获文库集中分布在250~450bp范围内;humangdna甲基化捕获片段在参考基因组上的分布如图8所示。图示捕获基因为otx1,该基因范围内设计的18条探针中的16条都有高深度的捕获。与常规杂交捕获方案相比,从样本处理至文库构建完成可节约6-8小时。结合本发明以上实施例,与现有技术中常规的重亚硫酸盐处理后再进行序列捕获或序列捕获后再进行重亚硫酸盐处理的方法相比,本发明方法对样品起始量要求低(最低50ng),重亚硫酸盐处理后信息丢失少,实验流程少耗时短。另外,本发明中的捕获探针设计方案与常规杂交捕获方案相比,从样本处理至文库构建完成可节约6-8小时,同时本发明不涉及探针杂交技术,所需探针数量少,探针总合成成本低,探针覆盖区域更加灵活,捕获率较高,应用范围更广泛。本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和改进,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的方案和这里示出与描述的图示示例。当前第1页1 2 3 

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips