一种量化TIME浸润模式的评分方法与流程
本发明涉及一种量化time浸润模式的评分方法。
背景技术:
肝细胞癌(肝细胞癌)是原发性肝癌的主要组织学类型,具有较高的发病率和死亡率,虽然肝细胞癌有多种治疗方式,包括手术切除、化疗、射频消融、肝移植等,但复发率和预后仍不理想。近来,免疫治疗作为一种新的治疗方法在肝细胞癌中取得了很大的进展,但到目前为止,只有一部分患者受益,对肿瘤免疫微环境(time)的认识不足可能是导致结果令人失望的主要原因,在个体水平上,肝细胞癌具有显著的time异质性,全面了解此异质性对临床诊断、个体化治疗和预后预测至关重要。
肝细胞癌是一种典型的炎症驱动型肿瘤,主要起源于病毒感染和肝纤维化,从慢性肝炎到肝细胞癌的转变过程中,随着肝脏局部免疫细胞的浸润,其局部肿瘤免疫微环境发生变化,免疫细胞是time的主要组成部分,其数量和状态对肿瘤的发展、侵袭和转移的进程起着重要作用。过去的研究主要集中在一种或几种免疫细胞类型上,但由于不同细胞之间密集的细胞相互作用,过去的研究方法可能会造成对time的认识出现偏差,故应将time视为一个整体。虽然已经有两项研究基于广谱免疫细胞分析了肝癌的异质性,但样本量太少,无法取得一致的结果。
技术实现要素:
本发明的目的在于提供一种量化time浸润模式的评分方法,以解决上述背景技术中提出的样本量太少,无法取得一致的结果等问题。
为实现上述目的,本发明提供如下技术方案:1.一种量化time浸润模式的评分方法,其特征在于:本发明包含以下步骤:(1)数据收集和处理:建模集的数据来源于geo数据库的肝细胞癌芯片数据集;
(2)免疫细胞浸润评估:1)使用一组基因而不是单个基因代表一个免疫亚群,因为使用单个基因作为免疫亚群的标志物可能会产生误导,因为许多基因在不同的细胞类型中表达;2)评估一组基因相对于样本中所有其他基因的相对表达变化;
(3)肿瘤免疫原性指数的收集和分析;
(4)免疫治疗队列的收集;
5)免疫治疗的生物标记物。
优选的,数据收集和处理按照下列标准进行筛选:1)只来自于affymetrix平台,2)原发性肝癌患者,3)未治疗患者,4)患者数量≥50,5)含有超过12000个,蛋白编码基因,最终得到14个符合条件的芯片数据集gse102079,gse107170,gse112790,gse116174,gse121248,gse14323,nci(nationalcancerinstitute)cohort(gse14520),gse25097,gse45436,gse62232,gse63898,gse64041,gse76297,gse84005andgse9843。
优选的,免疫细胞浸润评估,元基因是一种鲁棒性方法的原因主要包括两个方面:(1)用一个基因集代替单个基因去代表一个免疫亚群,由于许多基因被表达在不同的细胞类型,仅用一个基因作为一个免疫亚群的标志会产生误导,(2)在一个样本内,一个基因集表达量的相对变化评估与所有其他基因的表达相关,我们纳入了代表24种不同的免疫亚群的元基因:固有免疫细胞(树突状细胞,未成熟的树突状细胞,激活的树突状细胞,浆细胞样树突状细胞,嗜酸性粒细胞,肥大细胞,巨噬细胞,自然杀伤细胞,cd56dim自然杀伤细胞,cd56bright自然杀伤细胞和中性粒细胞)和适应性免疫细胞(b细胞,t细胞,th细胞、tgd(tgammadelta)细胞、th1细胞、th2细胞、th17细胞、treg细胞、cd8+t细胞、tcm(tcentralmemory)细胞、效应记忆t细胞、滤泡辅助性t细胞和细胞毒性细胞);此外,为确保ssgsea结果的合理性和鲁棒性,我们应用另外两种不同的算法进行了验证,第一种是cibersort,指一种反卷积算法,将一个参考基因集的表达值作为每种细胞类型的最小代表,进而基于这些表达值,通过支持向量回归法评估22种免疫细胞类型的比例,另外一种是mcp-counter,通过考虑在一个特定细胞类型内基因表达水平的变化,并保留其中变化最小的基因进而评估8种免疫细胞的含量。
优选的,肿瘤免疫原性指数的收集和分析,肿瘤突变负担以目标区域每兆碱基的编码、体细胞、碱基替换和indel突变的数量来衡量。根据用optitype,从rna-seq中获得的hla类型,通过netmhcpanv3.0识别snv或indel新抗原。非整倍体得分为扩增或删除的染色体臂之和,同源重组缺陷得分由三个独立的基于dna的基因组不稳定性测量方法确定:大的(>15mb)非臂级区域的杂合性缺失、端粒等位基因不平衡和相邻片段之间断裂>10mb的大规模状态转换,利用工具mantis(1.0.3版),进行微卫星不稳定性(microsatelliteinstability)检测,使用mitcrv1.0.3与前人描述的参数确定tcr多样性评分,免疫球蛋白重链(lgh)多样性评分由rsem1.2.21版根据通过vdjer工具重建的lgh进行量化。对于两种病毒(hbv和hcv),每百万标准读取分值定义为106倍的样本总读数的命中数。癌症/睾丸抗原也参与其中,抗原处理和呈递机制评分(aps)由gsva根据18个apm相关基因生成。
优选的,免疫治疗队列的收集,根据筛选标准纳入6个黑色素瘤队列:a)样本数量≥15个;b)患者有相应的基因表达数据和免疫治疗的预后信息,gide等分析了41例使用抗pd-1抗体治疗的黑色素瘤样本和32例同时使用抗pd-1和抗ctla4抗体治疗的患者,riaz黑色素瘤数据集由25名接受抗pd-1抗体治疗的黑色素瘤患者组成,liu黑色素瘤数据集由74例接受抗pd-1抗体治疗的患者组成[21],nathanson黑色素瘤数据集由15例抗ctla4抗体的患者组成,lauss黑色素瘤数据集中,有25例患者接受了抗act抗体治疗。
优选的,免疫治疗的生物标记物,(1)cd274、pdcd1和ctla4是fda批准的免疫治疗靶点[24],本研究以上述3个生物标志物为自变量进行roc验证;
(2)cd8由cd8a和cd8b的基因表达水平估算;
(3)tmb指非同义突变的总量,7个黑色素瘤队列均提供了突变谱;
(4)t细胞受体cdr3序列的β链克隆性采用mixcr算法获得,b细胞受体序列的免疫球蛋白重链克隆性由rna-seq读数组装而成,t细胞克隆性和b细胞克隆性的预测值均由(p_i:各受体序列的频率)计算;
(5)tide预测值按照原出版物中的程序计算;
(6)微卫星不稳定性在网站上,根据stad的基因表达谱,通过脊回归模型预测并评估msi情况;
(7)aps通过18个与抗原处理和呈递机制相关的基因富集程度进行量化[17];
(8)cyt通过颗粒酶a和穿孔素表达转录水平的几何平均值来评估。
具体实施方式
通过以上具体实施方式,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据以上实施方式,本发明提供一种技术方案:1.一种量化time浸润模式的评分方法,其特征在于:本发明包含以下步骤:(1)数据收集和处理:建模集的数据来源于geo数据库的肝细胞癌芯片数据集;
(2)免疫细胞浸润评估:1)使用一组基因而不是单个基因代表一个免疫亚群,因为使用单个基因作为免疫亚群的标志物可能会产生误导,因为许多基因在不同的细胞类型中表达;2)评估一组基因相对于样本中所有其他基因的相对表达变化;
(3)肿瘤免疫原性指数的收集和分析;
(4)免疫治疗队列的收集;
(5)免疫治疗的生物标记物。
数据收集和处理按照下列标准进行筛选:1)只来自于affymetrix平台,2)原发性肝癌患者,3)未治疗患者,4)患者数量≥50,5)含有超过12000个,蛋白编码基因,最终得到14个符合条件的芯片数据集gse102079,gse107170,gse112790,gse116174,gse121248,gse14323,nci(nationalcancerinstitute)cohort(gse14520),gse25097,gse45436,gse62232,gse63898,gse64041,gse76297,gse84005andgse9843。
免疫细胞浸润评估,元基因是一种鲁棒性方法的原因主要包括两个方面:(1)用一个基因集代替单个基因去代表一个免疫亚群,由于许多基因被表达在不同的细胞类型,仅用一个基因作为一个免疫亚群的标志会产生误导,(2)在一个样本内,一个基因集表达量的相对变化评估与所有其他基因的表达相关,我们纳入了代表24种不同的免疫亚群的元基因:固有免疫细胞(树突状细胞,未成熟的树突状细胞,激活的树突状细胞,浆细胞样树突状细胞,嗜酸性粒细胞,肥大细胞,巨噬细胞,自然杀伤细胞,cd56dim自然杀伤细胞,cd56bright自然杀伤细胞和中性粒细胞)和适应性免疫细胞(b细胞,t细胞,th细胞、tgd(tgammadelta)细胞、th1细胞、th2细胞、th17细胞、treg细胞、cd8+t细胞、tcm(tcentralmemory)细胞、效应记忆t细胞、滤泡辅助性t细胞和细胞毒性细胞);此外,为确保ssgsea结果的合理性和鲁棒性,我们应用另外两种不同的算法进行了验证,第一种是cibersort,指一种反卷积算法,将一个参考基因集的表达值作为每种细胞类型的最小代表,进而基于这些表达值,通过支持向量回归法评估22种免疫细胞类型的比例,另外一种是mcp-counter,通过考虑在一个特定细胞类型内基因表达水平的变化,并保留其中变化最小的基因进而评估8种免疫细胞的含量。
肿瘤免疫原性指数的收集和分析,肿瘤突变负担以目标区域每兆碱基的编码、体细胞、碱基替换和indel突变的数量来衡量。根据用optitype,从rna-seq中获得的hla类型,通过netmhcpanv3.0识别snv或indel新抗原。非整倍体得分为扩增或删除的染色体臂之和,同源重组缺陷得分由三个独立的基于dna的基因组不稳定性测量方法确定:大的(>15mb)非臂级区域的杂合性缺失、端粒等位基因不平衡和相邻片段之间断裂>10mb的大规模状态转换,利用工具mantis(1.0.3版),进行微卫星不稳定性(microsatelliteinstability)检测,使用mitcrv1.0.3与前人描述的参数确定tcr多样性评分,免疫球蛋白重链(lgh)多样性评分由rsem1.2.21版根据通过vdjer工具重建的lgh进行量化。对于两种病毒(hbv和hcv),每百万标准读取分值定义为106倍的样本总读数的命中数。癌症/睾丸抗原也参与其中,抗原处理和呈递机制评分(aps)由gsva根据18个apm相关基因生成。
免疫治疗队列的收集,根据筛选标准纳入6个黑色素瘤队列:a)样本数量≥15个;b)患者有相应的基因表达数据和免疫治疗的预后信息,gide等分析了41例使用抗pd-1抗体治疗的黑色素瘤样本和32例同时使用抗pd-1和抗ctla4抗体治疗的患者,riaz黑色素瘤数据集由25名接受抗pd-1抗体治疗的黑色素瘤患者组成,liu黑色素瘤数据集由74例接受抗pd-1抗体治疗的患者组成[21],nathanson黑色素瘤数据集由15例抗ctla4抗体的患者组成,lauss黑色素瘤数据集中,有25例患者接受了抗act抗体治疗。
免疫治疗的生物标记物,(1)cd274、pdcd1和ctla4是fda批准的免疫治疗靶点,本研究以上述3个生物标志物为自变量进行roc验证;
(2)cd8由cd8a和cd8b的基因表达水平估算;
(3)tmb指非同义突变的总量,7个黑色素瘤队列均提供了突变谱;
(4)t细胞受体cdr3序列的β链克隆性采用mixcr算法获得,b细胞受体序列的免疫球蛋白重链克隆性由rna-seq读数组装而成,t细胞克隆性和b细胞克隆性的预测值均由(p_i:各受体序列的频率)计算;
(5)tide预测值按照原出版物中的程序计算;
(6)微卫星不稳定性在网站上,根据stad的基因表达谱,通过脊回归模型预测并评估msi情况;
(7)aps通过18个与抗原处理和呈递机制相关的基因富集程度进行量化[17];
(8)cyt通过颗粒酶a和穿孔素表达转录水平的几何平均值来评估。
有益效果
通过研究揭示了肝细胞癌中具有不同的临床结果和免疫逃逸机制的三种异质性time表型。特定的基因组事件可能驱动不同表型的形成,并解释了不同表型对免疫治疗敏感或耐药的潜在原因。ti可以提高我们对肝细胞癌免疫浸润模式的理解,进一步指导个体化治疗策略。
本发明的工作原理及使用流程:尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除