09-30 08:21 阅读 88

如何突破生信分析固有套路？这篇1区8分+文章给你答案

今天小编解读的这篇文章是2021年发表在Briefings in Bioinformatics（IF:8.990）上，题目为Machine learning revealed stemness features and a novel stemness-based classification with appealing implications indiscriminating the prognosis, immunotherapy and temozolomide responses of 906 glioblastoma patients.

本研究根据干性指标将GBM患者分为两个不同的亚型，并预测了对具有不同亚型的免疫疗法的患者的反应，提供了一种可能的方法来筛选未来用于免疫疗法的患者。

摘要

胶质母细胞瘤（GBM）是最恶性和致命的颅内颅瘤，治疗方法极为有限。免疫疗法已在GBM中得到了广泛的研究，但没有能够显著延长未经选择的患者的总生存期（OS）。考虑到胶质母细胞瘤干细胞的作用是不可忽视的，作者基于干细胞对GBM筛选出对免疫治疗反应更好的某些特定人群。基于TCGA数据库和多能干细胞的转录组，使用一类逻辑回归算法来计算518个GBM患者的干性指标（mRNAsi）。基于干细胞特征，GBM患者通过一致性聚类分为两种亚型，而干细胞子类型I的患者比干细胞子类型II有更好的OS，但PFS更差。在干细胞亚型I中有着更高的体细胞突变和拷贝数变异负荷。另外，两个干细胞亚型有着不同的肿瘤免疫微环境图谱。进一步证实的I型亚型患者可能对免疫疗法有反应，尤其是抗PD1治疗。pRRophetic算法也表明患者在干细胞I亚型中对替莫唑胺治疗的耐药性更高。最后，使用多种机器学习算法来开发7个基因的干细胞子类型预测因子，并在两个外部独立的GBM队列中进一步对其进行了验证。这种新颖性的分类可以改善GBM的预测指标，并可以指导医生选择潜在的反应者以首选免疫疗法。

流程图

结果简述

1. 干性指数与临床特征之间的关联

本文通过使用一类逻辑回归算法，计算了518个GBM患者的干性指数，并从低到高进行了排序，以探索干性指数在临床特征之间的联系。如下图A和C所示。

如下图B所示，年龄小于40岁的患者的干性得分比老年患者显著高，而干性指数的得分在40–59,60–79和≥80组间没有显著差异。就TCGA分子亚型而言，proneural亚型具有最高的干性得分，其次是neural, classical和mesenchymal亚型。另外，进展期，神经胶质瘤CpG甲基化表型状态和MGMT启动子甲基化的患者表现出显著较高的干性得分。结合体细胞突变数据，作者发现干性得分和TMB之间无显著相关性。并且，干性指数在PTEN突变型样本中明显低于PTEN野生型样本（P = 0.037），而在TP53突变样本（P <0.001），IDH突变样本（P = 0.004）和ATRX突变样本（P <0.001）中显著更高，如下图D所示。

2. 干性指数与TIME模式之间的关联

首先，通过应用无监督聚类，使用ssGSEA得到29种免疫特征的得分，代表GBM的免疫活性，通过使用无监督聚类，将518个GBM患者分为三种免疫亚型。高免疫组包括21个患者，定义为免疫hot肿瘤，具有最高的富集分数。低免疫组，包含265个患者，定义为免疫cold肿瘤，具有最低的富集分数。中度免疫组包含232名患者，定义为免疫Altered肿瘤，表明可在hot和cold间转换，如下图A所示。然后，通过ESTIMATE和CIBERSORT算法评估免疫浸润模式。干性指数与免疫，基质和ESTIMATE分数显著负相关，表明免疫和基质细胞的浸润水平随GBM的干性指数的升高而降低，如下图B所示。但是，未观察到干性得分与肿瘤纯度之间的显著相关性。另外，免疫和基质得分在高免疫肿瘤中显著更高，暗示出免疫细胞和基质细胞的高丰度，如下图C所示。相反，从高免疫组到低免疫组，干性指数增加，肿瘤纯度增加。然后，通过CIBERSORT算法量化了22种免疫细胞的丰度，如下图D所示。干细胞指数与T细胞亚群，幼稚CD4 T细胞和记忆激活的CD4 T细胞，NK细胞，记忆B细胞和浆细胞显著正相关。同时，干细胞指数与M2巨噬细胞和单核细胞显著负相关，如下图E所示。

3. GBM患者中干性得分与OS和PFS的关系

根据干性指数的中值，将518个GBM患者分为高和低组。K-M分析表明，高mRNA组表现出更好的OS和较差的PFS，如下图A和B所示。考虑到高和低组之间的预后差异，作者进一步进行了两组之间的差异表达分析。确定了130个DEG，包括高干性组中的41个上调基因和89个下调基因，如下图C所示，功能富集分析结果如下图D所示。此外，130个DEG中有35个突变频率> 1％，并且大多数都在高干性组中下调，如下图E所示。与低干性组相比，两组之间的拷贝数差异分析表明，高干性组中40个基因显著扩增，82个基因缺失显著缺失，如下图F所示。

4. 识别出具有不同的生存结局，功能注释和临床特征的两种干性亚型

根据CDF曲线下该区域的其他相对变化，将无监督的聚类分析用于基于130个DEG的表达模式的GBM患者分类，将聚类算法的最佳数目确定为2，如下图A，B，C所示。因此，将所有GBM患者分为两类，其中Stemness亚型I类有233名患者，Stemness亚型II类有285名患者，如下图D所示。K-M生存分析表明，与Stemness亚型II组相比，Stemness亚型I组的GBM患者表现出明显更好的OS和较差的PFS，如下图E，F所示。另外，GSVA分析探索了与GBM的干性亚型相关的分子通路和潜在机制。共识别了36种差异富集的分子通路，包括与Stemness子类型I正相关的4条通路和与Stemness子类型II正相关的32条通路，如下图G所示。

随后，作者比较了Stemness亚型I和II组的GBM患者的人口统计学和临床病理特征。如下图A所示，Stemness亚组I型患者的诊断显著较Stemness亚型II组的患者年轻。Stemness亚型I型TCGA分子亚型的组成与Stemness亚型 II型也明显不同。Stemness I型的患者的严重性指数显著高于Stemness II型的患者。这表明，I型干细胞亚型患者的肿瘤干细胞水平较高，这表明较差的PFS可能具有更强的自我更新，分化和增殖的潜能，并可能促进肿瘤细胞的增殖。

5. 干性亚型I型有着更高的CNA负荷及肿瘤突变负荷

作者进行CNA分析和体细胞突变分析，以探索不同干性亚型的独特基因组变异。具有Stemness子型I的患者，有着更高的拷贝数扩增和缺失，如下图B所示。体细胞突变分析表明，每个亚型都具有特定的突变基因，如下图C，D所示。另外，分析发现，Stemness子类型I组的IDH和ATRX的突变频率明显更高，两种亚型之间的BRAF，PTEN，EGFR和TERT突变频率没有发现显著差异，如下图E所示。

6. 干性亚型有着不同的免疫微环境和免疫基因组模式

首先，ESTIMATE算法揭示了两种干性亚型的免疫微环境。与Stemness子类型II相比，Stemness子类型I的免疫，基质和ESTIMATE分数显著降低，肿瘤纯度更高，这表明Stemness子类型I免疫和基质细胞的丰度较低，如下图A所示。然后，CIBERSORT被用于量化GBM中免疫浸润丰度。在Stemness子类型II中，大多数CD4 +和CD8 + T细胞亚群，NK细胞，单核细胞，巨噬细胞和中性粒细胞更加丰富，但是，浆细胞，卵泡辅助细胞，静息树突状细胞和静息肥大细胞在I型干细胞中显著富集，如下图B所示。关于GBM的免疫分类，Stemness子类型I由更多比例的中，高免疫性肿瘤组成，而Stemness子类型II主要包含低免疫性肿瘤，如下图C所示。这些有趣的发现表明，Stemness亚型I的免疫浸润水平相对较低，肿瘤纯度较高，但也具有较高的免疫力。

7. 干性亚型I对免疫疗法更敏感，但对TMZ耐药

PD1 / PD-L1 / PD-L2和CTLA / CD80 / CD86的表达水平与两种干性亚型完全相反，如下图D所示。如下图E所示，Stemness亚型I组的免疫疗法应答比例是Stemness亚型II组的两倍以上。相对于无反应者，对免疫疗法的反应中，干性指数显著更高，如下图F所示。然后，作者发现，Stemness亚型I组的患者对抗PD1治疗更敏感，而Stemness亚型II患者对抗CTLA4治疗更敏感，如下图G所示。由于TMZ治疗是GBM术后的标准化学疗法，因此，作者基于GDSC数据库，通过使用pRRophetic评估了两种亚型对TMZ的反应，表明具有Stemness亚型I的GBM患者比具有Stemness亚型II的患者对TMZ治疗的耐药性更高，如下图H所示。

8. 识别针对两种干性亚型的潜在化合物

进行了CMap分析，以探索针对GBM的每个重要性亚型。在CMap数据库中考虑了41个在Stemness子类型I中高表达基因和在Stemness子类型II中的89个高表达基因作为潜在靶标。MoA分析揭示了干性 I亚型34化合物靶向的24条分子通路和Stemness II亚型76化合物靶向的63条通路。

9. 干性亚型预测变量的构建和验证

首先，在训练集中，通过基于130个DEG的表达水平，采用四种机器学习算法来确定干性亚型相关特征。分别通过LASSO，RFB，SVM和XGB分析确定了43、112、30和71个基因。ROC曲线分析表明，四种机器学习算法在功能选择方面具有出色的性能，训练集的AUC为1.00，测试集的AUC> 0.95，如下图A所示。韦恩图确定了四个特征选择算法所得到的七个关键基因，如下图B所示。在训练集中，AUC为0.9889，敏感性为94.86％，特异性为97.51％，准确度为96.28％，此外，Stemness子类型预测因子在区分测试的干性子类型方面也具有出色的性能，AUC为0.9599，灵敏度为91.38％，特异性为94.05％，准确性为92.96％，如下图C所示。

10. 在两个独立队列中基因干性指数分类的临床应用

作者在CGGA数据库中使用两个独立的GBM队列，探讨了不同患者中基于新颖性的分类的临床应用价值。通过应用干性分类，作者计算了每个患者的干性分数，然后根据诊断预测值的临界值和七个关键基因的表达谱将患者分为两组。CGGA队列由Stemness子类型I和Stemness子类型II患者组成，如下图D所示。而PUMCH队列包含28例Stemness I型患者和10例Stemness II型患者，如下图F所示。K-M生存分析表明，CGGA和PUMCH GBM队列中表现出Stemness亚型I的患者表现出明显更好的OS和较差的PFS，如下图E和G所示，这与TCGA的结果一致。

免疫治疗在GBM中具有很大的潜力，目前正在筛查可能受益于免疫治疗的患者是一项重要的任务。本研究根据将GBM患者分为两个不同的亚型，并预测了对具有不同亚型的免疫疗法的患者的反应，提供了一种可能的方法来筛选未来用于免疫疗法的患者。

优缺点

新颖的干性指数分类可以为GBM提供有希望的预测指标，可以指导医师选择潜在的免疫应答者作为免疫检查点抑制剂的首选。该研究也存在一些局限性。首先，当验证有效的临床研究时，仅包括来自PUMCH的具有完整临床和病理学数据的38位患者，这些患者的样本量较小。其次，目前正在接受免疫疗法的患者非常有限，可能还需要进一步验证有效性。

作者:WOSCI沃斯编辑

原文链接:https://www.jianshu.com/p/ff7e08ed4801