首页 > 医疗资讯/ 正文
癌症是一种复杂疾病,从正常组织到癌组织的转化涉及复杂的基因调控变化。研究癌症的起源细胞对于理解肿瘤发生至关重要,有助于改善癌症预防、早期检测、风险分层和靶向治疗。遗传数据为追踪人类癌症的起源细胞提供了一种更为可靠的手段。目前,转录组学、基因组学和表观基因组学等方法已成为追踪人类癌症起源的有力工具,同时机器学习方法也可根据组织来源分类各种癌症类型。虽然这些方法以及其他方法已经利用单细胞转录组学数据来推断若干癌症类型的起源细胞,但尚未扩展到泛癌水平。
近年来,高通量单细胞染色质可及性测序(scATAC-seq)发展迅速,已被用于绘制数百种细胞类型的染色质可及性图谱。如果将这些数据与大量公开可用的全基因组测序(WGS)数据结合,可以极大地提高不同癌症起源细胞预测的分辨率和规模。
基于此,美国西奈山伊坎医学院和萨格勒布大学研究团队整合了一个大规模WGS和scATAC-seq数据集,并开发了一个新的机器学习模型SCOOP,以高稳健性、高准确度地预测泛癌起源细胞。研究显示,SCOOP准确预测了37种癌症亚型的起源细胞,确认了许多癌症已知的解剖学和细胞起源,且精确到细胞分辨率水平。值得关注的是,SCOOP挑战了长期以来小细胞肺癌(SCLC)主要源自神经内分泌细胞的理论,分析显示其主要起源细胞是基底细胞。此外,SCOOP还分析了不同组织学亚型在癌症发展过程中的不同细胞轨迹,并将一种类似化生的胃杯状细胞鉴定为五种不同胃肠道癌症的起源细胞,对癌症预防、早期检测和治疗分层具有重要意义。
主要研究内容
研究团队整合的大规模数据集涵盖了3,669个WGS患者样本数据,涉及37种癌症,以及32种成人组织类型和15种胎儿组织类型的559个scATAC-seq细胞图谱。研究人员从WGS数据中提取了体细胞单核苷酸变异(SNV)信息,将突变数和scATAC-seq的染色质开放信号生成标准化的输入特征;使用 XGBoost算法构建机器学习模型SCOOP,利用不同正常细胞亚群的scATAC-seq图谱来预测特定癌症类型的基因组突变。
图1.SCOOP工作流程。
研究团队利用SCOOP预测了8种已知癌症类型组织水平的起源细胞,且细胞分辨率和准确性更高(图2)。有趣的是,SCOOP发现肝母细胞(一类肝前体细胞(HPC))可能是肝细胞癌(HCC)的主要起源细胞。对于肺腺癌(LUAD)和肺鳞状细胞癌(LUSC),SCOOP精确定位了参与肿瘤发生的特定细胞类型:肺AT2细胞和肺基底细胞,比组织水平预测的分辨率和准确性更高。
图2.SCOOP预测8种癌症类型的起源细胞。
随后,研究团队利用SCOOP对肺癌进行了深入分析,其中包括此前研究较少的2种亚型:胸膜间皮瘤(PM)和SCLC,并整合了胎儿肺scATAC-seq数据集。在运行100次后,SCOOP准确且稳健地预测了LUAD和LUSC的起源细胞分别是AT2细胞和基底细胞,证实了SCOOP预测的可重复性。同时,SCOOP预测上皮样PM的起源细胞为间皮细胞,与间皮肿瘤发生模型分析结果一致。值得注意的是,SCOOP预测SCLC起源细胞为基底细胞这一结果,挑战了普遍的理论,即SCLC主要来源于肺神经内分泌细胞(PNECs)。这一发现得到了另一项利用多种基因工程小鼠模型的里程碑式研究支持,该研究表明SCLC的一种亚型起源于基底细胞而非PNECs,并指出其他SCLC亚型状态也可能具有基底起源细胞。
图3.SCOOP预测不同肺癌亚型的起源细胞。
研究团队在肠道和造血再生谱系中分析了SCOOP预测起源细胞的能力,重点关注了微卫星稳定型(MSS)结直肠癌(CRC)、慢性淋巴细胞白血病(CLL)和急性髓系白血病(AML)。结果显示,SCOOP在仅使用正常肠道scATAC-seq数据训练时,以及在使用跨组织的正常细胞亚群训练时,也识别出结肠干细胞为MSS CRC的起源细胞。在CLL和AML中,SCOOP预测骨髓B细胞为CLL的起源细胞,预测多能髓系祖细胞为AML的起源细胞。SCOOP对AML预测的稳健性,在另一独立骨髓scATAC-seq数据中得到证实。综上,SCOOP在MSS CRC和CLL的起源细胞预测中实现了细胞亚群分辨率,并强调了多能髓系祖细胞在AML发生中的作用。
图4.SCOOP可以精确定位可能产生不同肿瘤的细胞亚群。
除了细胞亚群分辨率之外,SCOOP还能识别出具有不同起源细胞的组织学癌症亚型。例如在三种肾透明细胞癌(RCC)亚型:透明细胞RCC(ccRCC)、乳头状RCC(pRCC)和嗜酸性RCC(chRCC)中,SCOOP预测近曲小管祖细胞样(PTPL)细胞为ccRCC和pRCC的起源细胞,预测远曲小管的集合管、内嵌细胞类型A(ICA)为chRCC的起源细胞。同时,在胰腺癌中,SCOOP同样展示了其起源细胞预测的细胞亚群分辨率。此外,该研究还发现杯状细胞是肠化生和几种癌症类型(MSI CRC、胆道、食管癌和胃腺癌)体细胞突变的最具预测性的表观基因组特征。
图5.不同组织学癌症类型的起源细胞预测。
在跨37种癌症类型的泛癌起源细胞预测中,SCOOP表现优于两种相关性分析方法,其在31个预测中30个正确,而Spearman和Pearson相关系数分别为26个正确、13个正确。此外,研究未发现SCOOP预测的异质性与WGS数据异质性之间存在显著关联。在来自临床蛋白组肿瘤分析联盟的独立WGS数据中,SCOOP重现了对所有5种癌症(LUAD、LUSC、GBM、RCC、PDAC)的原始预测。此外,研究还利用来自法国、日本、美国的三个独立队列WGS数据作为额外验证,证实了SCOOP预测起源细胞的准确性和高可重复性。
图6.37种癌症类型的泛癌起源细胞预测。
结 语
该研究结合机器学习、WGS和scATAC-seq数据,建立了一种具有成本效益和可扩展的方法准确预测了37种人类癌症亚型的细胞起源,为分析癌症发生发展提供了较高的分辨率。SCOOP确定了癌前起源细胞,其染色质可及性更好地解释了癌症累积的体细胞突变,对癌症预防和早期检测筛查具有重要意义。
原文信息:
Bairakdar, M.D., Lee, W., Giotti, B. et al. Learning the cellular origins across cancers using single-cell chromatin landscapes. Nat Commun 16, 8301 (2025). https://doi.org/10.1038/s41467-025-63957-3
- 搜索
-
- 1000℃李寰:先心病肺动脉高压能根治吗?
- 1000℃除了吃药,骨质疏松还能如何治疗?
- 1000℃抱孩子谁不会呢?保护脊柱的抱孩子姿势了解一下
- 1000℃妇科检查有哪些项目?
- 1000℃妇科检查前应做哪些准备?
- 1000℃女性莫名烦躁—不好惹的黄体期
- 1000℃会影响患者智力的癫痫病
- 1000℃治女性盆腔炎的费用是多少?
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)