首页 > 疾病防控/ 正文
深度解析医学证据,lxfs.net为你支撑决策
人类机体由种类繁多、功能各异的细胞与组织构成,其分化与稳态维持依赖于精确的蛋白质表达调控;因此解析人体蛋白质组的空间分布规律,是阐明发育机制、挖掘肿瘤治疗靶点的核心基础。尽管转录组数据库已为组织基因表达提供了初步注释,但mRNA丰度与蛋白质丰度之间仅存在中等程度的相关性,蛋白质才是执行生物学功能的主要分子。现有基于质谱的人类蛋白质组草图已鉴定约85%的基因产物,但研究重点多聚焦于30种主要组织,大量特殊或稀有组织的蛋白质组特征仍未被解析,同时缺少正常组织与肿瘤组织间的系统性对比分析,限制了对疾病相关分子网络失调的全面理解,也阻碍了基于组织特异性蛋白标志物的诊疗开发。
为填补上述空白,西湖大学郭天南、朱怡团队与上海交通大学李岩、哈尔滨医科大学季勇团队合作,通过数据非依赖性采集质谱技术(DIA-MS),在2,856份样本中对超13,000种蛋白质进行定量分析,构建了全景式人类蛋白质组图谱。该数据集涵盖58种主要组织类型、251种特定组织亚型以及25种不同癌种。依托这一研究数据,人们能够描绘不同组织类型和生理状态下(包括胎儿、肿瘤、癌旁非肿瘤及健康成人组织)的空间分辨蛋白质组轨迹,揭示发育过程和肿瘤进展机制。此外,跨不同组织类型和生理病理状态的定量蛋白质组比较,有助于预测药物带来的器官特异性毒性、识别可再利用的抗癌候选药物,并优先确定癌症的治疗靶点。该研究为探索人体发育、肿瘤演进及药物靶点发现提供了系统性资源。相关内容以“Spatial distribution of the proteome in the human body and in cancers”为题发表在Nature。
研究团队从9例成人遗体供体、8名健康受试者、9 例胎儿遗体供体及1,015名肿瘤患者中收集了2,856份生物样本,构建了包含15,332个蛋白组的人体质谱谱图库;经严格的质量控制,通过DIA-MS在3,005个质谱文件中最终定量到13,609种蛋白质,蛋白水平全局错误发现率控制至0.1%,重复样本重现性良好、批次效应微弱,数据整体质控可靠。
图1. 人类蛋白质组草图概述
t-SNE降维分析显示,胎儿组织(F)、肿瘤组织(T)、癌旁组织(NT)、健康成人组织(N)沿伪时间轴有序排布,反映出组织分化程度的梯度变化;脑、肝脏肿瘤与其配对癌旁组织聚类模式特殊,脱离整体分化梯度,表明了器官特异性蛋白调控特征。进一步对所有样本进行无监督聚类,识别出8个具有连贯表达模式的蛋白质模块,其中模块3呈F–T–NT–N递减趋势,富集RNA剪接通路,在器官发育与肿瘤发生中发挥关键作用;模块8呈上升趋势,富集体液免疫应答通路,提示胎儿与肿瘤样本中体液免疫存在抑制或发育不全特征。
图2. 蛋白质组转化在组织发育和致癌中的作用
为精确描述蛋白质的组织分布特征,研究团队按照人类蛋白质图谱(HPA)将全部蛋白分为未检出、组织富集、聚类富集、泛组织表达、组织增强、混合表达6类。脑组织含有最多组织富集蛋白,晶状体组织富集蛋白总丰度占比最高。生理同源组织(脑、脊髓、外周神经)蛋白模式高度相似,乳腺因供体年龄相关退化,与骨、软骨等结缔组织聚类;气管因上皮腺体富集,与唾液腺聚集。
研究团队共鉴定了1,717种组织富集蛋白,其中749种在既往蛋白质组、转录组研究中已有报道。相较(HPA)数据库,研究新发现832个组织富集蛋白,在以往样本稀缺的24类组织中鉴定出480个特异性蛋白,并验证了PANX3为耳蜗高富集蛋白。功能富集分析显示,组织富集蛋白与组织特有功能高度吻合,如肝中代谢相关蛋白、脑中突触传递相关蛋白等
图3. 蛋白质和药物靶点的组织特异性。
接下来,研究团队将组织富集蛋白与DrugBank药物靶点进行系统映射,在34种组织中筛选出402个可作为药物靶点的蛋白,对应2,598种药物。肝脏中所含组织富集药物靶点最多,这可能解释了药物性肝损伤的高发性。以CYP2C8为例,该酶在肝脏高度富集,被302种药物靶向,其抑制剂吉非罗齐与经该酶代谢的药物联用可导致血药浓度急剧升高,引发横纹肌溶解、急性肾损伤或严重低血糖,且肝细胞的代谢负担进一步加剧毒性循环。此外,三氯生靶向甲状腺过氧化物酶(甲状腺富集蛋白),其暴露与甲状腺自身免疫紊乱及激素水平异常相关。
基于配对肿瘤和癌旁样本,研究团队构建了涵盖25种癌症类型的泛癌蛋白质组图谱,通过线性混合模型对样本进行分析,鉴定出8,940个差异表达蛋白(DEP),结肠癌、直肠癌和睾丸癌DEP数量最多,33个DEP在超20种癌症中上调。2,878个DEP为单一肿瘤特异性,肝细胞癌特异性DEP最多,多数为下调且富集于代谢通路;其次是弥漫性大B细胞淋巴瘤和胃肠道间质瘤(GIST),GIST特异性上调蛋白富集于突触信号通路。
研究团队进一步筛选了131个局部富集DEP,即在正常组织中呈组织富集但在相应肿瘤中出现特异性变化的蛋白,特异性下调的蛋白多反映组织功能的丧失(如小肠GIST中RBP2和PLS1下调等),上调蛋白(如睾丸癌中的TSPY2)提示增殖程序激活。交叉验证显示,共识别出4,263个上调、1,716个下调DEP;7,336种蛋白与16类肿瘤临床预后相关,PLOD2在13种肿瘤中上调,可作为预后标志物与治疗靶点。
图4. 肿瘤特异性蛋白特征
最后,研究团队系统展示了所建蛋白质组数据资源在抗癌药物靶点优先排序中的三大应用方向。
首先,通过分析在多个癌型中共同上调的77个DEP,发现TROP2/TOP1和PARP1在子宫内膜癌(ENCA)与乳腺癌/卵巢癌中共上调,提示Trodelvy和奥拉帕利在ENCA中具有再利用潜力,为老药新用提供分子证据。其次,整合细胞系药物敏感性、CRISPR基因必要性数据及上调DEP,筛选出9个蛋白对应35种药物,锁定MET和BCL2L1作为结直肠癌和直肠癌的候选靶点,其中MET蛋白水平与CRISPR依赖性正相关,支持其治疗有效性。最后,为降低脱靶毒性,研究筛选出41种位于质膜上的独特肿瘤富集蛋白,其中几种已被临床批准的ADC药物靶向(如CD79B),也包含TYROBP、KIT和PAX5等全新潜在标志物,可作为抗体偶联药物开发的优选方向。
图5. 潜在药物靶点及药物再利用
总之,该研究构建了目前覆盖范围最广、空间分辨率最高的人类蛋白质组参考图谱,跨越发育、稳态和癌变等多重生理病理状态,为系统理解人体蛋白质组织分布规律和肿瘤蛋白质组重塑提供了公共数据资源。通过统一平台和标准化流程生成的定量数据,有效消除了跨研究批次效应,使得跨组织、跨癌种的比较分析更为可靠。该资源不仅揭示了药物靶点组织分布与器官毒性之间的分子关联,还为药物重定位和新靶点发现提供了可操作的数据整合策略。
参考文献:
https://www.nature.com/articles/s41586-026-10660-y
小提示:本篇资讯仅在梅斯医学APP中开放阅读,请扫描二维码直接下载APP