News

News

Bioinformatics | 课题组建立个体化跨组织转录组推测方法

       基因表达谱在不同组织中作为基因型和表型间的分子媒介,反映了个体全身的生理和病理状态。解析组织的基因表达谱对揭示生物学机制和识别疾病机理及潜在治疗靶点至关重要。由于组织活检样本的获取难度大、风险高、连续重复采样困难,通过新的计算方法实现由易于获得的“替代”样本(如血液)来预测特定个体的组织特异性基因表达谱,对组织转录组的科学研究和个性化医疗具有重要价值。

       2023年6月5日,北京大学基础医学院杨恩策课题组在 Bioinformatics 发表题为 MTM: a multi-task learning framework to predict individualized tissue gene expression profiles 的论文。文章建立了基于深度多任务学习的跨组织转录组推测方法 MTM,利用来自 944 名个体 49 种组织类型的 17,325 例组织样本进行训练,实现了由任意组织的基因表达谱推测对应该个体其他组织的基因表达谱。

f20fa222d89f4f90bd0b6c6a37da5639.png

       在该工作中,研究人员首先设计基于深度多任务学习的跨组织转录组推测方法 MTM,并通过 GTEx 数据库的944 名个体 49 种组织类型的 17,325 例组织样本进行训练,得到蕴含多组织信息的跨组织转录组推测模型(图1)。接着,交叉验证显示所提方法具有高预测准确性,在所有目标组织类型中,MTM的预测效果均显著优于同类方法(图2),且预测效果好的基因集具有高表达量水平、高连接性水平的特征。

c2af460306b843f89675b43d8982fd04.png

图 1  MTM架构

42d3437cc3b94dc387d3bd2c63f27fd0.png

图 2  MTM预测效果优于同类方法


       随后,研究人员对 MTM 模型中间表示进行可解释性分析,发现 MTM 通过充分利用多组织间共享的信息提取个体化特征,并将组织间的生物相似性隐式地编码在网络中,从而实现高预测准确性。接着,研究人员以血液基因表达谱作为输入,通过 MTM 预测其它组织的基因表达谱,一方面评估预测所得数据与年龄、性别、BMI等性状的关联程度,另一方面探究预测数据所蕴含的疾病相关信息,发现由 MTM 预测的组织基因表达谱能够较为有效地指示与个体生理病理性状相关的表达变化,且在独立队列中具有应用潜力(图3)。

fa132a730b9c43f6a8aff50a60259d70.png

图 3  MTM具有预测疾病相关信息的能力


       总之,这项研究开发了一种新的计算方法,为预测个体化组织特异性基因表达谱供了一种非侵入性和具有成本效益的替代方法,为基于组织转录组的基础研究和临床应用提供了新思路。

       原文链接:https://academic.oup.com/bioinformatics/article-lookup/doi/10.1093/bioinformatics/btad363