中国科学院院士贺福初有一个比喻:基因组和蛋白质组的关系就像词典与文章、元素表与化工厂。基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大。因此,要真正阐释生命,必须从蛋白质组中寻找答案。
北京市昌平区中关村生命科学园的主入口处,一栋由南北双楼组成的银白色建筑呈一字型展开。这里是国家蛋白质科学中心—北京(凤凰中心)的总部大楼,也是“中国人类蛋白质组计划”(以下简称CNHPP)的主要研究基地,从2014年6月至今,有关人类蛋白质组的庞大数据在这栋建筑中陆续被测量和解读。
偶尔从门口经过的人也许无法想象,这些数据有一天会完全改变眼前的生活。基于人类基因组这部“天书”而发展起来的精准医疗,将因为人类蛋白质组信息的清晰而变得更加精细和普适。
科学界曾经认为,只要绘制出人类基因组序列图,就能了解疾病的根源,但事实并非如此。
基因是人类遗传信息的载体,是生命奥秘最原始、最根本的物质基础。蛋白质是基因表达的产物,是构成有机体的主要成分,是所有生命活动的载体和功能执行者,是细胞执行生长、发育、衰老和死亡等各种生命活动的基本单位。蛋白质与基因密切相关,但是在此基础上又产生很多变化,造就了生物体不同的形态、形状,或者执行不同的功能。
一个有机体只有一个基因组,但是同一个有机体的不同细胞中的蛋白质的组成和数量却随细胞种类和功能状态的不同各有差异。比如,人体不同组织器官的基因组是一样的,但是各个组织器官的蛋白质组不完全一样。人和鼠的基因组的差别仅为1%,但是其形态、性状差别非常大,这就是蛋白质组不一样的体现。
中国科学院院士贺福初有一个比喻:基因组和蛋白质组的关系就像词典与文章、元素表与化工厂。确实如此,基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大。因此,要真正阐释生命,必须从蛋白质组中寻找答案。
主要开展的研究包括:建立样本采集方法标准、样本预处理和生物质谱分析策略;进行含有定量信息的正常组织和疾病、疾病旁组织蛋白质表达谱、磷酸化谱、转录因子谱构建;建立临床蛋白质组大数据平台;通过数据分析、知识挖掘,发现若干疾病人群特征性信号通路变化的线索以及它们和病人手术后存活的关系。
这其中包含了很多难题。首先需要攻克的是蛋白质分离鉴定的速度、样本通量,除此之外,还有微量或痕量蛋白质的分析、蛋白质组大数据构建和多维度组学对接、蛋白质组数据的深入分析和知识挖掘的方法策略等。
蛋白质最终会是精准医学的出路。现在蛋白组学刚刚起步,相当于基因组学10~15年前的水平,但其发展势头已展现出蓬勃生机。中国的蛋白组学起步早,进步快,在世界的蛋白质组学领域占有一席阵地。最近建成、投入试运行的国家蛋白质组学大科学设施——凤凰中心已在CNHPP的实施中发挥了作用。其强大的蛋白质组解析能力,正在发展的蛋白质组生物信息学技术和方法,统一的样本准备流程,均一的质量控制方法和与临床医生的紧密合作、无缝连接,已对CNHPP高质量数据的产出和分析提供了坚实的基础和保障。