人类基因组计划的成功实施,我们已初步掌握了自身的遗传信息。但阐明人类基因组整体功能的功能基因组学仍任重而道远。蛋白质作为生命活动的"执行者",自然成为生命科学研究的新"宠儿"。几乎在所有生命科学领域内,科学研究工作者都需要对细胞、组织或完整生物体的蛋白进行定性描述或定量检测。对一种细胞、组织或完整生物体所拥有的全套蛋白质为特征的蛋白组学在生命科学领域将会发挥重要作用!
目前,我们对蛋白组学的了解需要更清楚、完整的信息,比如说确定在细胞、组织或生物体内的蛋白质种类的数目,以及所有蛋白组分在不同条件下的表达水平等等。
尽管在生命科学领域,定量蛋白质组学开始显现着越来越重要的作用。但对科学工作者和医学研究人员来说,技术上仍存在着巨大的挑战。这些构成蛋白组的各种蛋白会随着不同组织、不同环境状态而发生改变。一种蛋白在转录时,一个基因可以有多种mRNA形式的剪接,并且同一蛋白可能存在多种形式的翻译后修饰。很多蛋白广泛地存在各种生物体液中,而且它们的存在形式和浓度都存在着巨大差别。所以说,蛋白质组不仅仅是基因组的直接产物。现在生命科学领域急需新的技术和研究方法对蛋白组信息有一个完整理解。
"从现在起,我们希望能够对单一实验中进行所有蛋白进行全面测定。这跟当下我们所用的RNA-Seq技术差不多一样。"Robert L. Moritz教授说道。他的实验室一直致力于开发新的技术和数据分析工具来定量检测蛋白质,尤其是在疾病状态下,分析这些蛋白所发挥的作用。
在质谱检测中存在着一个技术难题,虽然质谱能检测蛋白组里所有蛋白(肽段),但一些被预期出现在转录水平上的多肽或蛋白,在质谱中仍不能被精确检测。"根据质谱分析的序列,我们不一定能看到蛋白质的整个氨基酸序列。但是,有时候我们能一直看到这个蛋白的某段序列。" Robert L. Moritz教授提到。所以需要建立一个分析方法来确定,对一个多肽的检测为阴性是来自于实验仪器不能检测到,还是来自于其他原因,比如说就是实验处理后出现预期的实验结果。Robert L. Moritz教授解释道:"之所以我们对某一个特定蛋白质的任何肽段都检测不到,原因可能是这个蛋白只在特定条件下,在特定的组织或细胞被表达。"
许多肽段能在质谱中被检测,而这些信息被统计在一个数据库,叫PeptideAtlas。2005年,PeptideAtlas数据库成立,从开始到现在,来自多种不同物种的质谱数据仍在大幅增加和更新。它既是一个庞大的数据库,同时也对蛋白质组学相关实验提供了重要的查询资源。
PeptideAtlas数据库允许科研工作者查到每个多肽的检索记录,以及每个多肽的所有特性。另外,PeptideAtlas同样能给科研工作者在实验设计和质谱实验数据重复提供资源和指导。
近来,Moritz博士的研究小组,开发了新一代数据库,叫AltasProphet。它是一个更高精度,覆盖率更广,而且是在蛋白质组学的背景下,升级的质谱数据处理平台。他们认为,质谱技术仍有许多需要改进的方面,比如说速度和灵敏度这两个方面。现在已经出现了可供检测并定量一些蛋白(包括一些蛋白的亚型)的新兴技术,。
下面总结一下目前这些新兴技术在生命科学领域的研究运用,以下面四个例子来说明。
1)对神经退行性疾病(如阿兹海默症)进行蛋白组学相关标志物跟踪的研究
"我们已经找到三种可以降低阿兹海默症疾病风险的干预手段,全部都来自于蛋白组学的研究结果。"来自肯塔基大学生物化学教授Allan Butterfield说道。他跟加州大学欧文分校的研究人员合作在人类衰老动物模型研究中,用三种不同方式来干预动物衰老(评估动物在认知上出现损伤的风险),包括改变饮食、改变身体活动和智力刺激。
动物模型是比格犬,它拥有跟人类一样β-肽序列,并具有学习复杂认知任务的能力。这些证明比格犬可以用于研究人类中阿兹海默症发生原因的实验动物模型。
科研工作者将12岁的比格犬分三组,第一组喂富集抗氧化的食物;第二组进行体能锻炼干预;最后一组进行智力训练组,这些干预在比格犬上持续了三年。通过最后比格犬的认知测试结果,这些经历过三种不同干预措施后15岁(12岁+3岁)比格犬跟4岁的比格犬的认知能力相似。并发现比格犬在认知上的改善伴随着大脑中β淀粉样蛋白块水平下降。并且,这些干预后的比格犬大脑氧化应激水平与4岁的比格犬几乎一致。而对照组(正常饮食的比格犬)的大脑出现了跟阿兹海默氏症一致病理症状。通过蛋白质组学检测出大脑组织中氧化蛋白水平明显增加。在这项饮食和生活方式干预改变认知的研究中,科学工作者使用蛋白组学找到了与神经退化性疾病相关的蛋白,也探索了这些蛋白之间的相互作用和信号调控通路,并证实了之前类似研究的实验结果。在研究神经变性疾病领域中,很难在病症早期发现病理学等变化。如果在临床疾病的发病前做一些相应的干预,可能降低疾病的发生和减缓进展、并提高生活质量和延长寿命。
目前蛋白质组学面临的挑战是数据难以输出。但是,如果生物信息学和质谱等蛋白质分技术进步相一致时,这将标志着蛋白质组学的真正成熟。
2)在肿瘤研究中分析过表达的蛋白组来控制癌症
来自密歇根大学医学院的David M. Luban教授说:"蛋白质组学领域内存在一个重大的难题,很难做到在同时测到大量样品的实验数据。现在已经有很多团队在在这个难题上攻坚克难,但目前这些新兴的工具还远没成熟到可供我们使用。"
Luban博士和他的同事在最近的一项研究中,利用肿瘤干细胞上的生物标记物,分离出来两种乳腺癌肿瘤干细胞亚型:ALDH、CD44双阳性和ALDH、CD24双阳性干细胞群。在癌症研究中,对于肿瘤干细胞的特性了解非常重要,这方面的研究可以找到肿瘤转移的机理,以及对攻克癌症耐药难题有很大的帮助。
科学工作者首先使用蛋白质组学来分析比较这两种不同亚型的乳腺癌干细胞的蛋白表达情况。通过这一步他们鉴定出了3304种蛋白在两种细胞亚型中存在差异。接下来,他们使用无标记蛋白定量手段,还找到并研究了这两种不同干细胞表型的分子调控机理。Luban博士说:"在这项研究中,我们已经通过代谢组学确定了几个关键蛋白,现在已经开始下一步的研究。"
无标记定量蛋白质组分析技术可以检测一种蛋白相匹配的的所有肽段,并可以确定它在总蛋白中所占的具体比例。在蛋白组学中常用的标记蛋白分析技术,如果细胞数非常少的条件下,对样品分析存在很大的挑战,而这一技术正好可以解决这一难题。现在他们希望能通过这个办法对肿瘤干细胞(少于10,000个细胞)的样品中蛋白进行更为细致蛋白质组学分析。
3)通过蛋白组学解析生物行为学的问题
来自哥伦比亚大学蛋白质组学实验Leonard Foster博士分析比较了蜜蜂体内的1,200种蛋白,试图从蜜蜂体内蛋白表达组信息与蜜蜂行为学上建立一种联系。
"在蛋白质组学领域仍普遍存在着一个难题:蛋白组学实验往往费时耗力,而且一些实验数据很难重复。这个难题需要通过蛋白质组学相关技术的发展和改进来解决。现有的一些实验方法所得到的实验结果并不能很好地解释生物行为学上的问题,也就是说很多实验结论不能有效地支持这些生物的行为学等现象。" Leonard Foster博士说道。
Leonard Foster博士和他的研究小组对蜜蜂与其体外寄生螨虫之间的相互作用感兴趣。蜜蜂存在两个可遗传的抵御体外寄生螨虫的生物机制:一个是集体行为模式;另一个是对螨虫的敏感程度的机制。而这两个机制在不同蜜蜂之间所起的调控作用也存在差异,而目前这两个遗传学和生物信号传导的机理都不清楚。
Leonard Foster博士和他的同事测量了蜜蜂触角和幼虫体内大约1,200种蛋白质的相对丰度,还描述了这些蛋白在蜜蜂免疫力,以及蜜蜂跟寄生虫之间所起的调控作用。这一次研究首次证明了蛋白表达谱与蜜蜂行为模式之间存在着相关性。
另外,最近他们另一项研究发现,通过蛋白质组学分析发现半乳糖诱导了PKA1基因(表达PKA蛋白的催化亚基)表达,而葡萄糖会抑制该基因的表达。通过这个系统,研究工作者鉴定了在真菌病原体、新型隐球菌等其他类似疾病的真菌的分泌蛋白吧被哪些蛋白调控。
"这种定量检测蛋白方法非常精确,半定量方法不能对培养基上清中的分泌蛋白进行精确测定。" Leonard Foster博士研究小组通过这个定量检测的方法鉴定了与真菌的生存,和对宿主毒性以及对铁离子摄取相关的61种分泌蛋白,其中5个的表达分泌与PKA1基因转录表达调控相关。
4)蛋白翻译后修饰的挑战
蛋白翻译后修饰作为蛋白质的一个特性,但这一特性给质谱等蛋白质组学的实验在定量和评估被修饰后的多肽埋下了巨大的难题。
"在对染色质生物研究领域内开发出一类高质量抗体来识别蛋白翻译后修饰是现在急需解决的问题!"来自俄亥俄州立大学的Michael A. Freitas博士说,"但目前为止,所能使用的这种高品质抗体仍为数甚少。"
然而,即使有这样的抗体可用,但它们所识别具体表位会被临近肽段翻译后修饰而发生改变,从而变得毫无用处,或达不到检测的标准,组蛋白H3K9S10就是一个典型的例子。在Freitas博士的实验室,他们经常会使用用同位素标记的氨基酸(stable isotope labeling by amino acids in cell culture, SILAC)来做蛋白组学的质谱分析。他们发现在实验组和处理组中用这种带同位素标记氨基酸的培养基培养细胞一段时间,然后进行蛋白组学分析有很多优势。这个方法可以进行相对定量,从而通过质谱实验分析确定单个蛋白的翻译后修饰的程度。但是这个方法也存在着缺点,比如说在细胞培养过程中,被限制只能使用1到2种标签,另外这个方法不太适合一些不能培养的样品,以及"路径"太复杂的蛋白的质谱分析。这个方法也不适合现行的一种"自上而下"的蛋白组学分析方法。如果蛋白被蛋白酶消化产生的多肽片段,通过检测肽段的N末端不能确定在这个区域内发生翻译后修饰,是否与其它区域(多肽片段)的修饰有关。这个难题也将是蛋白组学研究翻译后修饰中所面临的巨大限制。
Freitas博士和他的同事和其他科研工作者合作,实现了这种"自上而下"的蛋白组质谱分析。首先将一个完整的蛋白质置于质谱仪中,然后通过高能量的力物理破坏这个蛋白质变成零散的多肽片段。最后通过对这些多肽片段的质谱实验数据重新"组装"出这个蛋白。这样就保留了这个蛋白上所有的翻译后修饰信息。通过这个方法,Freitas博士和他的同事研究了乳腺癌细胞中几种不同组蛋白亚型在细胞中的功能,以及在细胞周期中蛋白组的动态变化,并将一些清楚的翻译后修饰作为恶性增殖的潜在生物标志。
未来十年的科学研究将越来越显示出定量蛋白组学对生命科学的重大意义!