个人完整基因组测序技术的进步令科学家们捕获到了某些疾病的遗传成因,但是如果没有大型基因组数据集来相互比对突变的话,要想将这些突变与基因组前后序列联系在一起非常困难。
近期一组国际研究人员汇总了来自60,706个个体的完整外显子序列,并在这些志愿者的同意下,通过外显子集成联合(Exome Aggregation consortium ,ExAC)共享这些序列信息。同时这一研究组的分析内容也于10月30日公布在生物学预印网站BioRxiv上。
BioRxiv由非营利机构美国冷泉港实验室(CSHL)启动,CSHL希望将BioRxiv打造为生物学家专有的预印本文献库。BioRxiv的目标是加速研究传播,并在科学家的论文正式开始同行评议前,使其获得论文反馈的机会。
这项研究由来自Broad研究院的Daniel MacArthur领导完成,其研究组收集了世界各地实验室中的外显子数据,“编撰人类遗传多样性目录取得了前所未有的成果,”作者在BioRxiv上写道。在这一数据库中的许多突变只出现过一次。
“这是有史以来医学遗传疾病检验最有用的资源之一,”哈佛大学医学院临床实验室主任 Heidi Rehm说。
除此之外,这一研究组也发现了3,230个高度保守的外显子基因,这些基因参与了关键细胞功能,其中有2,557个与疾病无关。作者推测,这些基因如果发生突变,要么导致胚胎死亡(在能诊断之前就over了),要么就会引起尚未得到遗传描述的罕见疾病。
“我们很快就能精确的分析得出,如果这些位点出现突变,那就会要了你的命,而且我们也能说至今没有携带这些突变的个体出现过,”MacArthur表示。
不过这并不是指这就是人体中必需的一套完整基因,来自哥伦比亚大学的遗传学家David Goldstein说。只有通过研究更多的外显子才能定义出这个数字来。
新型罕见遗传病
迄今为止世界上最大规模、全国性范围的罕见疾病基因测序项目:“解密发育疾病项目”(Deciphering Developmental Disorders,DDD)近期发现了四种新的罕见遗传病。
研究组分析了来自英国和爱尔兰的4125个家庭的全外显子组测序数据(这些家庭中至少有一个孩子受发育障碍影响),发现在约1000个家庭中找到了已知疾病的新发突变(de novo mutation),在剩余的3000多个家庭中则没有发现已知疾病的致病突变。为了在剩余的这些家庭中寻找新的隐性遗传病致病基因,研究人员采用了一种计算策略来分析全外显子组数据,筛查在双等位基因位点均会改变蛋白功能的突变,以识别具有相似临床特征、在相同基因存在有害遗传变异的患儿。通过比较患儿与60000多名研究志愿者(他们同意分享其遗传学数据以支持医学研究)中观察到的遗传变异,研究团队确定了四种之前未曾阐明的遗传疾病。
这些数据也纳入了ExAC数据库,MacArthur博士虽然没有参与这项研究,但他指出:“我们迫切需要发现罕见疾病遗传原因的新方法。这项研究展示了巧妙的分析方法以及来自ExAC项目志愿者的遗传学数据的价值,将帮助罕见疾病家庭寻找答案。”
十万人基因组计划
英国计划在2017年完成10万人的基因测序工作,这一计划预计需投入资金3亿英镑,将把科研得出的大量数据整合进英国公共医疗体系当中。此次“十万基因组计划”是此前英国推出的“千人基因组计划”的“升级版”。新的“十万基因组计划”并非只对癌症患者特定的“癌症基因”进行测序,而是要对其进行“全基因组测序”。
从去年5月起,英国已在伦敦、剑桥等地医院开始研究,英国各地的高校、科研机构等也在协助英国卫生部推进这一计划。报道说,英国目前已完成了100个基因组测序,年内将达1000多个,2015年达到1万个,2017年将全部完成。
目前研究人员已经成功募集了3500名罕见疾病患者和2000个癌症病人,未来只需要找到75000名志愿者(其实基本都是这些患者的亲属)就够了。
相关人员表示,迄今为止,化疗仍是治疗癌症的主要途径,但副作用较大,因此有必要找到对人体伤害较小的替代疗法。绘制基因组图谱有助于将来顺利找到癌症的替代疗法,而正确掌握基因组图谱也有利于癌症以及其他疑难病症的诊断、预防和治疗。
其它类似项目
全球千人基因组计划建立全球人类基因变异的目录
ClinVar:NIH建立的变异与相关生理状况的数据库
墨尔本基因组学健康联盟:汇集了来自澳大利亚维多利亚州的多个临床和科研合作伙伴,包括墨尔本卫生部、墨尔本大学、澳大利亚基因组研究基金和澳大利亚联邦科学与工业研究组织等7家机构。合作伙伴有着共同的目标,即将基因组信息整合到日常医疗保健中,测定患者或遗传疾病高危人群的基因序列,以推动研究,其最终结果将应用于改善临床治疗效果。