尽管科学家已经完成了整个人类基因组的测序但仍有一些空白。
再生医学网获悉,目前,遗传学家在一项具有里程碑意义的新研究中带来了一个重要的基因序列,即对整个人类X染色体从头到尾进行测序并覆盖了300多万个此前没有被绘制出来的碱基对。
人类基因组计划是有史以来最雄心勃勃的科学事业之一。从1990年到2003年,一个由国际科学家组成的团队对人类基因组进行了非常详细的排序,最终得到了一个几乎完整的人类物种蓝图。
但这里的重点是“几乎”。第一个版本覆盖了人类基因组的92%多一点,准确率超99.99%。后来的修订虽然弥补了一些差距,但仍没有做到完全覆盖。而其中最大的缺口位于染色体的中心和末端,分别被称为着丝粒和端粒。这些区域被大量重复的序列分类,所以很难对其展开分类。
现在,一个由遗传学家组成的国际团队已经填补了这些空白。据了解,研究人员首次成功地从端粒到端粒对整个X染色体进行了测序。
在人类中,X染色体是父母传给孩子的决定性别的染色体之一。一般来说,一个受精卵接收到两条X染色体--一条来自母亲一条来自父亲。
在最新的研究中,研究小组并没有对一个正常人类细胞的X染色体进行测序,相反,他们研究了一种特殊类型的细胞,这种细胞含有两条相同的染色体,是被称为CHM13的模型基因组的一部分。
而基因组测序面临的一个问题是,传统的技术一次只能读取一小段DNA,然后再让科学家们将它们拼在一起。不幸的是,当这些片段不断重复时,这项工作就变得特别困难,研究小组将其比作组装一个只有一种颜色的拼图。
为了解开这个谜题,研究小组使用了一次读取更长序列的新技术。其中一种技术被称为“纳米孔技术”,它将DNA的单个分子通过一个小孔然后通过检测电流的变化对其进行排序。
“虽然这些大量重复的序列曾被认为是难以处理的,但现在我们在测序技术上取得了飞跃,”该项目的首席研究员Karen Miga说道,“通过纳米孔测序,我们获得了能跨越整个重复区域的数十万碱基对的超长读数,从而绕过了一些挑战。”
利用这项技术,研究小组能填补着丝粒上的一个巨大缺口,该缺口由310万碱基对重复的DNA组成。而这些以前未被探索过的地区可能会被证明对科学研究特别有价值。
Miga表示:“我们开始发现,参考序列中存在空白的一些区域实际上是人类变异最丰富的区域之一,因此我们一直缺失了许多可能对理解人类生物学和疾病非常重要的信息。”
但X染色体只是一个开始。眼下还剩下23条染色体有待科学家去发现,该项目计划在2020年底将它们全部绘制出来。
(备注:图片源自网络。)