来自普林斯顿大学等处的研究人员发表了题为“Targeted exploration and analysis of large cross-platform human transcriptomic compendia”的文章,公布了一种新研发的针对转录组数据的搜索引擎,利用这一平台,研究人员可以分析多种不同的芯片和高通量测序数据,这将会带来多基因搜索数据分析的新浪潮。
这一研究成果公布在1月15日的Nature Methods杂志在线版上。
文章的通讯作者分别为普林斯顿大学的Moses Charikar,Kai Li,和Olga G Troyanskaya,其中李凯(Kai Li,音译)教授早年毕业于吉林大学,获得中国科技大学硕士学位,1986年赴美深造,现为普林斯顿大学正教授终身教职。
生物医学领域进入大数据时代,这一点毋庸置疑,目前整个生物组学的大数据就已经达到10的60次方的数量级,而人类现在只完成了10的21次方,如果没有大数据,我们将寸步难行。
基因大数据将改变人类的未来
为此各国各大实验室都在积极备战,去年英国就投资3200万英镑资助首批5大项目,来提高医学生物信息学的能力、产能和核心基础设施。这项“医学生物信息学计划”预计总投资5000万英镑,将通过建立耦合复杂生物数据和健康记录的新方法,来解决关键的医学难题。
同时各种分析工具也应运而生,如这篇文章公布的SEEK跨平台搜索系统,这种系统能解决目前大规模人类表达数据的分析问题,能跨越多个表达平台,其中包括芯片,高通量测序技术,还有与用户单个,或多个基因有关的自动优化数据库。
SEEK能为生物医药研究人员提供一种系统水平上的,针对代表了整个异源人体不同途径通路,组织和疾病的无偏差分析,而且这一系统也利用一种新型交叉验证-加权算法,整合了成千上万个果蝇数据集,这样就能有效的识别相关的数据集,以及共调控基因。
SEEK搜索分析平台未来将能在生物医药等领域发挥越来越重要的作用,这种多基因搜索方式也将为基于元数据的搜索细化,以及基于可视化的分析铺垫道路。