当前位置:新闻 -> 行业动态 -> cuteSV——基因组结构变异检测工具
cuteSV——基因组结构变异检测工具
时间:2020-11-25 12:18:52  作者:lfy  来源:生物谷
再生医学网获悉,近日,来自哈尔滨工业大学的姜涛老师在近期发表的文章中介绍了一款全新的SV检测工具——cuteSV,该工具使用了纳米孔测序高通量测序平台PromethION最新发布的长读长测序技术,解析了Genome in a Bottle(GIAB)HG002人类参考基因组样本中的SV。cuteSV是一款快速的SV检测工具,在准确度和灵敏度等指标上均有优异的表现,同时在低测序深度数据上仍保持着良好的结构变异检测率。这些结果表明,基因组SV研究领域正在进入一个高性能和低成本的时代。
  基因一向被视为构成生物生命的重要构成部分,而且和生命健康息息相关。事实上,许多恶性疾病之所以会发生,都跟基因组结构变异有关。但在过去很长一段时间内,人类对于基因组了解并不多。不过,好在随着医疗科技水平的进步以及基因工程的问世,使得人类有机会对基因进行更加深入地了解。
  
  再生医学网获悉,近日,来自哈尔滨工业大学的姜涛老师在近期发表的文章中介绍了一款全新的SV检测工具——cuteSV,该工具使用了纳米孔测序高通量测序平台PromethION最新发布的长读长测序技术,解析了Genome in a Bottle(GIAB)HG002人类参考基因组样本中的SV。cuteSV是一款快速的SV检测工具,在准确度和灵敏度等指标上均有优异的表现,同时在低测序深度数据上仍保持着良好的结构变异检测率。这些结果表明,基因组SV研究领域正在进入一个高性能和低成本的时代。
  cuteSV概览
  cuteSV是一款基于长测序片段比对的基因组SV检测工具,它主要包括以下三个步骤:
  SV信号的识别:cuteSV设计和实现了多种SV信号识别方法,分别从比对内和比对间全面收集多种类型SV信号。同时,cuteSV采用了一套高效的启发式算法,将琐碎的插入与删除变异信号进行自动化整合以提升后续过程中SV识别的准确度。
  SV信号的聚类:cuteSV设计了一种渐进复杂空间的聚类算法以及多重启发式的规则,在基因组局部区域内分别对SV信号进行聚类并对其进行优化,使零乱、繁杂的SV信号转换为高一致性的SV候选位点。
  SV的检测与基因分型:cuteSV设计了一套特定的SV检测与基因分型规则,在上述聚类得到的SV候选位点中识别SV并完成基因分型。此外,cuteSV还可以输出基因型的似然估计、变异质量分数等多重统计量,以便于进一步的质量控制和构建更高准确度的检测集。
  姜涛老师采用了最新发布的ONT PromethION HG002基因组样本数据集对cuteSV的性能进行了基准测试,同时与Sniffles、PBSV和SVIM等工具进行了比较。cuteSV展现出了三大主要优势:
  相较于其他工具,cuteSV在不同测序深度数据中能够检测出更多的SV。特别是在低覆盖度数据集中,cuteSV在准确度没有降低的前提下仍保持着较高的灵敏度。
  cute SV在基因型检测方面表现出色,发现了更多的杂合与纯合SV。
  与其他工具相比,cute SV具有更好的检测速度,同时内存的消耗也更低。此外,cute SV的运行速度随CPU线程数的增加几乎呈线性增长,这表明其拥有良好的可扩展性。
  在ONT PromethION数据的不同测序深度下,分别比较(A)F1分数、(B)准确度、(C)灵敏度、(D)结合基因型的F1分数、(E)结合基因型的准确度、(F)结合基因型的灵敏度。使用47x ONT PromethION数据分别在不同CPU线程下的(G)运行时间和(H)内存占用的统计结果。“GT”和“Skip GT”分别表示统计指标结合基因型和忽略基因型。由于SVIM不支持多线程运行,因此仅完成了单线程测试。PBSV在47x数据集的检测中程序异常终止,因此没有纳入统计。
  纳米孔测序技术产生的超长读长序列,使大尺度结构变异的解析成为可能。
  展望
  虽然长读长序列的可比对性远高于短读长序列,但由于测序错误、SV复杂程度、重复序列等因素的存在,片段比对仍存在着局限性。从头组装方法虽然克服了比对所产生的错误,且能够解析SV的单倍型,但从头组装方法仍然有着其自身的瓶颈,例如组装错误、计算量巨大、严重依赖不同类型的测序技术等。考虑到这些优缺点,姜涛老师认为基于比对和基于组装的检测方法是相辅相成的,将两种方法结合起来将有助于生成更高质量的SV检测集。
  最后,再生医学网认为,随着cuteSV工具的问世,也意味着人类将彻底掌握有关基因组结构的“一切秘密”。同时,随着该研究成果的进一步完善以及临床转化应用,相信能够让更多患者从中受惠。
关键字:基因组,基因工程,cuteSV
反馈
版权所有2012-2019 组织工程与再生医学网 保留所有权利
京ICP备11013684号-2