宏基因组测序技术已经广泛应用于微生物的研究当中,如何利用测序短序列重构出质量可靠的微生物基因组,对于理解微生物群落和下游功能分析至关重要。尽管近些年来组装算法取得了很大进展,但是由于宏基因组数据的固有复杂性,错误在宏基因组组装结果中仍然普遍存在,包括由于同一基因组内的重复序列或不同基因组之间共享的保守序列引起的基因组内或者基因组间拼接错误。现有评估宏基因组组装质量的方法大都依赖参考基因组,仅适用于真实环境中已知的一小部分微生物,这显然不适用于微生物组数据中大量的未知物种。因此,亟需针对基因组组装结果开发不依赖参考基因组的质量评估以及错误矫正方法。
PG电子麻将胡了2怎样才能赢类脑智能科学与技术研究院赵兴明教授团队提出了一种无参的宏基因组组装错误识别以及校正工具metaMIC,能够精确定位组装重叠群(contig)上可能的错误区域。11月4日,该研究成果以metaMIC:Reference-free Misassembly Identification and Correction of de novo metagenomic assemblies为题,发表在Genome Biology期刊。
PG电子麻将胡了2怎样才能赢类脑智能科学与技术研究院生物医学AI团队的博士生赖森莹是本研究的第一作者,赵兴明教授、Luis Pedro Coelho青年研究员以及华中科技大学的陈卫华教授为本论文的共同通讯作者。近年来,该团队在微生物领域进行了不断探索,围绕宏基因组组装、物种识别到下游分析已开展了一系列工作,相关工作包括宏基因组分箱算法SemiBin (Nature Communication, 2022)、全球微生物基因目录GMGC (Nature, 2021),建立了GMrepo (Nucleic Acids Research, 2019, 2020), mMGE (Nucleic Acids Research, 2021)和mBodyMap (Nucleic Acids Research, 2022)等数据库。