該項(xiàng)研究由美國(guó)華盛頓大學(xué)醫(yī)學(xué)院( University of Washington School of Medicine)、美國(guó)加利福尼亞大學(xué)(University of California)等主導(dǎo)。研究稱,GRCh38是目前已知的人類基因組序列的一個(gè)標(biāo)準(zhǔn)版本,它由一小部分人類基因組測(cè)序數(shù)據(jù)組成,其中包含許多已知的人類基因組變異和SNP(單核苷酸多態(tài)性)信息。GRCh38是人類基因組研究的重要工具,可以用來(lái)識(shí)別、定位和注釋基因,以及進(jìn)行遺傳變異分析和比較基因組學(xué)研究。“但是,由于人類基因組是高度復(fù)雜的,存在很大的個(gè)體差異和變異形態(tài),因此仍需要更深入的研究和探索來(lái)完善我們對(duì)其的理解。”
發(fā)表于《自然-生物技術(shù)》的文章《A draft human pangenome reference》表示,自20年前首次發(fā)布人類參考基因組以來(lái),它一直是人類基因組學(xué)的支柱。但在當(dāng)前的GRCh38版本中,有210 Mb(兆堿基)的DNA序列段沒(méi)有被完整地測(cè)序,或無(wú)法確定其序列,其中151 Mb的區(qū)域完全未知,而59 Mb的區(qū)域是通過(guò)計(jì)算機(jī)模擬得到的預(yù)測(cè)序列。這種情況會(huì)造成相關(guān)研究的數(shù)據(jù)偏差,也意味著在人類基因圖譜中,依然有很多區(qū)域是我們尚未可知?!耙虼?,我們需要不斷完善它?!?/span>
發(fā)表在《自然》的三篇文章提出了使用人類泛基因組草圖得到的新發(fā)現(xiàn)。在第一篇文章《Increased mutation and gene conversion within human segmental duplications》中,Evan Eichler和同事開(kāi)發(fā)了一個(gè)單核苷酸變異(SNV)圖譜,其中包含了數(shù)百萬(wàn)先前未被描繪的SNV,同時(shí),該圖譜描述了一些基因組區(qū)域的變異性質(zhì),這些區(qū)域擁有片段重復(fù)序列,并在基因組的一個(gè)或多個(gè)位點(diǎn)上重復(fù)出現(xiàn),共享著高度相同的DNA序列。這種重復(fù)序列的存在可能導(dǎo)致基因組變異,從而對(duì)個(gè)體的表型特征和患病風(fēng)險(xiǎn)產(chǎn)生影響。
在第二篇《Recombination between heterologous human acrocentric chromosomes》文章中,Erik Garrison和同事利用人類泛基因組草圖,觀察到異源著絲粒染色體短臂(q-arm translocation,染色體的一個(gè)部分,通常位于染色體的末端)之間的重組模式,并觀察到了某種DNA交換機(jī)制。這表明,在染色體之間,一種過(guò)去曾被推測(cè)但未被證實(shí)的DNA交換方式的確存在。
在第三篇《Pangenome graph construction from genome alignments with Minigraph-Cactus》中,研究人員利用人類泛基因組草圖提高了Pangenome參考基因組的準(zhǔn)確性。Glenn Hickey等人表示,Pangenome是一種新興的基因組分析模式,這種模式不僅能分析個(gè)體基因組的變異,還能分析物種內(nèi)所有個(gè)體之間共享的基因組變異,從而為更全面、準(zhǔn)確地描述一個(gè)物種基因組提供了框架。在此次研究中,科學(xué)家們展示了“Minigraph-Cactus pangenome pipeline”的流程,該方法可以直接從全基因組比對(duì)中創(chuàng)建Pangenome,同時(shí)它還可以處理比較人類和果蠅之間的跨物種基因組數(shù)據(jù)。這為將來(lái)更好地理解物種間和個(gè)體間的基因組變異提供了更全面的信息。