久久久久久影院,欧美自拍网,欧美最猛性xxxxx免费,日日摸摸,国产成在线观看免费视频成本人,精品在线91,国产精品久久久久久久久久直

DNA搜索引擎MetaGraph研發(fā)成功
日期:2025-10-11瀏覽:315

來(lái)源:科技日?qǐng)?bào)

科技日?qǐng)?bào)記者 劉霞

瑞士蘇黎世聯(lián)邦理工學(xué)院科學(xué)家在最新一期《自然》雜志上發(fā)表論文稱,他們開(kāi)發(fā)出一款名為MetaGraph的DNA搜索引擎,能快速、高效地檢索公共生物學(xué)數(shù)據(jù)庫(kù)中的海量信息,為研究生命科學(xué)提供了強(qiáng)大的專業(yè)工具。

MetaGraph索引及大量DNA、RNA和蛋白質(zhì)序列檔案。圖片來(lái)源:《自然》網(wǎng)站


MetaGraph的研發(fā),源于科學(xué)界對(duì)日益龐大的基因測(cè)序數(shù)據(jù)“用不好、找不著”的現(xiàn)實(shí)困境。過(guò)去幾十年來(lái),各類生物學(xué)數(shù)據(jù)庫(kù)規(guī)模呈爆炸式增長(zhǎng),然而原始測(cè)序數(shù)據(jù)往往碎片化、噪聲多、體量龐大,科學(xué)家難以直接從中高效提取有用信息。

MetaGraph的核心突破在于采用數(shù)學(xué)中的“圖結(jié)構(gòu)”,將相互重疊的DNA片段智能聯(lián)結(jié)。其原理類似于圖書(shū)索引中將含有相同關(guān)鍵詞的句子關(guān)聯(lián)起來(lái),形成知識(shí)網(wǎng)絡(luò)。研究團(tuán)隊(duì)整合了7個(gè)公共資助數(shù)據(jù)庫(kù),構(gòu)建出一個(gè)跨越病毒、細(xì)菌、真菌、植物、動(dòng)物乃至人類的生命全譜系索引。該索引共涵蓋1880萬(wàn)個(gè)獨(dú)特的DNA與RNA序列集,以及2100億個(gè)氨基酸序列集。

基于這一龐大索引,團(tuán)隊(duì)開(kāi)發(fā)出了可直接通過(guò)文本提示檢索原始數(shù)據(jù)檔案的搜索引擎。團(tuán)隊(duì)表示,這是一種與生物學(xué)數(shù)據(jù)交互的全新方式——數(shù)據(jù)被高度壓縮,卻可隨時(shí)調(diào)取。MetaGraph使研究人員能直接對(duì)“序列讀取檔案”(SRA)等存儲(chǔ)庫(kù)提出生物學(xué)問(wèn)題,該數(shù)據(jù)庫(kù)本身包含超過(guò)1億個(gè)DNA字母。

為驗(yàn)證其實(shí)用性,團(tuán)隊(duì)利用MetaGraph掃描了24萬(wàn)多個(gè)人類腸道微生物組樣本,搜尋抗生素耐藥性的遺傳標(biāo)記。僅用一臺(tái)高性能計(jì)算機(jī),約一小時(shí)便得出結(jié)果,展現(xiàn)出強(qiáng)大的分析效率。

法國(guó)巴斯德研究所生物計(jì)算專家拉揚(yáng)·希基評(píng)價(jià)稱,這是一項(xiàng)“重大突破”,為分析DNA、RNA及蛋白質(zhì)序列等原始生物學(xué)數(shù)據(jù)設(shè)立了新標(biāo)準(zhǔn)。這些數(shù)據(jù)庫(kù)規(guī)模驚人,可達(dá)“拍字節(jié)”(PB)級(jí)別,其條目數(shù)量甚至超過(guò)谷歌索引中的所有網(wǎng)頁(yè)。

責(zé)任編輯:常麗君


Copyright ? 2024 云浮市協(xié)同創(chuàng)新科技有限公司 All Rights Reserved. 粵ICP備17147985號(hào)