深圳科學(xué)家破解DNA存儲(chǔ)技術(shù)世界性難題
“DNA硬盤(pán)”登上頂級(jí)期刊
4月25日,《自然-計(jì)算科學(xué)》發(fā)表了由深圳華大生命科學(xué)研究院主導(dǎo)的研究成果,研究團(tuán)隊(duì)開(kāi)創(chuàng)了一套獨(dú)具優(yōu)勢(shì)的編解碼系統(tǒng),用以解決當(dāng)前DNA信息存儲(chǔ)領(lǐng)域的技術(shù)難題。
據(jù)悉,研究團(tuán)隊(duì)結(jié)合DNA雙鏈模型,開(kāi)創(chuàng)了一套比特—堿基編解碼系統(tǒng),并在實(shí)驗(yàn)中驗(yàn)證了該系統(tǒng)在信息密度、技術(shù)兼容性、數(shù)據(jù)恢復(fù)穩(wěn)定性等多方面的優(yōu)勢(shì)。
廣州日?qǐng)?bào)全媒體記者王納
DNA數(shù)據(jù)存儲(chǔ)擁有巨大潛能
我們知道,所有信息在計(jì)算機(jī)中只由二進(jìn)制的方式存儲(chǔ),即0和1兩個(gè)數(shù)碼。而生物的遺傳信息則儲(chǔ)存在DNA中,以A、T、G、C四種堿基表現(xiàn)。
也許你會(huì)思考:倘若把信息語(yǔ)言的0和1,轉(zhuǎn)換為生物語(yǔ)言的ATGC,我們是不是就能把各類(lèi)信息長(zhǎng)久地保存在DNA中,讓DNA成為“完美”的存儲(chǔ)器了?擅長(zhǎng)把假設(shè)變?yōu)楝F(xiàn)實(shí)的科學(xué)家,已經(jīng)用實(shí)際研究成果對(duì)這個(gè)問(wèn)題給出了樂(lè)觀的回答。這也就是這項(xiàng)研究的重要意義。
深圳華大生命科學(xué)研究院科研人員告訴記者,DNA的數(shù)據(jù)存儲(chǔ)潛能其實(shí)是超越現(xiàn)有信息存儲(chǔ)器的。
隨著5G技術(shù)、大數(shù)據(jù)、人工智能等領(lǐng)域的蓬勃發(fā)展,海量數(shù)據(jù)如何長(zhǎng)期穩(wěn)定存儲(chǔ)已成為亟待解決的一大難題,而以“BT+IT”融合的DNA信息存儲(chǔ)技術(shù),或能為這個(gè)問(wèn)題提供更優(yōu)解,因此受到了越來(lái)越多的關(guān)注。
畢竟在存儲(chǔ)信息這件事上,DNA可以說(shuō)是坐擁數(shù)十億年經(jīng)驗(yàn)的資深前輩。相較于現(xiàn)有的U盤(pán)、硬盤(pán)、磁帶等介質(zhì),DNA具備無(wú)法比擬的優(yōu)勢(shì)。
一是超高的信息密度。2012年《科學(xué)》雜志文章指出,1克DNA理論上可以存儲(chǔ)455EB數(shù)據(jù),相當(dāng)于數(shù)千萬(wàn)個(gè)1TB移動(dòng)硬盤(pán)的大小。
二是超長(zhǎng)的待機(jī)時(shí)間。DNA作為相對(duì)穩(wěn)定的分子,其半衰期長(zhǎng)達(dá)521年,在理想狀態(tài)下甚至可保存成千上萬(wàn)年。
三是超強(qiáng)的生物兼容性。DNA作為絕大多數(shù)生物遺傳信息的載體,相對(duì)無(wú)機(jī)物、金屬等存儲(chǔ)介質(zhì)而言,具有更強(qiáng)的生物兼容性。
2019年,“DNA數(shù)據(jù)存儲(chǔ)器”入選《時(shí)代周刊》年度100項(xiàng)最佳發(fā)明。我們有理由相信,DNA憑借其獨(dú)家天然優(yōu)勢(shì),在信息密度、復(fù)制與維護(hù)成本、使用壽命等方面都具有顛覆現(xiàn)有技術(shù)的巨大潛能。
這項(xiàng)技術(shù)從2012年起步至今短短十年時(shí)間,DNA信息存儲(chǔ)領(lǐng)域已取得不少令人矚目的研究成果,包括檢索、修改等高級(jí)功能也已完成原理驗(yàn)證性的測(cè)試,以微軟、谷歌等產(chǎn)業(yè)巨頭形成的DNA存儲(chǔ)聯(lián)盟更是在為其商業(yè)化廣泛合作蓄勢(shì)。
深圳科學(xué)家巧妙破難題
但是,如何在保證信息轉(zhuǎn)換效率和技術(shù)兼容的同時(shí),大幅提高信息恢復(fù)的穩(wěn)定性?這是DNA存儲(chǔ)中編解碼系統(tǒng)存在的棘手問(wèn)題。如今,DNA存儲(chǔ)的技術(shù)壁壘,深圳華大生命科學(xué)研究院(以下簡(jiǎn)稱(chēng)“華大研究院”)提供了全新的解決思路。
4月25日,華大研究院、深圳國(guó)家基因庫(kù)等多家機(jī)構(gòu)的研究團(tuán)隊(duì)聯(lián)合在《自然》子刊《自然-計(jì)算科學(xué)》發(fā)表研究論文。研究團(tuán)隊(duì)結(jié)合DNA雙鏈模型,開(kāi)創(chuàng)了一套比特—堿基編解碼系統(tǒng),驗(yàn)證了該系統(tǒng)在信息密度、技術(shù)兼容性、數(shù)據(jù)恢復(fù)穩(wěn)定性等多方面的優(yōu)勢(shì)。
華大研究院團(tuán)隊(duì)以?xún)商撞煌囊?guī)則,分別對(duì)兩條二進(jìn)制信息進(jìn)行“一對(duì)一”編譯轉(zhuǎn)換,再取兩者統(tǒng)一交集的部分為最終解,實(shí)現(xiàn)將兩條獨(dú)立的信息組合統(tǒng)一為一串DNA序列。
機(jī)智的朋友可能會(huì)問(wèn),人工合成的DNA要保存在哪?目前,常用的保存方法分為體內(nèi)和體外兩種模式,兩者孰優(yōu)孰劣尚未形成明確定論。為了全方位驗(yàn)證新系統(tǒng)的信息恢復(fù)穩(wěn)定性,華大研究院團(tuán)隊(duì)通過(guò)體外DNA干粉和細(xì)胞體內(nèi)大片段兩種存儲(chǔ)環(huán)境進(jìn)行測(cè)試,皆實(shí)現(xiàn)了原始存儲(chǔ)數(shù)據(jù)的完整恢復(fù)。
在體外模式方面,研究結(jié)果證明,深圳科學(xué)家研究的編碼采用的線(xiàn)性數(shù)據(jù)恢復(fù)模式在每種DNA分子的平均拷貝數(shù)僅有100時(shí),仍然能恢復(fù)最高88%的原始數(shù)據(jù)。
在體內(nèi)模式方面,研究將信息存在了酵母活細(xì)胞的體內(nèi),酵母菌株經(jīng)過(guò)1000代以上傳代之后,信息仍可以被完美恢復(fù)。這在一定程度上意味著,利用活體細(xì)胞作為DNA存儲(chǔ)的載體,上千年后原始信息或仍能被解讀。這樣的存儲(chǔ)方式可以得到接近于天然DNA分子存儲(chǔ)理論極限的物理信息密度,每克DNA能存儲(chǔ)的信息量約為432.2EB。據(jù)透露,華大研究院團(tuán)隊(duì)曾將《開(kāi)國(guó)大典》影片存儲(chǔ)于DNA中。
該研究由深圳華大生命科學(xué)研究院主導(dǎo),深圳國(guó)家基因庫(kù)、首都師范大學(xué)、美國(guó)哈佛大學(xué)等多個(gè)研究團(tuán)隊(duì)共同參與。華大研究院平質(zhì)博士為論文第一作者。
相信隨著華大等全球科研機(jī)構(gòu)、數(shù)字信息產(chǎn)業(yè)界的不斷突破,在不遠(yuǎn)的未來(lái),“DNA硬盤(pán)”將成為我們?nèi)粘I钪斜夭豢缮俚臄?shù)據(jù)存儲(chǔ)設(shè)備之一。
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛(ài)好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com