科技日報記者 陳曦 通訊員 趙暉
記者19日從天津大學(xué)獲悉,該校應(yīng)用數(shù)學(xué)中心的吳華明教授團隊在DNA存儲領(lǐng)域取得突破,團隊提出了一種全新的DNA存儲系統(tǒng)——HELIX,專門用于存儲生物醫(yī)學(xué)數(shù)據(jù),并成功實現(xiàn)了60MB的時空組學(xué)圖像的存儲與恢復(fù)。研究成果發(fā)表在《自然·計算科學(xué)》上。
隨著信息技術(shù)的飛速發(fā)展,傳統(tǒng)存儲方式逐漸無法滿足大數(shù)據(jù)時代的需求。在此背景下,DNA信息存儲技術(shù)應(yīng)運而生,利用DNA分子存儲數(shù)據(jù),被視為未來大規(guī)模數(shù)據(jù)存儲的解決方案之一。
每克DNA能夠存儲數(shù)百艾字節(jié)的數(shù)據(jù),并且在無需電力的情況下能夠保存長達數(shù)千年。尤其在生物醫(yī)學(xué)數(shù)據(jù)領(lǐng)域,DNA存儲的潛力尤為顯著——其圖片數(shù)據(jù)分辨率高、存儲周期長且相似度強,具有巨大的應(yīng)用前景。
吳華明介紹,研究團隊開發(fā)的HELIX系統(tǒng)包含3個核心模塊:圖像壓縮、圖像糾錯編碼和圖像復(fù)原。針對DNA存儲過程中可能出現(xiàn)的堿基錯誤,HELIX對現(xiàn)有壓縮算法進行了優(yōu)化,大幅增強了系統(tǒng)的容錯能力。同時,為了進一步提升圖像解碼的成功率,團隊還引入了深度學(xué)習(xí)技術(shù),在圖像修復(fù)過程中顯著增強信息恢復(fù)的能力。
在濕實驗中,研究團隊成功將兩張60MB的時空組學(xué)圖像編碼為13萬條、每條183個堿基的DNA序列,并通過DNA合成與測序技術(shù),恢復(fù)了圖像數(shù)據(jù)。實驗結(jié)果表明,HELIX系統(tǒng)具備強大的魯棒性,只需要約5.8倍的測序深度,即可恢復(fù)圖像的絕大部分信息。
據(jù)介紹,該成果在推動DNA信息存儲技術(shù)走向?qū)嶋H應(yīng)用方面邁出了重要一步。這個針對特定數(shù)據(jù)類型量身定制的DNA存儲系統(tǒng),不僅在存儲效率上表現(xiàn)卓越,還在可靠性方面展現(xiàn)了更大的優(yōu)勢,為DNA信息存儲技術(shù)的廣泛應(yīng)用奠定了堅實基礎(chǔ)。