DNA 存儲是由DNA 高通量合成與測序技術催生的信息與生物相融合的新領域,通過DNA 分子的堿基序列直接編碼數字信息,由高通量合成技術合成序列進行信息寫入,并利用高通量測序技術實現信息的讀取,以實現存儲數據的信息還原。DNA 存儲的編解碼,是DNA 存儲中最重要的環節之一,直接影響了存儲信息的穩定性及可靠恢復性。直接套用的信道編碼技術有較強的數據類型偏好性,因此在實際的存儲應用中存在較高的數據無法恢復的風險。
近日,深圳華大生命科學研究院研究團隊在《Nature Computational Science》上發表了題為“Towards Practical and Robust DNA- Based Data Archiving Using‘Yin-Yang Co? dec’System”的研究論文,提出了一套DNA 信息存儲專用的比特-堿基編解碼系統。
研究團隊從DNA 雙鏈模型中受到啟發,結合中華文化中“陰陽”對立統一的思想,將其巧妙應用到DNA 編解碼系統當中,以兩套不同的規則,分別對兩條二進制信息進行“一對一”編譯轉換,再取兩者統一交集的部分為最終解,實現將兩條獨立的信息組合統一為一串DNA序列。同時引入篩選機制,將與現有合成測序技術兼容性不佳的序列通過預先設置的篩選條件進行過濾。研究通過編碼學的理論推導以及不同數據類型文件的模擬編碼與實驗驗證,證明了該系統在保證信息密度的前提下,在數據恢復穩定性與存儲密度方面體現顯著的性能提升,每克 DNA 能存儲的信息量約為432.2 EB。
該研究為DNA 信息存儲的應用提供了一種高密度、高穩定性的比特-堿基編解碼方法,并完成了體內外兩種模式的信息存儲實驗驗證;研究開發了一種全新的DNA 存儲編碼方法,為DNA 存儲的多類型應用提供了重要工具,有望在海量數據長期存儲的新型介質研究中起到積極的推動作用。
(來源:中華人民共和國科學技術部http://www.most.gov.cn2022-05-19)