華為有興趣探索以DNA生物技術來儲存信息。這個想法很宏大,因為一公斤的DNA可以存儲存今天地球上的所有數據,而且有效保存幾千年,甚至幾萬年都有可能。
研發電腦數據儲存技術的科學家,早在大數據、雲計算等大型IT技術未盛行時,已估計電腦未來產生愈來愈多的數據,多到令我們無法負荷。Google、Facebook和亞馬遜的數據中心不斷擴充,面積以數倍於足球場計,目前全球每年數據總量已比人類歷史有文字以來加起來還要多,估計從2013年至2020年,我們的數據量會增加十一倍。如果不創新儲存技術,我們的數據中心恐怕要搬上月球。
利用DNA生物科技解決數儲存問題,為人工智能(AI)時代做好基礎建設,既是大生意,更是「大國重器」。華為日前在深圳分析師大會,宣佈成立華為戰略研究院,負責五年以上的前沿技術,DNA數據儲存是其一,這是一門很神奇的科技。《新科學家》New Scientist在2015年2月報導,1克DNA理論上可帶有455 EB (Exabyte)的數據,這已足夠google、Facebook、亞馬遜等超級企業目前加起來的數據儲存使用。
首先我們了解1EB約等如13億中國人,人手一本500頁書加起來的信息量,全球近年的數據總量有幾大? EMC估計2011年為1800EB,以十倍增長計,今天全球數據總量也不過是2萬EB,除非未來的數據呈幾何級數上升,否則1公斤的DNA足夠我們未來的數據儲存使用,保證AI和大數據科技無後顧之憂發展,不怕受阻於儲存技術的樽頸。
來自英國歐洲生物信息學研究所(European Bioinformatics Institute)的Nick Goldman是這項技術的先鋒人物,曾在《自然》Nature發表多篇相關的研究論文,指出DNA是比電腦磁碟、DVD更可靠的資料儲存工具,他表示︰「就連幾萬年前的長毛象骨骸中的DNA都還在,證明DNA是堅強的資料儲存工具。」不過,使用DNA的其中一個技術難題,就是要將電腦的二進制碼,即「0」與「1」,轉換成非常複雜的遺傳密碼。
DNA的密碼是代表四種鹼基的A、C、T、G (註︰四種鹼基在遠古的海底相遇,創造出各種生命,為地球最早出現的一套密碼系統),四個字母可應用成為數據的代碼。原理是先把信息,如相片、文字和聲音檔案,轉換成二進制數字,然後利用編碼將這一連串的「0」和「1」,變成A、C、T、G組成的DNA密碼,透過生物化學技術處理,這些DNA密碼整合出原來的信息,紀錄在人工DNA鏈條裡,數據於是便成為實體,只要在適當的低溫、乾燥,不受陽光照射的環境下,便能長期保存,並可隨時作遙距傳輸。
華為表示,將通過每年3億美元的合作經費,支援學術界開展基礎科學、基礎技術研究,探索未來五到十年以上的創新突破,除DNA數據儲存之外,華為還將涉足新電腦技術,不再依靠受晶片數目限制的處理器,以光技術做出更高100倍的電腦性能。對於以上的科技宏圖和未來景象,有點超出想像,我只可說︰「不要怕,只要信。」
深藍
** 博客文章文責自負,不代表本公司立場 **