大數據這個熱門名詞,隨著人工智能時代的進步,定義正在不斷摸索和修正中,不過,可以肯定的是人工智能如果沒有大數據,那麼就只會停留實驗研究階段。

《在綫》的作者,雲端計算專家王堅在書本表示︰「其實大數據這三個字叫錯了,這個名字沒有反映最本質的東西。」數據加上一個大,原來是關乎對新科技的觀念問題。字面上令我以為數據規模夠大,那就是大數據,殊不知儲存於歐洲核子研究組織(CERN)對撞機實驗室所的數據很大,可是它並不屬於我們時下所要談的大數據。該實驗室每年大約要紀錄35PB數據。

35PB等如250 Byte乘以35,夠大的數據了,不過,這些數據是儲存在實驗室的磁盤內,沒有通過互聯網交流共享使用,王堅指這是「死數據」;當然,對撞機產生的海量數據除了追尋「上帝粒子」之外,如何成為可應用於日常生活、產生商業價值,又是另一個問題。王堅認為,今天的大數據和昨天的”大數據”最大區別,「就在於數據在綫了」。例如電子商務主要靠在綫數據營運,你懂的。

日前,香港的大數據治理公會正式成立,大數據專家兼公會召集人車品覺指出,2013年是一個分水嶺,因為智能手機全面普及,我們的在綫生活從個人電腦轉移到手機之上,由於使用簡易又方便,加上應用的apps推陳出新,大家的點擊瀏覽產生前所未有的數據。這個天文數字數據無限增長之同時,大數據的形態與本質不斷演變,所以大數據是「現在進行式」,要加個ing在尾才夠傳真。

除非大家現在開始到以後都不用智能手機,否則怎也不能逃避大數據——即在綫數據與你的關係,是以近半年我參加不同科企舉辦的AI、雲端計算的新產品服務發布會,無不以安全保障為大前提,事關新科技無不應用大數據。

Trust is 'gold' in digital age。在AI驅動的數碼化新世代,誠信要比黃金重要,誠信讓大家接受大數據的開放使用,我們便得以建設明天更高效的社會經濟。昨天的智能手機比半個世紀前太空總署電腦系統更強大;今天大數據配合AI的應用功能,個人可以比總統還要醒目。例如在完美的智慧城市中,接上互聯網你會知哪裡塞車、房屋有幾多空置、土地有幾多可供使用、孩子在學校這幾天的學習進度如何,哪科強哪科弱…

期望2019年是香港「大數據煉金術」的奇妙一年。




黃秉華

** 博客文章文責自負,不代表本公司立場 **