近兩星期,大數據(big data) 在香港被熱烈討論起來。 網上流傳的「社會信用體系」,及香港逐步落實的人工智能CCTV及街燈系統,引起了大眾,對私隱安全的關注。事實上,這兩項的技術都離不開大數據。到底,大數據是什麼時候開始流行,與你又有什麼關係?

 

2009年嶄露頭角

在2009年,全球出現了一種新型的病毒H1N1。這種病毒結合了禽流感及豬流感,傳染力極高,引起了全球衛生機構的關注。甚至有病毒學家提出,這場流感的大爆發是無可避免。公共衛生機構嚴陣以待,守護人類健康的防線。但遇到的難題是,他們無法有效得知流感傳播的範圍及程度。

美國的疾病管制局有嚴格的流感傳播機制,但是人口稠密的城市傳播速度極快,變數又大,民眾受感染後又可能過幾天才求醫,通報機制根本追不上速度,令疾病管制局處於非常被動的位置,情況很不利。

是這種危機下,事情終於出現轉機。Google表示它們的系統,能有效提供更準確、即時的疾病資訊,令疾病管制局有效控制疫情。

Google的系統原理是,記錄及追蹤美國民眾在網路上的搜尋行為,找出受到感染的人、發生的地區及時間。Google每日都會接受到至少30億的搜尋,他們首先選出最常使用的頭5000萬個搜尋關鍵字,再比對2003年至2008年間的疾病傳播資料,便能精準定位疾病的傳播情況。於是,疾病管制局就獲得了準確、即時的資訊,甚至能預測流感傳播的範圍及速度。

 

巨量資料

就這樣,大數據在09、10年嶄露頭角。過去曾經有人作出類似的數據分析,不過獲得的數據不夠即時,數據量亦非常細,不能作出有效預測。在互聯網的年代下,無論是手機、電腦,每日產生的數據量是前所未見。Google每日要處理至少24PB的數據(1PB=1000TB),Facebook每日收到30億個讚,Twitter每日有過4億的貼文。

世界產生的數據量,是一個天文數字,亦正正因為這種的數量的龐大,讓我們開始有了準確預測的能力。

 

大數據的應用

大數據最廣泛的應用,是零售業。Amazon、淘寶、天貓、Netflix能夠準確預測推薦你可能想購買的商品,因為他們能從手頭上的巨量數據,找到Pattern。

 

即使你不愛網購,你也無法脫離大數據。社交媒體亦使用這種技術,為你推送符合你口味的內容。例如Youtube,首頁就會列出你可能喜歡的短片,Facebook會將你感興趣、關注的貼文優先推送。在不知不覺間,大數據早就成為了我們日常生活的一部分,它本來不是什麼洪水猛獸,它令我們生活更加便利,人與人、人與物間的配對更準確,能在危機未發生前,提前做好防範。

然而,一把刀,會有兩面。到2017年,全中國,具備人工智能的監控鏡頭至少有二千萬個,這些鏡頭互聯互通,信息共享,連接著大數據系統。

 

「Big Data」這個字,是在2013年正名的。牛津英語詞典在當年正式介包含了這個詞。來到2019年的香港,具備人工智能的CCTV燈柱已經在九龍灣、觀塘、啟德實裝。香港研究資助局剛剛批出2億撥款,助大學研究利用大數據,預防災害發生。我們的城市,距離全面大數據,可能只是一步之遙。

對零售科技趨勢有興趣的讀者,不妨Follow我們的專頁,我們會繼續將最新資訊推送給大家。Chinetek CRM & Big Data