大數據的迷思

理財資訊 12:15 2019/01/22

分享:

今時今日在職場打滾,必定要認識「大數據」一詞,甚至要懂「大數據」是一個什麼概念。有人認為「大數據」只是一地歷史數據,沒太大意義。但另邊廂也有認為,憑著「大數據」可預測未來發展,有趨吉避凶之效。

香港有俗語云「有早知,無乞兒」,言下之意,是「早知(預知)」是沒可能的,否則便人人富貴。

偏偏人人都想要預知未來,農曆新年將至,一眾風水運程書紛紛出籠,教你在新一年如何趨吉避凶,每年的銷量還相當不錯。

有說中國風水命理始祖《易經》,其八八六十四卦便和數據學有一定關係。事實上,利用數據來推斷未來一直存在。統計學告訴我們,只要有一定數量的sample size,便能在指定範疇內評估有甚麼事情發生。

看似無關事物 建立聯繫測未來

在我讀書的時候,取得幾百或者上千個數據已經相當厲害。然而在大數據的世界中,幾千萬甚至幾億的數據都能輕易處理,通過海量的數據分析,我們能夠在看似無關的事物之間建立聯繫,從而預測未來的走向。

大腸癌多年來都是城市頭號癌症殺手,香港自然亦不例外。以往醫學界對大腸癌的成因沒有一致推斷,不過,去年香港中文大學便透過分析6個國家及地區、合共逾1億人口的大腸癌發病趨勢,推斷出大腸癌患者有年輕化的趨勢,而出現原因可能與城市生活習慣有關。

政府資助的「大腸癌篩查計劃」去年宣布將擴展至50至75歲及沒有徵狀的香港居民,明顯是針對人口老化及患者有年輕化趨勢,畢竟早發現及治療,除患者痊癒機會大增,亦減少了社會的成本以及患者及其家人的財務和情緒負擔。除了大腸癌之外,在其他病症上能否活用大數據作出推斷,並就此在醫療資源及政策制定上加以配合,都是政府需要深思考慮的。

預知未來的目的,無非是想生活過得更好。若能利用海量的大數據,就各種因素進行統計、計算、分析,相信足以趨吉避凶,為未來打造出一個好運程。

不過,如果有自稱風水師的人告訴你:「我真實身份其實是一個數學家,還可以用大數據來推斷你的運程。」我看還是招搖撞騙居多。

撰文 : 黃岳永 香港科技大學副教授兼高級顧問(創業)

欄名 : 科技解碼

緊貼財經時事新聞分析,讚好hket Facebook 專版