機械人預測世界盃

社會事

機械人預測世界盃

2014年07月16日 18:00 最後更新：18:02

巴士的點評

昨天講到政客專家預測政治事件如何偏頗，今天應該講講預測準繩的例子，就講講世界盃的預測吧。

世界盃開賽前，有財經網友問我估那一隊贏，我話無乜心水，夾硬估就估德國啦。哈，結果真係德國奪標! 但我並不是想吹噓自己估得準確，我不是球迷，亦無研究，只是靠估而矣，估中運氣成份大於一切，唯一可堪足道的是我知道自己唔識，全無信心，而標準球迷估那一隊奪魁，反而信心滿滿。

微軟的個人語音助手Cortana預測巴西世界盃的賽果是15場估中、只有1場估錯，戰跡輝煌。微軟對世界盃的預測考慮眾多因素，包括比賽歷史、地理位置、草地、天氣、群體預測智慧，再參考博彩市場、民意調查、社交媒體資料，加上歐洲有名的賭彩指數Betfair指數，來構築預測模型，大數據味道十足。不過微軟的Cortana機械人預測賽果時也會考慮主場優勢，結果在季軍戰巴西對決荷蘭中認為巴西會取勝，她就是在這一場留下了汚點。

科技界另一巨頭谷歌也有玩這一個遊戲，但它參考的數據不一樣，它從Opta Sports的資料中，找出各足球聯賽和世界盃分組賽中球員的表現，引入了實力排行榜系統，用來推測各隊球員在世界盃的表現，亦有考慮主隊優勢，結果在16強入8強，以及8強入4強的兩輪比賽，在12場預測中有11場正確，但在8強賽最關鍵的德法決戰時預測錯了，這個錯誤比微軟大，因為最後德國拿冠軍啊。

雅虎也有玩這個預測遊戲，但它的焦點在於博客文章，認為在微博Tumblr上所有世界盃的討論都是價值的資訊，雅虎的科研小組就從831億篇Tumblr微博客中篩選出1.9億篇文章，再將注意力集中在2730萬篇與世界盃相關的博文，利用概率論中的「泊松分佈」來估計每一支隊伍的入球數。你唔好俾呢啲名詞嚇倒，雅虎預測唔係幾掂，佢估西班牙將擊敗荷蘭，而最後的冠軍是巴西，可惜西班牙和巴西都輸到七個一皮，證明雅虎的預測雖有大數據特色，但找錯參考資料，社交網路資料只反映群眾的集體錯誤。

當然傳統估計就更弱，可以以高盛為代表，高盛有全世界最叻的經濟學家和金融分析師，佢用自1960年以來14000場球賽資料，構建出預測模型，是傳統的統計分析，並無大數據的特點，用了證券行傳統的演算模型，佢預測小組賽的準確度只有37.5%，並在世界盃開始前，預測巴西最有可能斬獲世界盃冠軍，奪冠幾率為48.5%，比任何參賽球隊高3倍。甚至估計決賽是巴西將以3比1的比分，戰勝宿敵阿根廷，錯到有啲無譜。

從幾個世界杯預測中可見，傳統預測不及科網時代的大數據預測，但找大數據都要找對數據作為參考，更重要的是命中率最高的微軟研究院並無成見，不斷用上一場賽果修正對下場比賽的預測。微軟早期預測仍然可以錯得離譜，佢地早在去年12月聲稱開發了一款Excel軟體，用大數據來預測2014年世界盃，結果估計巴西贏冠軍，取勝率達到22.5%，後來以巴西7比1輸俾德國，證明呢個預測差距都幾遠。

機械人預測的一個優勢是沒有偏見，而不會因為期望一件事情出現，而主觀地排斥其他可能性。任由偏見引領去行動，危險極大。

盧永雄

往下看更多文章

箭豬與狐狸

特區政府公開政改諮詢報告，睇落「唔係太激」。既未否決公民提名，也無提出提名委員會過半數提名特首候選人的方案，看來要做醜人，提出這些不受觀迎建議，要由阿爺來做。

聞說阿爺的確會做醜人，在8月底的人大常委會會議中，既將否決公民提名，又確立提委會多數提名特首候選人的方案，所以如今未到戲肉。佔中發起人看着政府這份模菱兩可的報告，即使想佔中都搵唔到理由; 但睇完人大常委會的決議時，就想唔佔中都唔得啦。

這是一種曬冷的賭局，阿爺擺硬，佔中派發動群眾亦擺硬，大家硬碰硬。這亦是一種勝者全取的賭局，你贏就是我輸，沒有雙贏。若然比較雙方取勝機會，挑明來講，上街抗爭的群眾取勝機會不高，並不如發動者所說只要上街佔中就可以逼使阿爺讓步那樣簡單。

若香港是一個獨立國家，好像埃及、烏克蘭、泰國那樣，只要街頭的反對運動搞得夠激烈，社價分裂，軍人倒戈，政府就會倒台。但香港只是中國底下的一個特別行政區，軍隊也是中央派來的，香港搞到幾亂都好，只要阿爺企硬唔郁，香港特首都換唔到。我講呢啲，恐怕又有人批評我「扮中立，無良心」。但倒過來說，明明見到人撞頭埋牆而不警告，又是否有良心的行為?

很多人將立場和分析混淆了，在人家分析事物時，會話人「無立場」。殊不知帶著立場看事物，很多時是一葉障目，看不到眼前一座大山。8月底之後佔中群眾上街很可能觸發衝突，香港要付出了慘痛的代價，最後亦可能無法逼使阿爺實施百分之百的普選，這個結局已經不是很令人意外的黑天鵝事件，而是房間中的大象，只是不想見到大象的人，選擇不去見到而矣。

曾在美國加州大學柏克萊分校擔任心理學與政治學教授的菲力浦•泰特洛克(Philip Tetlock)發現，政界和學界的專家，預測各類型政治經濟事件都經常大錯特錯，泰特洛克研究了80年至90年幾乎所有重大事件，寫了《專家的政治判斷》(Expert Political Judgement)一書，發現那些政界和學術界專家，他們的估計比隨機亂估好不到那裏，他們太過自負，太過一廂情願，算起機率時其差無比。

泰特洛克將多數預測失敗專家和少數成功預測的專家分類，多數經常估錯的專家是「箭豬型人格」的人，他們有「偉大的想法」，相信世界有物理定律般的法則，馬克思的階級鬥爭、佛洛依德的潛意識，都屬此類。另一類估計較準確的專家，是「狐狸型人格」，他們是雜亂無章的生物，相信許多小想法，對問題可以用各種類型的手段來處理，他們能包容差別和異議。他們比較不用意識型態的眼光看事物，不把蘇聯看成邪惡帝國，只看到她的本來樣貌:「一個運作不良的國家」。

在政改問題上，若我們想爭取最大限度的民主，箭豬型的人物會帶你去死衝，還說這樣衝一定可成功。狐狸型的人物很擔心事件中的不確定性，特別是群眾上街和阿爺硬碰下的各種變數，反而會尋求和阿爺談判，在可能範圍內避開對決。那一條路好，請大家深思。

盧永雄

你或有興趣的文章

機械人預測世界盃