Posts Tagged ‘data science’

品味:Nate Silver 的《精準預測》

September 6th, 2013

精準預測

歡迎來到每週一次的「品味」專欄,在這裡,我分享我所看到的種種美好。

2008 年美國大選,Nate Silver 以精準預測 50 州中共 49 州的總統選舉勝負,並且完全命中全 35 席參議員當選人而一戰成名,成為北美政治圈炙手可熱的分析大師。但在那之前,他專精的並不是政治,而是棒球。事實上,Nate 對於統計與預測的研究也不僅止於球與票,舉凡氣象、地震等諸多值得用數據去深究的領域,他都有所涉獵。

2012 年,Nate 出版 The Signal and The Noise 分享他如何處理這些看似非常不同的領域,用清楚的模型與哲學去拆解它們,抓住事件發展的脈絡。 The Signal and The Noise 一出,立刻在北美熱賣,同時登上紐約時報與 Amazon 的年度暢銷榜。而事隔一年,我們終於可以在台灣享受到它的繁體中文版《精準預測》。

在三采的邀請下,我有這個榮幸幫這本相當有時代意義的大作寫了篇中文推薦序,今天的品味專欄,就跟你們分享這本值得大家用心體會的好書。

揭開「預測」的神祕面紗

文 / 林之晨

在紐約大學史騰商學院攻讀 MBA 時,我的統計學教授送了一句我永生難忘的話,他說:「無論統計的結果如何,如果你沒辦法找到它背後的道理,那就代表這次的分析出了問題。」

換句話說,統計是一種用來印證道理──也就是事物間因果關係──的工具。當事物之間有某種因果時,統計可以協助你發現並且驗證這樣的關係,進一步預測這個因果再次發生的機率。相反的,如果事物之間缺乏真實的因果,則無論時統計之後得到任何結論,也只是數學上的巧合罷了。

讀 Nate Silver 的這本《精準預測》,讓我不斷想起了教授的話。

雖然一般公認 Nate 是數據分析與統計模型的專家,但在這書裡他一路從統計原理講到金融海嘯、棒球、氣象、地震、失業率、傳染性疾病、運動賭盤、西洋棋、德州撲克、市場原理乃至於全球暖化,每一個領域除了關鍵的資料與圖表,他幾乎都能夠明白的闡述「為什麼」這些資料有因果意義,甚至常常進一步去分析造成這些因果背後的人性。

用 Nate 自己的方式形容,他在這本跨越多個時空,厚重且實在的分析報告大彙整裡面,充分展現了他的「狼性」,也就是跨學科、大膽找尋新方法、自我批判,並且以實徵為主的思考與工作方式 (請參照第二章)。

至於為什麼我們該花時間學習 Nate 的工作方式,其中一個很重要的因素是網路與各式連網裝置──包括你手中的智慧手機與平板電腦──的普及,正在帶來前所未有的數據供給成長──僅僅在過去兩年內,我們所產生的資料量就佔據了人類史上所有資料量的 90%。

因此,就像 Nate 說的一樣,當你需要預測某個事件在未來再次發生的機率,尤其當這件事將會攸關國家安全、民眾健康、經濟發展、或是企業存亡等關鍵狀況時,從茫茫資料海中抽絲剝繭,找到那些關鍵指標的能力,將顯得越來越為重要。

在這樣的一個時代,Nate Silver 的這本《精準預測》更顯得重要,這裡面充滿著現代知識工作者必須了解的種種數據分析觀念與實務技巧,非常值得每個人用心的體會、學習,並且實踐。

延伸觀賞:Nate Silver at Google

___

生活中遇見的美好,我常分享在 Instagram,歡迎追蹤

(Image via 博客來)

以偏概全

September 4th, 2013

We Have Signs

還記得幾年前中油油價很久才調整一次時,每次只要一說要漲,就會有一堆人徹夜排隊要趁「便宜」填滿油箱,當然這「便宜」中間只是幾個銅板的差別,但記者去訪問時他們總是說能省則省。結果現在浮動油價開始實施,汽油一天到晚在漲漲跌跌,多出了更多省錢的機會,但排隊的人卻從此消失了。

這樣行為的背後是人腦非常有趣的一種功能,也就是成語說的「以偏概全」。當一個因果關係極少在我們周遭發生時,我們的大腦會很有信心的把這極少的採樣拿來擴大解釋成通例。生活中最常發生的例子就是「星座」,朋友中有三個金牛座的人,剛好動作都很慢,我們會很有信心的說「金牛座的人動作都很慢」。但對統計學稍有研究人就會知道,至少要採樣 30 個以上的金牛座朋友,才能這麼有信心的發表這個聲明。(如果你真的採樣了 30 個金牛座朋友與 30 個非金牛座朋友,很有可能會發現兩個群體間動作快慢的差異幾乎為零。)

所以回到中油的例子,當我們的記憶中只有一、兩個中油漲價的印象時,大腦會把它拿來擴大解釋成中油永遠在漲價、不停的在漲價,所以即使理性知道只是幾十塊的差別,很多人還是無法抗拒那種「現在不去以後會虧更多」的衝動。而後來改成浮動油價,我們的大腦裡多了許多漲漲跌跌的訊號,也因此漲價不再是唯一能想起的印象,所以雖然它發生的頻率大大提昇了,但發生時對我們的影響卻大大的降低。

所以這個大腦內建的功能跟創業有什麼關係?

我想首先是對於消費者回饋的反應。很多創業者對於收到消費者極差的產品評價時會有極大的反應,但對於某些功能經常被使用,但後台的數據卻繁多複雜難以輕易分析時,很容易就疏於照料。但事實是,你應該關注的是後者。

一個產品很難討好所有人,所以極差的反應是有可能出現的,只要比例在可以接受的範圍內,你應該要忽略大腦以偏概全的衝動。(當然即使決定了客訴在可以接受的範圍,不需要因此修改產品,你仍應該妥善處理這些顧客的心情。)

相反的,一個經常被消費者使用的功能,無論這功能再怎麼簡單,它就是「市場」認定你產品最重要的價值。因此即使後台的數據再怎麼龐大複雜,你都應該花時間釐清,然後找出可以持續改進的地方。

此外,以偏概全也常常是推廣上很重要的戰術。在網站上顯示出一、兩個滿意客戶的證言,很容易引起潛在客戶以偏概全的反應。在首頁放上幾張正妹照,使用者馬上就誤以為這裡滿滿都是正妹 ── 沒錯,無名的招式。在電商網站放上幾個「銷售一空」的商品圖,也會激起人們不搶不行的衝動。

總而言之,人腦是很有趣的東西,內建了許多特殊的迴路設計。這些迴路有時候可以變成優勢,有時候則會帶來劣勢。身為創業者,多了解它的運作邏輯,我認為,是相當值得投資的功課。

___

歡迎在 Google+ 上追蹤我

(Photo via Rubin Starset, CC License)

©2020 MR JAMIE.
網站由 Allen Hsu 設計 | Logo 動畫由 Wen Chen 完成