WFU

網站頁籤

2017年2月27日

讀《統計學的世界》走出迷茫

    

    
    我們正活在一個充滿數據的時代,媒體、廣告、新聞、各種簡報... 我們每天一睜眼就得接收海量的訊息。而這些數據究竟可不可信?統計學就是一把專門用來解開迷霧的鑰匙,不管你是工作所需,或者是關心某個議題,掌握統計學的基本觀念,就能判斷數據透漏了何種訊息,以及數據的品質如何。

    這是一套非常不像教科書的教科書,作者用極度淺白口吻來幫助讀者建立統計學裡面的一些重要的基本概念。任何一項統計研究中最重要的事,就是數據的來源,而這也是統計上最容易犯錯的地方,作者用了近三分之一的篇幅來告訴我們甚麼是好數據跟爛數據 (如:現場call in,facebook上的投票等等)。書中例題只使用很簡單的算術,目的是要讓讀者重心放在觀念的建立,而不是繁複的計算(作者云:那是電腦的工作)。每個段落作者都會非常清晰直白的總結,並且邀請你用「白話文」再去跟身邊不懂統計的朋友講解剛學到的內容,確定你真的有把觀念弄清楚。

    讀完這套書收穫十分巨大,糾正我很多錯誤的觀念,也讓我對統計方法有更深刻的了解。回想寫第一篇SCI論文的時候,當時我的統計學概念還很粗糙,找不到人問,幾乎是一邊google一邊研究,把數據一股腦兒丟進去統計軟體,東湊西湊,就是為了要弄出一個p <0.05。看完書,再回去看自己作品統計上的瑕疵,一方面感到汗顏,卻也知道自己的觀念真的是進步了。

    除了數據的重要性,最有感的是最後幾章有關統計推論的內容。一般的數據分析(ex. 找相關係數、迴歸線)跟正式的統計推論不可混唯一談,任何推論方法都只能在正確的架構下應用,要符合隨機樣本隨機化實驗。一旦錯誤的運用這些方法,就只是把數據當成簡單隨機樣本在處理,實際上我們經常不可能真正從母體抽出簡單隨機樣本,推論出來的結果自然可性度大打折扣。這個例子再次提醒我們數據的來源很重要,再好的檢定方法也救不了爛數據

    統計學 (Statistics) 是門利用研究樣本來了解母體的學問。母體就是這個世界,它太過複雜,且充滿變異,即使對同一個體多測量幾次,得到的結果也會不一樣。統計學的世界裡沒有100%的真相,又或許帶點朦朧的不確定性才是世界的本質。最後,請記得,不是每件重要的事情都可以簡化成數據;會把所有事情簡化成數據的人,都受到了各種壓力的影響,不管是有意或無意的。