解析古典統計 (Frequentist)與貝氏統計 (Bayesian)之爭
古典統計 ( Frequentist ,又稱頻率統計)與 貝氏統計 ( Bayesian )之戰在學界延續了數十年,而一直以來,古典統計的理論與應用主宰著世界。我們在學校所學到的統計課程,以及實際在產業界的統計應用,大多都依循著古典統計的框架而走。在過去的年代,因為古典統計太過強勢,甚至讓許多使用貝氏的學者不敢承認自己信仰貝氏。鄉野傳說在1960年的美國總統大選時,統計學家John Tukey和他的團隊成功以貝氏統計的方法,搶先預測出John F. Kennedy能夠勝選成為總統,但Tukey本人抵死不認自己是貝氏學者,而他的團隊也絕口不提當年預測的細節。 基礎的不同 那麼古典統計和貝氏統計究竟是差在哪裡呢?一般貝氏統計的根基—貝氏定理,都會在高等統計學或是機率論的課程中提到,但兩個系統的箇中差異,即便是統計系出生的學生,也不見得全部知道。其實,古典統計和貝氏統計在爭的,就是兩者對於「 機率 」 ( probability )的運用上,有著最直接的不同: 對古典統計來說,族群 母數 ( parameter ,又稱參數)雖然未知,但是是一個定值。我們無法直接得知該母數的真實值,但可以透過對族群「 抽樣 」 ( sampling ),用以「 估計 」 ( estimate )該母數與「 推論 」 ( inference )該族群。對於古典統計而言,機率只會在抽樣的動作下才會有所意義。 對貝氏統計來說,任何未知的數值都可以用機率分布的概念去配飾之,而這個未知的數值,當然也可以包含未知的族群母數。相較之下,古典統計認為母數是一定值,自然也不會運用機率的概念去描述該母數。 還是有些霧煞煞?沒關係,直接用例子來作演繹: 假設我們今天想要知道某所大學內所有男學生的平均身高,姑且稱之為$\theta$。第一步我們假設男學生的身高服從常態分佈。再來,我們假設該常態分佈的族群變異數$\sigma^2$已知,所以我們僅需要關注平均數就好。 古典統計學家的回答 針對這樣的問題,古典統計學家會這樣回答: 我雖然無法得知該所大學男學生平均身高的真實數值,但我能夠確定的是他是一個定值。我可以作的事情,是透過對男學生抽樣,算出樣本的平均數$\hat{\theta}$來估計該大學男學生的平均身高。我可以利用機率描述$\hat{\theta}$,但我無法利用機率來...