加載中........
×

Wilcoxon, Friedman...扒一扒非參數檢驗名稱中的牛人

2019-12-2 作者:鄔娜   來源:醫咖會 我要評論0
Tags: 非參數檢驗  

在很多人看來,參數檢驗似乎是統計方法的“主流”,而非參數檢驗往往被當成“非主流”。大家似乎更喜歡用t檢驗、方差分析這樣的參數檢驗。即使在數據不滿足正態分布的條件下,仍然有使用參數檢驗的執念;總覺得非參數檢驗不夠正式,或者就是不喜歡用。這種對非參數檢驗的偏見和誤解,除了對統計方法的認識不夠深入之外,我覺得非參數檢驗的命名也有一部分責任。

非參數檢驗的名稱大多都很拗口和難記,更別說能完全拼寫正確了。再看看參數檢驗,比如U檢驗、t檢驗,一個字母就搞定了,分分鐘記住。讓我們仔細看看幾個常見的非參數檢驗的名稱,Wilcoxon秩和檢驗、Mann-Whitney U檢驗、Wilcoxon符號秩檢驗、Kruskal-Wallis H檢驗、Friedman檢驗,不難發現,這些都是用發明該統計方法的統計學家名字來命名的。我們就來扒一扒這些非參數檢驗名稱中的牛人。

Wilcoxon秩和檢驗、

Wilcoxon符號秩檢驗

先開扒Wilcoxon秩和檢驗、Wilcoxon符號秩檢驗的發明者——Frank Wilcoxon。他出生于愛爾蘭,很小就和父母移民去了美國。青年時期做過水手、管過煤氣抽送站、當過樹醫,25歲獲得理學學士學位,畢業后在電力公司工作了3年,又考了化學專業的研究生,29歲時獲碩士學位,32歲時獲物理化學博士學位。之后在紐約的博伊斯·湯普森植物研究所,擔任農作物保護高級研究員。在此期間,他對統計學產生了濃厚的興趣。1945年,他在研究中發現,進行兩組連續變量的組間比較時明明差異很明顯,可是用t檢驗和方差分析就是得不出統計學差異。

于是他自己發明了一種統計方法,通過將兩組的值排秩次,比較兩組的秩次總和即秩和來判斷兩組是否存在統計學差異,即Wilcoxon秩和檢驗。他將這個新方法投稿到統計學雜志,只想讓統計學家們幫忙看看是否靠譜并修改。沒想到當時沒有任何一個統計學家考慮到這個問題,于是Frank Wilcoxon發明了該方法,開啟了非參數檢驗的大門。

Frank Wilcoxon在1945年同時提出了Wilcoxon符號秩檢驗,用以解決配對資料組間比較的問題。這位大咖興趣廣泛,精力豐富。會包括吉他在內的幾種弦樂器,精通英文、荷蘭文、俄文、盲文。喜歡騎自行車,經常一天跑160公里。還喜歡爬樹,直到七十多歲時摔了一跤,才減少了這方面的活動。

Mann-Whitney U檢驗

無獨有偶,1947年,奧地利數學家、統計學家Henry Mann和他的學生D.R.Whitney也發明了一種類似的統計方法用以解決這個問題,即Mann-Whitney U檢驗。比Wilcoxon秩和檢驗進步之處在于其解決了兩組樣本量不同的情況下該如何處理,但由于本質上只是Wilcoxon秩和檢驗的線性變換,因此目前認為Wilcoxon秩和檢驗等同于Mann-Whitney U檢驗。

Kruskal-Wallis H檢驗

拗口的Kruskal-Wallis H檢驗,適用于數據不滿足正態分布無法使用方差分析時,三組及以上的獨立樣本的比較,是在1952年由William Kruskal和W. Allen Wallis發明。

接下來就開扒來自天才家庭的統計學天才——William Kruskal。他出生于一個紐約的猶太族家庭,媽媽Lillian Rose Vorhaus Kruskal Oppenheimer創立了美國折紙協會,推廣兒童折紙游戲。家里有五個孩子,William Kruskal是老大,另外兩個弟弟Joseph Kruskal 和Martin Kruskal也都是著名的數學家、統計學家。Kruskal算法、Kruskal重構樹等等,好幾種方法都用他們的姓氏命名,真是長臉。

和他合作發明Kruskal-Wallis H檢驗的另一位大咖,是W. Allen Wallis。他出生于美國費城。1933年進入芝加哥大學讀研究生,在這里結識了之后的著名經濟學家、統計學家Milton Friedman,也就是Friedman檢驗的發明者,開始了一生的友誼。牛人的朋友也都是牛人。之后W. Allen Wallis擔任羅切斯特大學校長,更牛的是他先后擔任了艾森豪威爾、尼克松、福特、里根四任美國總統的經濟學顧問。

Friedman檢驗

Friedman檢驗,是檢驗三組及以上的相關樣本或隨機區組設計的組間差異的非參數統計方法,它的發明者則是大名鼎鼎的美國經濟學家Milton Friedman。1976年獲諾貝爾經濟學獎,以表彰他在消費分析、貨幣供應理論和穩定政策復雜性等范疇的貢獻。是芝加哥大學教授、芝加哥經濟學派領軍人物、貨幣學派的代表人物。

關于非參數檢驗

扒了這么多,這些牛人其實解決的都是一個重要問題,即當數據不滿足正態分布時該怎么辦。而現實中的很多數據都不服從正態分布,這時候非參數檢驗的統計學效能要高于參數檢驗。

并且,非參數檢驗更加穩健。參數統計方法是建立在嚴格假設條件基礎上,一旦假設條件不符合,其推斷的正確性就不存在了。非參數檢驗帶有最弱的假設,對模型的限制很少,因而天然的具有穩健性。希望通過這篇文章,大家能對非參數檢驗有了不一樣的認識。



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

只有APP中用戶,且經認證才能發表評論!馬上下載

web對話
乒乓球