P A G E: 1 2 3 離散型檢定方法 連續型檢定方法 結論

        承續上頁 ,檢定資料是否夠趨近常態分配有多種方法,各有其適用情況及優缺點。我們將介紹Shapiro&Wilk (1965), Cramér& von Mises(1928~1930), Lilliefors(1967), Pearson(1900), Kolmogorov & Smirnov(1933), Anderson & Darling(1952)等人提出的檢定方法,及中央極限定理;我們由連續型與離散形的分配中,分別選擇一種分配,對這些方法進行探討。

        我們過去所說的樣本數其實容易對『資料個數』與『抽樣個數』造成混淆,抽樣個數指的是從某母體抽出n個樣本,從這n個計算出1個樣本平均數,而這樣本平均數也就是我們所謂的資料個數,重複N次樣本抽取,可得N個樣本平均數,再將這N個平均數用我們模擬後選定的常態檢定方法做分析,重複模擬1000次,判斷其分配型態是否夠接近常態分配(p-value=0.1將在下頁探討),而當n夠大時,其分配越接近常態分配。

        一開始我們必須利用模擬選定所需要的N大小與後續的檢定方法將其固定以利後續作業,模擬結果連續和離散分配中我們分別選擇較於近似常態分配的T分配和Bin分配,對於Shapiro等人所提出的方法(以下以shapiro、ks、ad、Pearson、cvm、lillie、sf表示) 進行檢測,進而發現其中在”T分配”裡樣本組1000的情況下,以ks檢定較為穩定,而離散”Bin分配”則以shapiro檢定較為適合,因此我們將連續以及離散型分配分別以ks檢定和shapiro檢定進行各分配模擬,而資料個數則以30較為適當,最後為常態分配進而標準化而達到目的,目的是要了解在各分配中需要的樣本數該為多大自由度該為多少才能讓分配檢定為常態,在一個複雜的data中為了能讓答案透明化就必須用以常態分配標準化查表。

P A G E: 1 2 3 離散型檢定方法 連續型檢定方法 結論