又稱變異數分析,由英國統計學家費雪(Ronald Aylmer Fisher, 1890-1962)提出。
方法
(獨立)多樣本平均數差異檢定(或稱變異數分析) ANalysis Of VAriance(ANOVA)
使用時機
當資料中樣本數較大時(通常以樣本筆數≧30為區分標準)。
當資料中包含多組樣本(三組以上之樣本),且欲了解多組樣本間母體平均數是否有差異。
備註
當資料中樣本數較小時(樣本筆數<30)、包含多組樣本(三組以上之樣本),且欲了解多組樣本間母體中位數是否有差異,可使用(獨立)多樣本中位數差異檢定Kruskal-Wallis test 進行分析。
母體中位數經常和平均數一樣, 因此檢定中位數差即檢定平均數差。
本方法使用之R相關套件與參考文獻:
相關套件: stats、base 、car、asbio
參考文獻:(依套件名稱排序)
R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
John Fox and Sanford Weisberg (2011). An {R} Companion to Applied Regression, Second Edition. Thousand Oaks CA: Sage. URL:http://socserv.socsci.mcmaster.ca/jfox/Books/Companion
Ken Aho; many thanks to V. Winston and D. Roberts (2013). asbio: A collection of statistical tools for biologists. R package version 1.0. URL:http://CRAN.R-project.org/package=asbio
範例A-11:新藥效益的分析
藥物對於國人來說使用率可說是非常的高,從日常容易罹患的感冒、發燒、輕微皮膚疾病及足癬等,還有各種慢性病到嚴重的各種急症及致命的癌症等。藥物種類有內服與外用,顆粒、膠囊與藥膏、藥布等,還有較特殊者需以針筒注射等各種不同型式的藥品。雖然有這麼多的藥品種類,但對於藥品的使用與上市,事實上是非常的嚴格的,必須經過多次的動物與人體試驗及相關單位的審核及檢驗,才能得到上市的許可。在國內,由於工作與經濟上的壓力,失眠已成為大多數人的夢靨,根據我國睡眠學會統計,全國有超過200萬人睡不好,而健保局統計,國人一年吞掉13億顆具有安眠或鎮靜效果的藥丸,安眠藥已經是國內藥物濫用榜排行第三的藥品【服用藥物請遵循醫師指示】。而此問題正代表著安眠藥具有廣大市場,因此引起某藥商的注意,想引進一款最新的安眠藥,實行一系列的人體試驗,在這試驗中廠商準備了三組受試者,每組各有40人,第一組使用廠商引進的新藥物,第二組則是使用坊間最受歡迎的藥物(稱為舊藥物),最後一組則是給予安慰劑。在使用藥物後記錄每個受試者自服藥後到入眠的時間長短(單位:分鐘),所有受試者的資料列於表中。
受試者編號
1
2
3
4
...
38
39
40
第一組(新藥物)
22
18
12
8
...
32
19
14
第二組(舊藥物)
29
34
31
20
...
19
13
45
第三組(安慰劑)
35
39
25
26
...
31
26
31
Q3:
為了確認安眠藥的藥效,廠商在人體試驗時將安慰劑一起加入,以避免受試者因心理作用而產生錯誤的結果,跟其他兩組比較,新藥是有效的嗎?
問題解析 :此處要了解3種藥物的藥效是否有差異,需將新藥物、舊藥物與安慰劑服用後的入眠時間做一比較,討論問題"使用三種藥物後的入眠時間是否有差異?"。
統計方法 :此問題中,變數為受試者的入眠時間,為單一變數(一個變數,建議選擇
單變數分析 );藥物共有三種可視為有三組的資料,樣本數40大於30;三組受試者之間並無關聯,為獨立樣本;可採用分析方法:(獨立)多樣本平均數差異檢定(或稱變異數分析)(ANalysis Of VAriance, ANOVA),檢定"使用三種藥物後的入眠時間是否有差異?"。
解析:
1. 此題可建立虛無假設為"使用三種藥物後的入眠時間無差異",即H0: μ
新藥物 = μ
舊藥物 = μ
安慰劑 。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
(獨立)多樣本平均數差異檢定(或稱變異數分析) - 分析結果
分析方法: (獨立)多樣本平均數差異檢定(或稱變異數分析)
資料名稱: 範例A-11
檢定變數: _NEW_
分組變數: _GROUP_(新藥物, 舊藥物, 安慰劑)
顯著水準: 0.05
計算時間: 1.369秒
樣本敘述統計量I :
變數名稱 Variable
分組變數(_GROUP_) grouping variable(_GROUP_)
樣本數 Count
平均數 Mean
中位數 Median
最小值 Minimum
最大值 Maximum
標準差 Std. dev.
_NEW_ 新藥物 40 18.925 18 8 46 8.7512 舊藥物 40 32.225 33.5 11 65 11.0998 安慰劑 40 35.425 33 17 72 10.8578 不分組(Total) 120 28.8583 29 8 72 12.4734
I:樣本敘述統計量皆不包含遺失值
檢定變數與分組變數盒鬚圖:
模式摘要:
判定係數 R2
33.08 %
調整判定係數 Adjusted R2
31.94 %
檢定變數平均數 Mean of responses
28.8583
殘差標準誤差 Residual std. err.
10.2905
多樣本變異數(標準差)差異檢定I :
虛無假設: 各母體的變異數相等H0 : σ1 2 = ... = σ3 2
變數名稱 variable
F檢定統計量 F-statistics
分子自由度 d.f. of numerator
分母自由度 d.f. of denominator
臨界值 F(d.f.1,d.f.2,1-α)
p-值II p-value
_NEW_
1.0533
2
117
3.0738
0.35207
I:分組變數為_GROUP_
II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1
變異數分析I :
虛無假設: 各母體的平均數相等H0 : μ1 = ... = μ3
來源 source
平方和 sum of squares
自由度 d.f.
均方和 mean square
F檢定統計量 F-statistics
臨界值 F(d.f.1,d.f.2,1-α)
p-值II p-value
處理 treatment
6125.067
2
3062.533
28.9209
3.0738
6.2247e-11 ***
誤差 error
12389.52
117
105.8934
總和 total
18514.59
119
I:分組變數為_GROUP_
II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1
對比係數I 矩陣:
I:與控制對比,控制組:新藥物
對比檢定:
對比 contrast
估計值 estimation
標準差 std. err.
t檢定統計量 t-statistic
p值 p-value
(Intercept) 18.925 1.6271 11.6314 0 index安慰劑 16.5 2.301 7.1707 0 index舊藥物 13.3 2.301 5.7801 0
殘差分析:
殘差常態分配假設檢定
虛無假設: 殘差服從常態分配
W 檢定統計量I W-statistic
p 值 p-value
0.9665
0.0044
I:Shapiro-Wilk常態性檢定法殘差變異數齊一性假設檢定
虛無假設: 殘差變異數具齊一性
卡方檢定統計量I Chi-square statistic
自由度 d.f.
p 值 p-value
2.1358
1
0.1439
I:Breusch-Pagan檢定法殘差獨立性假設檢定
虛無假設: 殘差之間互相獨立
一階自我相關 1st order autocorrelation
D-W 檢定統計量I D-W statistic
p 值 p-value
0.2839
1.431
< 1e-04
I:Durbin-Watson檢定法殘差分析圖
多重比較(分組變數為_GROUP_):
LSD 差異 Difference 95% 信賴區間 修正P-值 Adj. p-value 下界 Lower 上界 Upper 安慰劑-新藥物 16.5 11.94296 21.05704 0 安慰劑-舊藥物 3.2 -1.35704 7.75704 0.16696 新藥物-舊藥物 -13.3 -17.85704 -8.74296 0
Bonferroni 差異 Difference 95% 信賴區間 修正P-值 Adj. p-value 下界 Lower 上界 Upper 安慰劑-新藥物 16.5 10.91109 22.08891 0 安慰劑-舊藥物 3.2 -2.38891 8.78891 0.500876 新藥物-舊藥物 -13.3 -18.88891 -7.71109 0
Tukey 差異 Difference 95% 信賴區間 修正P-值 Adj. p-value 下界 Lower 上界 Upper 安慰劑-新藥物 16.5 11.03759 21.96241 0 安慰劑-舊藥物 3.2 -2.26241 8.66241 0.34906 新藥物-舊藥物 -13.3 -18.76241 -7.83759 0
Scheffe 差異 Difference 95% 信賴區間 修正P-值 Adj. p-value 下界 Lower 上界 Upper 安慰劑-新藥物 16.5 10.79482 22.20518 0 安慰劑-舊藥物 3.2 -2.50518 8.90518 0.383236 新藥物-舊藥物 -13.3 -19.00518 -7.59482 0
Dunnett 控制組:新藥物 差異 Difference 95% 信賴區間 下界 Lower 上界 Upper 安慰劑-新藥物 16.5 11.347779 21.652221 舊藥物-新藥物 13.3 8.147779 18.452221
分析結果建議: 由於檢定結果P-值(6.2247e-11) < 顯著水準0.05,因此可拒絕虛無假設。