雲端資料分析暨導引系統

首頁 » 分析方法 » (成對)雙樣本平均數差異t檢定

(成對)雙樣本平均數差異t檢定
Two-sample t-test for paired data

方法簡介
範例A-1(2)
影音教學
維基百科(英文)

由英國統計學家戈斯特(William Sealy Gosset, 1876-1937)提出，student為其筆名，亦稱學生t(student t)檢定。

方法	(成對)雙樣本平均數差異t檢定(Two-sample t-test for paired data)
使用時機	比較資料中兩兩成對樣本的差異（如：減肥前體重與減肥後體重），且資料之樣本數較大時（通常以樣本筆數≧30為區分標準）
目的	計算兩兩成對樣本的差異值，並檢定此差異值資料的母體平均數是否大於、小於或等於某一特定數值。
備註	當資料中樣本數較小時(通常以樣本筆數<30為區分標準)，可使用(成對)雙樣本中位數差異檢定(Wilcoxon signed-rank test)檢定中位數差。母體中位數經常和平均數一樣，因此檢定中位數差即檢定平均數差。

本方法使用之R相關套件與參考文獻：
相關套件：stats、base
參考文獻：(依套件名稱排序)

R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL：http://www.R-project.org/.

範例A-1：蜥蜴生長的研究

生物多樣性對於人類來說是一個重要的議題，地球上的物種豐富，各種的動植物都有，1992年聯合國在巴西的地球高峰會議通過『生物多樣性公約』，因此生物多樣性的議題受到了全球的關注，而保育的觀念也慢慢的深植於人心。某亞洲國家地處於亞熱帶與熱帶之間，四季溫暖氣候宜人且雨量充沛，在峻嶺高山中蘊含著豐富的物種。但由於高度的經濟開發與都市建設，許多物種的棲息地被破壞殆盡，造成野生動植物數量大量減少，甚至於消失殆盡，有鑒於此，許多動物保育學家需至山林裡從事動物保育的工作，以避免一些特有品種絕種。蜥蜴是日常生活中在野外常常可見的小型爬蟲類，非常的不起眼，但是蜥蜴可說是自遠古時代即存在的物種，因此引起許多的動物學家的研究興趣。有一位保育學家對於研究該國特有種的短肢攀蜥相當熱衷，想了解該物種的生長速度，花了兩年的時間在中海拔的山區量測該品種蜥蜴的身長並記錄之，第一年補獲的蜥蜴共50隻，每隻皆記錄身長並於身上加以編號後放生，並於第二年再記錄這群蜥蜴的身長，兩年前的記錄顯示該地區該品種蜥蜴的平均身長為18公分，而一年前與今年所測量的資料共有50筆列於表中。

編號	1	2	3	4	5	...	48	49	50
第一年身長	18.5	23	20.6	19	16	...	22	20.3	18.4
第二年身長	19.4	23.5	20.9	21.2	17.5	...	22.8	23.3	21.1

Q2：因為第一年與第二年所記錄的蜥蜴皆為同一群體，可確知第二年的蜥蜴平均身長不會小於第一年。根據保育學家的經驗，該品種蜥蜴每年可成長2公分，保育學家想了解此組蜥蜴的資料是否也如此，該如何分析呢?
問題解析：直接比較第一年的平均身長與第二年的平均身長是否差異達2公分，因為第二年的平均身長必定大於第一年，故可討論"第二年的平均身長減去第一年平均身長是否大於2公分?"。
統計方法：此問題中變數為蜥蜴身長，為單一變數(一個變數，建議選擇單變數分析)。資料須比較第一年與第二年身長故樣本數二組，且需成對比較；另此份資料樣本數大於30筆，可採用分析方法：(成對)雙樣本平均數差異t檢定(two-sample t-test for paired data)，檢定"第二年的平均身長減去第一年平均身長是否大於2公分?"。此處需注意，因為每一隻蜥蜴皆有第一年與第二年的身長資料，此種資料的記錄方式稱為成對，故此時分析需注意資料須被"成對"使用，無法將資料分開討論。

解析：
1. 此題可建立虛無假設為"第二年的平均身長減去第一年平均身長小於等於2公分"，即H0： μ_{第二年身長}- μ_{第一年身長}≦2。
2. 建立資料檔上傳，檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果： two sample paired t test

(成對)雙樣本平均數差異t檢定 - 分析結果

分析方法：(成對)雙樣本平均數差異t檢定
資料名稱：範例A-1
變數名稱：第二年身長 - 第一年身長
顯著水準：0.05
檢定平均數差異：2
檢定方向：右尾檢定
計算時間：0.174秒

樣本敘述統計量^I：

變數名稱
Variable 樣本數
Count 平均數
Mean 中位數
Median 最小值
Minimum 最大值
Maximum 標準差
Std. dev.

第二年身長 50 20.478 20.9 14.9 24 2.1524

第一年身長 50 18.696 18.9 13.9 23.4 2.6228

I：樣本敘述統計量皆不包含遺失值

雙樣本平均數差異t檢定(成對樣本)：

虛無假設：母體平均數差異 ≤ 2
H₀：μ₁ - μ₂ ≤ 2

變數名稱
Variable t檢定統計量
t-statistics 自由度
d.f. 臨界值
t(d.f.,1-α) p-值^I
p-value 樣本平均數與母體
平均數的差異
Difference between
sample mean and null 母體平均數差異
的 95% 信賴區間
95% C.I. for difference

下界
Lower 上界
Upper

第二年身長 - 第一年身長 -1.5681 49 1.6766 0.93835 -0.218 1.5489 Inf

I：顯著性代碼：‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

分析結果建議：由於檢定結果P-值(0.93835) > 顯著水準0.05，因此無法拒絕虛無假設。

[重新分析]

影音教學內容為本系統資料處理與分析方法之操作說明，
可供使用者即時參考及線上自學，
輕鬆上手「雲端資料分析暨導引系統」!

虛無假設：母體平均數差異 ≤ 2 H₀：μ₁ - μ₂ ≤ 2
變數名稱 Variable	t檢定統計量 t-statistics	自由度 d.f.	臨界值 t(d.f.,1-α)	p-值^I p-value	樣本平均數與母體平均數的差異 Difference between sample mean and null	母體平均數差異的 95% 信賴區間 95% C.I. for difference
						下界 Lower	上界 Upper
第二年身長 - 第一年身長	-1.5681	49	1.6766	0.93835	-0.218	1.5489	Inf

變數名稱 Variable	樣本數 Count	平均數 Mean	中位數 Median	最小值 Minimum	最大值 Maximum	標準差 Std. dev.
第二年身長	50	20.478	20.9	14.9	24	2.1524
第一年身長	50	18.696	18.9	13.9	23.4	2.6228