首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (獨立)雙組樣本比例差異分析

(獨立)雙樣本比例差異檢定
Two-sample test for equality of proportion
1. 當資料為類別型 (如:是否有抽菸習慣的受訪問卷),資料形態可為文字(是、否)或數字(1:有抽菸習慣、0:沒有抽菸習慣),可藉由比例值了解資料特性。
2. 此方法適用於當資料包含兩組樣本(如:男性及女性受訪者是否有抽菸習慣的問卷資料),想了解此兩組樣本的母體比例差異值是否大於、小於或等於某一特定數值(如:有抽菸習慣的男性比例與有抽菸習慣的女性比例是否有差異,或差異是否大到某個程度?)。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-3:網路成癮的研究

網路遊戲是現在假日的熱門休閒娛樂,許多熱愛上網的網友還因此被稱為宅男,許多新興的行業都與網路有關,隨著電子3C產品的普及,可說是人手一機,走到哪都可以上網,而許多與網路有關的經濟活動因此稱為"宅經濟"。在一片經濟不景氣的哀嘆聲中,宅經濟可說是異軍突起,許多遊戲公司皆已上市上櫃且股價居高不下。看好這片宅經濟的影響力,某投資顧問公司欲了解民眾的網路成癮程度,了解使用者的差異性,以提供遊戲業者參考使用,蒐集了一份資料,資料為喜歡玩線上遊戲的男性與女性人數,受訪男性有350人,女性有200人,皆載於表中。

性別受訪人數高度使用人數(註一)
男性35083
女性20016
註一:定義為每日使用網路時間超過12小時

Q2:由於女性人口的成長快速,已經出現女性人數高於男性人數的現象,該業者認為女性的市場也具有開發的價值,故委託投資顧問公司分析並提供資料以訂定市場策略。投資顧問公司想要了解女性市場是否有與男性市場一樣的價值,不同性別間喜好上網的人數比例會有差異嗎?
問題解析:要了解不同性別間喜好上網人數比例差異,僅需比較男性與女性喜好上網的比例高低,可討論"男性喜好上網比例減去女性喜好上網比例是否不等於0?"
統計方法:此問題中變數為高度使用的人數比例,為單一變數(一個變數,建議選擇單變數分析);此處資料分為男與女兩部分,視為兩組樣本;另資料中受訪男性與女性是否玩遊戲應無關係,故兩樣本可視為獨立;可採用分析方法:(獨立)雙樣本比例差異檢定(two-sample test for equality of proportion),檢定"男性喜好上網比例減去女性喜好上網比例是否不等於0?"。

解析:
1. 此題可建立虛無假設為"男性喜好上網比例減去女性喜好上網比例等於0",即H0:P-P=0。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: two sample prop test
(獨立)雙樣本比例差異檢定 - 分析結果
  • 分析方法:(獨立)雙樣本比例差異檢定
  • 資料名稱:範例A-3
  • 檢定變數:_NEW_
  • 分組變數:_GROUP_(男性, 女性)
  • 顯著水準:0.05
  • 檢定比例差異:0
  • 檢定方向:雙尾檢定
  • 計算時間:0.002秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    分組變數(_GROUP_)
    Class Variable(_GROUP_)
    樣本數
    Count
    成功次數
    Number of success
    比例
    Proportion
    _NEW_ 男性 350 83 0.2371
    女性 200 16 0.08
    不分組(Total) 550 99 0.18
    I:樣本敘述統計量皆不包含遺失值

  • 雙樣本比例差異檢定I
    虛無假設:母體比例差異 = 0
    H0p1 - p2 = 0
    變數名稱
    Variable
    z-檢定統計量
    z-statistics
    p-值II
    p-value
    樣本比例與母體
    比例的差異
    Difference between
    sample proportion and null
    母體比例差異
    的 95% 信賴區間
    95% C.I. for difference
    下界
    Lower
    上界
    Upper
    _NEW_ 4.6144 3.9415e-06 *** 0.1571 0.0904 0.2239
    I:分組變數為_GROUP_
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:
    檢定結果P-值(3.9415e-06) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「雲端資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: