首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 簡單邏輯斯迴歸分析

簡單邏輯斯迴歸分析
Simple logistic regression analysis
方法 簡單邏輯斯迴歸分析 (Simple logistic regression analysis)
條件 1. 依變數為類別型變數。
2. 迴歸模式中僅包含一個依變數與一個自變數。
3. 主要針對二項式(binomial)的依變數亦可推廣至依變數為多項式時使用。
說明
  1. 迴歸一詞最早由英國優生學家高騰(Sir Francis Galton, 1822-1911)提出,主要是用來幫助了解變數間的線性因果關係。
  2. 變數區分為依變數(dependent variable)與自變數(independent variable),利用線性關係模式,了解自變數的改變對依變數造成之影響;因此,迴歸模型亦可進行資料預測。
  3. 於醫學研究依變數經常稱為結果變數(outcome variable);自變數則為風險因子(risk factor)。
備註 當依變數為連續型變數,可使用簡單迴歸分析 (Simple regression analysis)進行分析。

範例C-3:品管的重要

大型的航空運輸工具由於擔負了許多乘載旅客的安全,因此對於機件的生產要求非常嚴格,在機件生產的過程中更需要有嚴格的品管來管控其生產的品質。航空空司委託某金屬研究機構製造一個新型的飛機專用零件O環,由於飛機飛行下該機件必須承載超高溫及高熱,且不能有任何損壞,該研究機構做了一系列的試驗,將新型O環曝露於高溫高熱的環境24小時,記載受熱的溫度及是否因受熱而產生損壞;溫度記錄單位為攝式,記錄有熱損壞變形者記錄值為1,無損壞情形則記錄為0,受試的機件共有20個;資料記錄於表中。

表:O環產生熱損壞與溫度之記錄
編號 1 2 3 4 5 6 7 8 9 10
溫度(攝式) 70 69 68 67 73 70 57 63 70 78
熱損壞 1 0 0 0 1 0 1 1 1 1
編號 11 12 13 14 15 16 17 18 19 20
溫度(攝式) 70 81 76 79 75 76 58 53 67 75
熱損壞 0 0 0 0 1 0 1 1 0 0

Q1:研究機構關心溫度的高低是否會影響新型O環的損壞,多高(低)的溫度會使得新型O環遭受破壞,此新型O環是否適合用於飛機上呢?能承受的溫度有多高(低)呢?
問題解析:此處想了解溫度的高低是否會破壞新型O環,且多高(低)的溫度會造成新型O環的損壞,可探討"溫度高低是否會影響新型O環的損壞?"。
統計方法:此問題中有兩個變數,分別是溫度與熱損壞(兩個變數,探討因果關係,建議選擇雙變數分析II)。此範例中欲了解高溫度(因)下是否會對零件O環產生熱損壞(果),故自變數是溫度,依變數是零件是否產生熱損壞,變數值1表有熱損壞,0表沒有熱損壞。依變數為類別變數,可採用分析方法:簡單邏輯斯迴歸分析(simple logistic regression analysis),分析"溫度高低是否會影響新型O環的損壞?"。

解析:
1. 此題可利用邏輯斯迴歸分析探討溫度高低(自變數)是否會對O環零件(依變數)產生影響。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: logistic regression analysis
邏輯斯迴歸分析 - 分析結果
  • 分析方法:邏輯斯迴歸分析
  • 資料名稱:範例C-3
  • 依變數名稱:熱損壞
  • 自變數名稱:溫度(攝式)
  • 計算時間:0.147秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    溫度(攝式)2069.757053817.5035
    I:樣本敘述統計量皆不包含遺失值

  • 依變數訊息:
    變數名稱
    Variable
    變數值
    Value
    編碼
    Coded
    個數
    Count
    熱損壞0011
    119

  • 模式係數估計I
    係數
    coefficient
    估計值
    estimation
    標準差
    std. err.
    華德檢定統計量
    Wald-statistic
    p值II
    p-value
    (截距項)9.35585.62122.77020.096 .
    溫度(攝式)-0.1370.082.93220.0868 .
    I:依變數為熱損壞
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值為0.0868,因此若設定顯著水準為0.05,則無法拒絕虛無假設,代表此迴歸係數(溫度(攝式))不顯著。

  • 預測V.S.觀察分類表:
    熱損壞 預測次數
    0 1 總和
    觀察次數 0 8 3 11
    1 5 4 9
    總和 13 7 20
    敏感度(sensitivity): 72.73 %
    精確度(specificity): 44.44 %
    正確度(accuracy): 60 %
    偽陽性(false positive): 38.46 %
    偽陰性(false negative): 42.86 %
  • 分類表解釋:
    類別依變數 預測次數
    0 1 總和
    觀察次數 0 a b r0
    1 c d r1
    總和 c0 c1 n
    敏感度(sensitivity):a/r0
    精確度(specificity):d/r1
    正確度(accuracy):(a+d)/n
    偽陽性(false positive):c/c0
    偽陰性(false negative):b/c1

[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「雲端資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: