首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 使用其它(other)連結函數的廣義線性模式

使用其它(other)連結函數的廣義線性模式
Generalized Linear Model with other link
本處提供兩種較少被使用的GLM方法。第一種假設依變數的期望值為μ,連結函數為g(μ)=μ-1,且其依變數分配假設為珈瑪(gamma)分配;第二種模式假設連結函數為g(μ)=μ-2,且依變數分配假設為反高斯(inverse Gaussian)分配。

廣義線性模式-方法簡介

本方法使用之R相關套件與參考文獻:
相關套件:stats、base、car、speedglm
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
  2. John Fox and Sanford Weisberg (2011). An {R} Companion to Applied Regression, Second Edition. Thousand Oaks CA: Sage. URL:http://socserv.socsci.mcmaster.ca/jfox/Books/Companion
  3. Marco ENEA (2013). speedglm: Fitting Linear and Generalized Linear Models to large data sets.. R package version 0.2. URL:http://CRAN.R-project.org/package=speedglm
範例F-3:

21世紀的電子業為眾多求職者理想的工作,電腦、PDA及智慧型手機等科技產品的高使用率,造就電子產業的榮景並創造許多高收入的職缺,然而朝九晚五之景也已消失在電子業。因此,如何在報酬與工時取得平衡是現階段求職者最關心的議題。某人力銀行為提供求職者此相關訊息,隨機從4家公司抽出共100名電子產業工作者,其調查資料包括薪資、職位、性別、學歷、工作年資與工作時數,記錄如下表,資料說明列於表後

表:電子公司員工調查資料
編號 薪資 職位 公司別 性別 學歷 工作年資 工作時數
1 24970 1 1 0 1 19 50
2 26270 1 1 1 1 29 50
100 43340 2 4 1 2 68 62

薪資:月薪(單位:元)
職位:現場作業人員(1)、工程師(2)、主管級(3)、經理級(4)
公司別:(1)、(2)、(3)、(4)
性別:女性(0)、男性(1)
學歷:高中職(1)、大學含專科(2)、研究所以上(3)
工作年資:以月為單位計算
工作時數:每週平均工作時間,以小時為單位計算

Q4:若研究人員認為薪資資料的分配可能為珈瑪(gamma)分配或是反高斯(inverse Gaussian)分配,若此兩種推測為真,則何種因素對於薪資高低的影響較大?
問題解析:此處可探討何種解釋變數(公司別、性別、學歷…等)對於依變數薪資的影響,適合廣義線性模式分析。
統計方法1:由於依變數薪資為連續變數,假設其資料服從珈瑪分配並使用反函數(μ-1)連結函數。可採用的分析方法:使用其它連結函數的廣義線性模式。
統計方法2:由於依變數薪資為連續變數,假設其資料服從反高斯分配並使用反函數平方(μ-2)連結函數。可採用的分析方法:使用其它連結函數的廣義線性模式。
廣義線性模式 - 分析結果
  • 分析方法:廣義線性模式
  • 資料名稱:範例F-3
  • 連結函數:g(μ)=μ-1
  • 依變數名稱:薪資
  • 自變數名稱:公司別, 性別, 學歷, 工作年資, 工作時數
  • 影響點下載:另存CSV檔
  • 計算時間:0.42秒

  • 變數訊息I
    連續變數(continuous)
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    薪資10039469.935132.5249608315012681.9821
    工作年資10073.36731017433.3347
    工作時數100565648827.4182

    類別變數(categorical)
    變數名稱
    Variable
    變數值
    Value
    編碼
    Coded
    個數
    Count
    公司別1025
    2126
    3224
    4325
    性別0027
    1173
    學歷1025
    2166
    329
    I:變數訊息皆不包含遺失值

  • 模式訊息:
    變數名稱
    Variable
    自由度
    d.f.
    離差
    Deviance
    殘差自由度
    Resid. d.f.
    殘差離差
    Resid. Deviance
    p-值
    p-value
    NULL998.0369< 1e-04
    學歷22.5008975.5361< 1e-04
    工作年資14.1217961.4144< 1e-04
    工作時數10.4791950.9353< 1e-04

  • 變數選取:
    變數選取方法:Stepwise AIC法
    變數選取準則:min AIC(Akaike Information Criterion)
    完整模式:薪資 = (截距項) + 公司別 + 性別 + 學歷 + 工作年資 + 工作時數
    準則選取之最佳模式:薪資 = (截距項) + 學歷 + 工作年資 + 工作時數
    模式選取I
    變數 自由度 Deviance AIC值
    僅含截距項模式 99 15922434441 2176.3702
    系統選取較佳模式 95 0.9353 1937.3602
    I:AIC與Deviance欄位中數值越小表示模式越佳

  • 模式係數估計I
    係數
    coefficient
    估計值
    estimation
    標準差
    std. err.
    t檢定統計量
    t-statistic
    p-值II
    p-value
    (截距項)1e-04028.1547< 2.22e-16 ***
    學歷(2)00-4.40012.8283e-05 ***
    學歷(3)00-5.60852.0009e-07 ***
    工作年資00-8.53222.2492e-13 ***
    工作時數00-6.80089.1833e-10 ***
    離勢參數
    Dispersion parameter
    0.0104
    I:依變數為薪資
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 共線性診斷:
    變數名稱
    variable
    廣義變異數膨脹因子
    GVIF
    自由度
    Df
    GVIF^(1/(2*Df))
    學歷1.405821.0889
    工作年資2.993211.7301
    工作時數3.632211.9058
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「雲端資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: