Professional Documents
Culture Documents
Pada model regresi logistik, salah satu koefisien/parameter harus dijadikan nol
( β jm=0). Kategori dengan koefisien nol disebut juga kategori referensi. Salah satu kategori
(misal kategori pertama, terakhir atau kategori dengan frekuensi tertinggi) dipilih sebagai
kategori referensi yang digunakan untuk pembanding dalam analisis. Untuk memudahkan
interpretasi, maka perilaku sosial dengan kategori rendah (Y=0) digunakan sebagai kategori
referensi. Artinya, untuk menganalisis perilaku sosial tahanan anak yang tergolong dalam
kategori tinggi dan sedang akan dibandingkan dengan perilaku sosial tahanan anak yang
tergolong rendah.
Persamaan regresi logistik (Hosmer dan Lemeshow, 1989) secara umum adalah
sebagai berikut:
exp [ g j ( x ) ] exp ( β j 0 + β j 1 x 1 + β j 2 x 2 +⋯ + β jp x p )
P ( Y = j|x ) =μ j ( x )= 2
= 2
∑ exp [ g k ( x ) ] ∑ exp ( β k 0 + β k 1 x 1 + β k 2 x 2+ ⋯+ β kp x p )
k=0 k=0
Keterangan:
β jm = koefisien/parameter model
Untuk model regresi logistik multinomial, jika variabel respon dibagi menjadi tiga kategori
yang masing-masing diberi kode 0, 1, dan 2 dan jika kategori 0 sebagai kategori referensi
( β 0=0), maka probabilitas bersayarat dengan variabel penjelas sebanyak p akan
menghasilkan persamaan sebagai berikut:
1
P ( Y =0|x ) =μ 0 ( x )=
1+exp ( β 10+ β11 x 1 +⋯+ β1 p x p )+ ¿ exp ( β 20+ β 21 x 1 +⋯+ β2 p x p ) ¿
Suatu variabel respon dengan tiga kategori akan membentuk dua persamaan logit,
dimana masing-masing persamaan ini membentuk regresi logistik biner yang
membandingkan suatu kelompok kategori terhadap referensi, yaitu sebagai berikut:
P ( Y =1| x ) μ (x)
g1 ( x ) =ln =ln 1 = β10 + β 11 x1 + ⋯+ β 1 p x p
P ( Y =0|x ) μ0 ( x )
P ( Y =2| x ) μ (x)
g2 ( x ) =ln =ln 2 =β20 + β 21 x 1+ ⋯+ β 2 p x p
P ( Y =0|x ) μ0 ( x )
Secara umum, bentuk dari fungsi logit dengan variabel respon yang terdiri dari tiga kategori
adalah:
g j ( x )=β j0 + β j1 x 1+ β j 2 x 2+ ⋯+ β jp x p ; j=0,1,2
Jika terdapat variabel penjelas dengan skala kategorik, variabel tersebut tidak tepat apabila
dimasukan kedalam model karena angka tersebut hanya sebagai identifikasi saja dan tidak
mempunyai nilai numerik. Agar variabel penjelas tersebut dapat masuk kedalam model, maka
dilakukan transformasi dengan memeasukkan variabel boneka (dummy variable) ke dalam
model. Misalkan variabel penjelas ke-m, yaitu x m yang mempunyai kategori sebanyak h m ,
maka akan terdapat variabel boneka sebanyak h m−1. Dengan demikian, fungsi logistik
dengan pvariabel penjelas dan m variabel boneka akan menjadi:
h m −1
g j ( x )=β j0 + β j1 x 1+ β j 2 x 2+ ⋯+ ∑ β jmv D jmv + ¿ ⋯+ β jp x p ¿
v=1
Dimana D jmv = variabel boneka dari variabel ke-m fungsi logit ke- j
Pendugaan parameter
Dalam model regresi logistik, nilai harapan antar variabel respon tidak linier serta
memiliki varians yang tidak sama sehingga penduga parameter β diperoleh melalui metode
Maximum Likelihood (Hosmer & Lemeshow, 1989). Untuk memecahkan masalah sistem
persamaan nonlinier, solusi yang dilakukan adalah dengan mengestimasi β melalui proses
iterasi Newton Raphson. Karena variabel respon ( y ¿¿ j)¿ diasumsikan saling bebas, maka
diperoleh fngsi likelihood bersyarat untuk sampel sebanyak n observasi sebagai berikut:
n
l ( β ) =∏ [ π 0 ( x i ) y π 1 ( x i ) y π 2 ( x i ) y
0i 1i 2i
]
i=1
Secara matematis, akan lebih mudah untk mendapatkan nilai β yang akan
memaksimalkan fungsi likelihood di atas melalui log dari fungsi tersebut yaitu log likelihood.
Dengan demikian maka fungsi log likelihood-nya adalah:
n
[
L ( β ) =ln [ l ( β ) ]=∑ y 1 i g 1 ( x i ) + y 2 i g2 ( x i )−ln 1+ exp ( g1 ( xi ) ) +exp ( g1 ( x i) )
i=1
( ])
Untuk mendapatkan nilai β yang memaksimumkan L ( β ) dilakukan dengan diferensiasi
terhadap L ( β ) , dengan syarat:
∂L ∂2 L
=0 , dan 2 <0
∂β ∂ β
Nilai βdapat ditentukan, tetapi sangat sulit menghitung dengan nilai β secara manual. Oleh
karena itu, digunakan metode iterasi dengan komputer untuk mencari solusi nilai β. Iterasi
merupakan metode yang paling umum dalam paket program SPSS untuk membantu
penghitungan estimasi dari β.
Pengujian parameter
Dimana l 0 adalah likelihood tanpa variabel independen dan l k adalah likelihood dengan
variabel independen.
Statistik uji G ini mengikuti sebaran chi squares bila n mendekati tak terhingga
dengan derajat bebas p dimana p=(r −1)(c −1), r danc masing-masing adalah
banyaknya kategori pada variabel independen dan variabel dependen. H 0 akan ditolak
2
pada tingkat signifikansi α apabila nilai G> χ ( p ;α ) atau p−value<α, dengan kesimpulan
bahwa variabel independen secara bersama-sama atau keseluruhan mempengaruhi
variabel dependen, dapat jga dikatakan bahwa paling sedikit ada satu koefisien β j ≠ 0.
Untuk mengetahui β j mana yang berpengarh signifikan, dapat dilakukan uji parameter β
secara parsial dengan uji wald
b. Pengujian parameter dengan uji Wald (Uji parsial)
Pengujian variabel dilakukan satu per satu menggunakan statistik uji wald
(hosmer & lemeshow, 1989). Uji ini dilakukan dengan membandingkan model terbaik
yan dihasilkan oleh uji simultan terhadap model tanpa variabel bebas di dalam model
terbaik. Hipotesis yang akan diuji adalah sebagai berikut:
H0: β j =0, artinya tidak ada pengaruh antara variabel independen ke-j terhadap variabel
dependen
H1: β j ≠ 0, artinya ada pengaruh variabel independen terhadap variabel dependen Statistik
ujinya adalah
^β j 2
W=
[ ]
Se ( ^β j )
; j=1,2, ⋯ , p
Dimana ^β j merupakan penduga dari β j dan Se( β^ j) adalah penduga galat baku dari β j . W
diasumsikan mengikuti sebaran chi square dengan derajat bebas 1. H 0 akan ditolak jika
2
nilai W > χ (1 ;α ) atau p−value<α. Jika H0 ditolak maka dapat disimpulkan bahwa β j
signifikan. Dengan kata lain, variabel independen X secara parsial berpengaruh
signifikan terhadap variabel dependen.
Ada sebanyak 11 variabel independen yang digunakan yang terdiri atas variabel
kualitatif dan kuantitatif serta variabel dependen yang terdiri dari tiga kategori. Dengan
demikian terbentuk dua persamaan logit, yaitu:
g1 ( x ) =β10 + β 111 D 111 + β112 D 112 + β 12 x 2+ β131 D 131 + β 1 41 D 1 41+ β 1 42 D 1 42 + β 143 D 143 + β 151 D 151 + β152 D 152 + β153 D 153 +
Dan
g2 ( x ) =β 20+ β 211 D211 + β 212 D212 + β 22 x 2+ β231 D 231 + β 241 D241 + β 242 D242 + β 243 D243 + β 251 D251 + β 252 D252 + β 253 D253 +
Dimana
D142 = variabel dummy untuk keberadaan orang tua kandung kategori ayah masih hidup,
ibu sudah meninggal
D143 = variabel dummy untuk keberadaan orang tua kandung kategori ibu masih hidup,
ayah sudah meninggal
D151 = variabel dummy untuk status tinggal dengan kedua orang tua kandung
D152 = variabel dummy untuk status tinggal dengan ayah/ibu saja (kandung)
D153 = variabel dummy untuk status tinggal dengan ayah/ibu (salah satunya tiri)
D161 = variabel dummy untuk pendidikan tahanan anak kategori tidak tamat SD/tidak
sekolah
D 242 = variabel dummy untuk keberadaan orang tua kandung kategori ayah masih hidup,
ibu sudah meninggal
D243 = variabel dummy untuk keberadaan orang tua kandung kategori ibu masih hidup,
ayah sudah meninggal
D 251 = variabel dummy untuk status tinggal dengan kedua orang tua kandung
D 252 = variabel dummy untuk status tinggal dengan ayah/ibu saja (kandung)
D253 = variabel dummy untuk status tinggal dengan ayah/ibu (salah satunya tiri)
D 261 = variabel dummy untuk pendidikan tahanan anak kategori tidak tamat SD/tidak
sekolah