You are on page 1of 9

Analisis Regresi Logistik Multinomial

Model regresi logistik multinomial merupakan suatu model yang memfokuskan


pengaruh sekumpulan variabel penjelas yang saling bebas terhadap satu variabel respon.
Analisis regresi logistik digunakan untuk memeriksa hubungan antara variabel respon yang
biasanya terdiri atas data kualitatif dengan variabel-variabel penjelas yang terdiri atas data
kualitatif dan kuantitatif. Variabel respon pada penelitian ini adalah perilaku sosial tahanan
anak yang dibagi menjadi tiga kategori yaitu rendah, sedang, dan tinggi, dimana masing-
masing diberi kode 0, 1, 2. Oleh karena itu, dalam penelitian ini digunakan regresi logistik
multinomial. Regresi logistik multinomial merupakan perluasan dari regresi logistik biner
(dua kategori) apabila variabel respon memiliki kategori lebih dari dua dengan variabel
penjelas kategorik dan/atau kontinu.

Pada model regresi logistik, salah satu koefisien/parameter harus dijadikan nol
( β jm=0). Kategori dengan koefisien nol disebut juga kategori referensi. Salah satu kategori
(misal kategori pertama, terakhir atau kategori dengan frekuensi tertinggi) dipilih sebagai
kategori referensi yang digunakan untuk pembanding dalam analisis. Untuk memudahkan
interpretasi, maka perilaku sosial dengan kategori rendah (Y=0) digunakan sebagai kategori
referensi. Artinya, untuk menganalisis perilaku sosial tahanan anak yang tergolong dalam
kategori tinggi dan sedang akan dibandingkan dengan perilaku sosial tahanan anak yang
tergolong rendah.

Persamaan regresi logistik (Hosmer dan Lemeshow, 1989) secara umum adalah
sebagai berikut:

exp [ g j ( x ) ] exp ( β j 0 + β j 1 x 1 + β j 2 x 2 +⋯ + β jp x p )
P ( Y = j|x ) =μ j ( x )= 2
= 2

∑ exp [ g k ( x ) ] ∑ exp ( β k 0 + β k 1 x 1 + β k 2 x 2+ ⋯+ β kp x p )
k=0 k=0

Dimana β 0=0 sehingga g0 ( x )=0

Keterangan:

P ( Y = j|x ) = peluang bersyarat dari variabel respon j pada vektor x

μ j( x ) = persamaan regresi logistik untuk variabel respon j

g j( x ) = logit pada variabel respon j, j=0,1,2


xm = nilai dari variabel penjelas ke-m, m=1,2,3,...,p

β jm = koefisien/parameter model

Untuk model regresi logistik multinomial, jika variabel respon dibagi menjadi tiga kategori
yang masing-masing diberi kode 0, 1, dan 2 dan jika kategori 0 sebagai kategori referensi
( β 0=0), maka probabilitas bersayarat dengan variabel penjelas sebanyak p akan
menghasilkan persamaan sebagai berikut:

1
P ( Y =0|x ) =μ 0 ( x )=
1+exp ( β 10+ β11 x 1 +⋯+ β1 p x p )+ ¿ exp ( β 20+ β 21 x 1 +⋯+ β2 p x p ) ¿

exp ( β 10+ β11 x 1 +⋯+ β 1 p x p )


P ( Y =1|x )=μ1 ( x )=
1+ exp ( β10 + β 11 x1 + ⋯+ β 1 p x p ) +¿ exp ( β 20+ β21 x1 + ⋯+ β 2 p x p ) ¿

exp ( β 20+ β21 x 1 +⋯ + β 2 p x p )


P ( Y =2|x )=μ2 ( x )=
1+ exp ( β10 + β 11 x 1+ ⋯+ β 1 p x p ) +¿ exp ( β 20 + β 21 x 1+ ⋯+ β 2 p x p ) ¿

Suatu variabel respon dengan tiga kategori akan membentuk dua persamaan logit,
dimana masing-masing persamaan ini membentuk regresi logistik biner yang
membandingkan suatu kelompok kategori terhadap referensi, yaitu sebagai berikut:

P ( Y =1| x ) μ (x)
g1 ( x ) =ln =ln 1 = β10 + β 11 x1 + ⋯+ β 1 p x p
P ( Y =0|x ) μ0 ( x )

P ( Y =2| x ) μ (x)
g2 ( x ) =ln =ln 2 =β20 + β 21 x 1+ ⋯+ β 2 p x p
P ( Y =0|x ) μ0 ( x )

Secara umum, bentuk dari fungsi logit dengan variabel respon yang terdiri dari tiga kategori
adalah:

g j ( x )=β j0 + β j1 x 1+ β j 2 x 2+ ⋯+ β jp x p ; j=0,1,2

Jika terdapat variabel penjelas dengan skala kategorik, variabel tersebut tidak tepat apabila
dimasukan kedalam model karena angka tersebut hanya sebagai identifikasi saja dan tidak
mempunyai nilai numerik. Agar variabel penjelas tersebut dapat masuk kedalam model, maka
dilakukan transformasi dengan memeasukkan variabel boneka (dummy variable) ke dalam
model. Misalkan variabel penjelas ke-m, yaitu x m yang mempunyai kategori sebanyak h m ,
maka akan terdapat variabel boneka sebanyak h m−1. Dengan demikian, fungsi logistik
dengan pvariabel penjelas dan m variabel boneka akan menjadi:

h m −1
g j ( x )=β j0 + β j1 x 1+ β j 2 x 2+ ⋯+ ∑ β jmv D jmv + ¿ ⋯+ β jp x p ¿
v=1

Dimana D jmv = variabel boneka dari variabel ke-m fungsi logit ke- j

Secara umum, langkah-langkah yang dilakukan dalam analisis regresi logistik


multinomial adalah:

1. Melakukan pengujian parameter secara simultan untuk mengetahui kecocokan model


analisis tersebut.
2. Melakukan pengujian parameter secara parsial untuk mengetahui variabel bebas yang
paling berpengaruh dalam model tersebut.
3. Melakukan interpretasi terhadap nilai rasio kecenderungan yang terbentuk.

Pendugaan parameter

Dalam model regresi logistik, nilai harapan antar variabel respon tidak linier serta
memiliki varians yang tidak sama sehingga penduga parameter β diperoleh melalui metode
Maximum Likelihood (Hosmer & Lemeshow, 1989). Untuk memecahkan masalah sistem
persamaan nonlinier, solusi yang dilakukan adalah dengan mengestimasi β melalui proses
iterasi Newton Raphson. Karena variabel respon ( y ¿¿ j)¿ diasumsikan saling bebas, maka
diperoleh fngsi likelihood bersyarat untuk sampel sebanyak n observasi sebagai berikut:
n
l ( β ) =∏ [ π 0 ( x i ) y π 1 ( x i ) y π 2 ( x i ) y
0i 1i 2i
]
i=1

Secara matematis, akan lebih mudah untk mendapatkan nilai β yang akan
memaksimalkan fungsi likelihood di atas melalui log dari fungsi tersebut yaitu log likelihood.
Dengan demikian maka fungsi log likelihood-nya adalah:
n

[
L ( β ) =ln [ l ( β ) ]=∑ y 1 i g 1 ( x i ) + y 2 i g2 ( x i )−ln 1+ exp ( g1 ( xi ) ) +exp ( g1 ( x i) )
i=1
( ])
Untuk mendapatkan nilai β yang memaksimumkan L ( β ) dilakukan dengan diferensiasi
terhadap L ( β ) , dengan syarat:
∂L ∂2 L
=0 , dan 2 <0
∂β ∂ β

Nilai βdapat ditentukan, tetapi sangat sulit menghitung dengan nilai β secara manual. Oleh
karena itu, digunakan metode iterasi dengan komputer untuk mencari solusi nilai β. Iterasi
merupakan metode yang paling umum dalam paket program SPSS untuk membantu
penghitungan estimasi dari β.

Pengujian parameter

Pengujian terhadap parameter model dilakukan sebagai upaya memeriksa peranan


variabel independen terhadap model. Uji yang dilakukan ada dua yaitu:
a. Pengujian parameter dengan uji likelihood ratio (uji simultan)
Statistik uji G, yaitu uji yang digunakan untuk menguji peranan variabel
independen dalam model secara bersama-sama (Hosmer dan Lemeshow, 1989).
Pengujian hipotesis yang dilakukan adalah:
H0: β 1=β 2=⋯=β p=0, artinya tidak ada pengaruh antara sekumpulan variabel
independen dengan variabel dependen
H1: minimal ada satu β j ≠ 0, artinya minimal ada satu variabel independen yang
berpengaruh terhadap variabel dependen
Dengan statistik uji:
l0
G=−2 ln
[]
lk

Dimana l 0 adalah likelihood tanpa variabel independen dan l k adalah likelihood dengan
variabel independen.
Statistik uji G ini mengikuti sebaran chi squares bila n mendekati tak terhingga
dengan derajat bebas p dimana p=(r −1)(c −1), r danc masing-masing adalah
banyaknya kategori pada variabel independen dan variabel dependen. H 0 akan ditolak
2
pada tingkat signifikansi α apabila nilai G> χ ( p ;α ) atau p−value<α, dengan kesimpulan
bahwa variabel independen secara bersama-sama atau keseluruhan mempengaruhi
variabel dependen, dapat jga dikatakan bahwa paling sedikit ada satu koefisien β j ≠ 0.
Untuk mengetahui β j mana yang berpengarh signifikan, dapat dilakukan uji parameter β
secara parsial dengan uji wald
b. Pengujian parameter dengan uji Wald (Uji parsial)
Pengujian variabel dilakukan satu per satu menggunakan statistik uji wald
(hosmer & lemeshow, 1989). Uji ini dilakukan dengan membandingkan model terbaik
yan dihasilkan oleh uji simultan terhadap model tanpa variabel bebas di dalam model
terbaik. Hipotesis yang akan diuji adalah sebagai berikut:
H0: β j =0, artinya tidak ada pengaruh antara variabel independen ke-j terhadap variabel
dependen
H1: β j ≠ 0, artinya ada pengaruh variabel independen terhadap variabel dependen Statistik
ujinya adalah
^β j 2
W=
[ ]
Se ( ^β j )
; j=1,2, ⋯ , p

Dimana ^β j merupakan penduga dari β j dan Se( β^ j) adalah penduga galat baku dari β j . W
diasumsikan mengikuti sebaran chi square dengan derajat bebas 1. H 0 akan ditolak jika
2
nilai W > χ (1 ;α ) atau p−value<α. Jika H0 ditolak maka dapat disimpulkan bahwa β j
signifikan. Dengan kata lain, variabel independen X secara parsial berpengaruh
signifikan terhadap variabel dependen.

Rasio kecenderungan (Odd Ratio)

Rasio kecenderungan adalah ukuran yang memperkirakan berapa besar


kecenderungan variabel-variabel independen terhadap variabel dependen (Hosmer dan
Lemeshow, 1989). Odds ratio merupakan ukuran untuk mengetahui risiko kecenderungan
untuk mengalami suatu kejadian tertentu antara kategori yang satu dengan yang lain dalam
suatu variabel yang dinotasikan denganθ, didefinisikan sebagai rasio dari odds untukx=1
terhadapx=0. Dengan kata lain, risiko kecenderungan pengaruh observasix=1 adalah m kali
lipat risiko dibandingkan dengan observasi x=0 , atau risiko kecenderungan pengaruh
observasi x=0 adalam 1/mkali lipat dibandingkan dengan observasi x=1.
Odds rasio untuk Y = j terhadap Y =k yang dihitung pada dua nilai (misal x=1
danx=0 ¿ adalah:
P ( Y = j|x=1 ) / P(Y =k ∨x=1)
θ= =exp[ β j ]
P ( Y = j|x=0 ) / P(Y =k ∨x=0)
Untuk θ=0 berarti bahwa x=1 memiliki kecendrngan yang sama dengan x=0 untuk
menghasilkan Y = j. Jika 1<θ< ∞ berarti x=1 memiliki kecenderungan lebih besar θkali
dibandingkanx=0untuk menghasilkan Y = j dan sebaliknya untuk 0<θ< 1.

Penyusunan model regresi logistik multinomial

Variabel Nama Variabel Kategori


(1) (2) (3)
Y Perilaku Sosial Tahanan anak 1. Tinggi
2. Sedang
3. Rendah
X1 Pola pembinaan tahanan anak 1. Tinggi
2. Sedang
3. Rendah
X2 Umur Kuantitatif
X3 Jenis kelamin 1. Laki-laki
2. perempuan
X4 Keberadaan orang tua kandung 1. Lengkap (keduanya masih hidup)
2. Ayah masih hidup, ibu sudah
meninggal
3. Ibu masih hidup, ayah sudah
meninggal
4. Keduanya sudah meninggal
X5 Status tinggal 1. Kedua orang tua
2. Ayah/ibu saja (kandung)
3. Ayah/ibu (salah satunya tiri)
4. Wali, sendiri, lainnya
X6 Pendidikan tahanan anak 1. Tidak tamat SD/tidak sekolah
2. SD/sederajat
3. SMP/sederajat
4. SMA/sederajat
X7 Lama menjalani masa tahanan Kuantitatif
X8 Pengalaman kekerasan 1. Pernah
2. Tidak pernah
X9 Jumlah tahanan dewasa dalam satu Kuantitatif
sel
X10 Jumlah tahanan anak dalam satu sel Kuantitatif
X11 Lokasi pembinaan 1. LP Anak Tangerang
2. Rutan Jakarta Timur

Ada sebanyak 11 variabel independen yang digunakan yang terdiri atas variabel
kualitatif dan kuantitatif serta variabel dependen yang terdiri dari tiga kategori. Dengan
demikian terbentuk dua persamaan logit, yaitu:

g1 ( x ) =β10 + β 111 D 111 + β112 D 112 + β 12 x 2+ β131 D 131 + β 1 41 D 1 41+ β 1 42 D 1 42 + β 143 D 143 + β 151 D 151 + β152 D 152 + β153 D 153 +

Dan

g2 ( x ) =β 20+ β 211 D211 + β 212 D212 + β 22 x 2+ β231 D 231 + β 241 D241 + β 242 D242 + β 243 D243 + β 251 D251 + β 252 D252 + β 253 D253 +

Dimana

g1 ( x ) = persamaan logit untuk kategori perilaku sosial tinggi

β 10 = intersep untuk persamaan logit pertama

D111 = variabel dummy untuk skor pola pembinaan kategori tinggi

D112 = variabel dummy untuk skor pola pembinaan kategori sedang

x2 = variabel umur (tahun)

D131 = variabel dummy untuk jenis kelamin laki-laki

D141 = variabel dummy untuk keberadaan orang tua kandung lengkap

D142 = variabel dummy untuk keberadaan orang tua kandung kategori ayah masih hidup,
ibu sudah meninggal

D143 = variabel dummy untuk keberadaan orang tua kandung kategori ibu masih hidup,
ayah sudah meninggal

D151 = variabel dummy untuk status tinggal dengan kedua orang tua kandung

D152 = variabel dummy untuk status tinggal dengan ayah/ibu saja (kandung)
D153 = variabel dummy untuk status tinggal dengan ayah/ibu (salah satunya tiri)

D161 = variabel dummy untuk pendidikan tahanan anak kategori tidak tamat SD/tidak
sekolah

D162 = variabel dummy untuk pendidikan tahanan anak kategori SD/sederajat

D163 = variabel dummy untuk pendidikan tahanan anak kategori SMP/sederajat

x7 = variabel lama menjalani masa tahanan (dalam bulan)

D181 = variabel dummy pengalaman kekerasan kategori pernah

x9 = variabel jumlah tahanan dewasa dalam satu sel (jiwa)

x 10 = variabel jumlah tahanan anak dalam satu sel (jiwa)

D1111 = variabel dummy untuk lokasi pembinaan di LP Anak Tangerang

g2 ( x ) = persamaan logit untuk kategori sedang

β 20 = intersep untuk persamaan logit pertama

D211 = variabel dummy untuk skor pola pembinaan kategori tinggi

D 212 = variabel dummy untuk skor pola pembinaan kategori sedang

x2 = variabel umur (tahun)

D 231 = variabel dummy untuk jenis kelamin laki-laki

D241 = variabel dummy untuk keberadaan orang tua kandung lengkap

D 242 = variabel dummy untuk keberadaan orang tua kandung kategori ayah masih hidup,
ibu sudah meninggal

D243 = variabel dummy untuk keberadaan orang tua kandung kategori ibu masih hidup,
ayah sudah meninggal

D 251 = variabel dummy untuk status tinggal dengan kedua orang tua kandung
D 252 = variabel dummy untuk status tinggal dengan ayah/ibu saja (kandung)

D253 = variabel dummy untuk status tinggal dengan ayah/ibu (salah satunya tiri)

D 261 = variabel dummy untuk pendidikan tahanan anak kategori tidak tamat SD/tidak
sekolah

D262 = variabel dummy untuk pendidikan tahanan anak kategori SD/sederajat

D263 = variabel dummy untuk pendidikan tahanan anak kategori SMP/sederajat

x7 = variabel lama menjalani masa tahanan (dalam bulan)

D 281 = variabel dummy pengalaman kekerasan kategori pernah

x9 = variabel jumlah tahanan dewasa dalam satu sel (jiwa)

x 10 = variabel jumlah tahanan anak dalam satu sel (jiwa)

D2111 = variabel dummy untuk lokasi pembinaan di LP Anak Tangerang

You might also like