You are on page 1of 20

Di dalam analisi regresi ganda, terkadang perlu memperhatikan sifat alami dan keberartian hubungan antara variabel takbebas

dengan variabel-variabel bebas. Dan pertanyaan yang sering diajukan adalah:

Seberapa pentingnya relatif pengaruh variabelvariabel bebas yang ada di dalam model? Seberapa besar pengaruh suatu variabel bebas tertentu terhadap variabel tak bebas? Bisakah suatu variabel bebas dibuang dari model karena pengaruhnya yang kecil atau tidak ada sama sekali terhadap veriabel tak bebas ? Haruskah suatu variabel bebas yang tidak disertakan ke dalam model dipertimbangkan untuk dimasukan?

Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi yang tinggi antara masing-masing variabel independen dalam model regresi. Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang digunakan saling terkait dalam suatu model regresi. Oleh karena itu masalah multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya melibatkan satu variabel independen.

Indikasi terdapat masalah multikolinearitas dapat kita lihat dari kasus-kasus sebagai berikut:

1 2 3

Nilai R2 yang tinggi (signifikan), namun nilai standar error dan tingkat signifikansi masing-masing variabel sangat rendah. Perubahan kecil sekalipun pada data akan menyebabkan perubahan signifikan pada variabel yang diamati. Nilai koefisien variabel tidak sesuai dengan hipotesis, misalnya variabel yang seharusnya memiliki pengaruh positif (nilai koefisien positif), ditunjukkan dengan nilai negatif.

Indikasi multikolinearitas dapat dilihat dengan tolerance value (TOL), eigenvalue, dan yang paling umum digunakan adalah varians inflation factor (VIF).

Dengan, rj2 = koefisien determinasi dari regresi variable bebas ke-j hingga variable bebas k-1. Pada k=2 variabel bebas, Rj2 merupakan kuadrat dari korelasi sample r. Jika varianel taksiran ke-j tidak berelasi dengan variable Xn yang lain maka Rj2 =0 dan VIFj=1. Jika terdapat hubungan, maka VIFj > 1. Misalnya, saat Rj2 = 90, VIFj=1/(1-90) = 10.

Nilai VIF yang mendekati 1 menunjukkan bahwa keberadaan multikolinearitas pada regresi bukan merupakan sebuah masalah untuk variable independen tersebut dan koefisien taksiran dan nilai t tidak akan mengalami perubahan yang begitu besar. Nilai VIF lebih besar dari 1 menunjukkan bahwa koefisien taksiran yang melekat pada variable bebas tersebut tidak stabil. Besar nilai dan t satistiknya dapat berubah seiring dengan bertambah atau berkurangnya variable bebas di dalam model. Nilai VIF yang besar pada dasarnya menunjukkan adanya kelebihan banyaknya variable taksiran.

Beberapa ahli yang lain berpendapat bahwa nilai toleransi kurang dari 1 atau VIF lebih besar dari 10 menunjukkan multikolinearitas signifikan, sementara itu para ahli lainnya menegaskan bahwa besarnya R2 model dianggap

mengindikasikan adanya multikolinearitas. Klein (1962) menunjukkan bahwa, jika VIF lebih besar dari 1/(1 R2) atau nilai toleransi kurang dari (1 R2), maka multikolinearitas dapat dianggap signifikan secara statistik.

Contoh kasus : variabel-variabel bebas tidak berkorelasi


Tabel 1 Data produktivitas tenaga kerja Nomor (i ) 1 2 3 4 5 6 7 8 Banyaknya tenaga kerja (Xi1) 4 4 4 4 6 6 6 6 Upah (Xi2) 2 2 3 3 2 2 3 3 Skor Produktivitas (Yi) 42 39 48 51 49 53 61 60

Pengerjaan
(a) Regresi Y terhadap X1 dan X2: Y = 0, 375 + 5,375X1 + 9.250 X2
SV Regresi Galat Total JK 402,250 17,625 419,875
v v

db 2 5 7

KT 201,125 3,525

(b) Regresi Y terhadap X1: Y = 23,500 + 5,375X1


SV Regresi Galat Total JK 402,250 17,625 419,875
v

Db 2 5 7

KT 201,125 3,525

(c) Regresi Y terhadap X2: Y = 27,250 + 9.250 X2


SV Regresi Galat Total JK 402,250 17,625 419,875 db 2 5 7 KT 201,125 3,525

Regression Analysis: SkorPro versus TenKer; Upah The regression equation is SkorPro = 0,38 + 5,37 TenKer + 9,25 Upah

Out put Minitab

Predictor Coef Constant 0,375 TenKer 5,3750 Upah 9,250

SE Coef T P VIF 4,740 0,08 0,940 0,6638 8,10 0,000 1,000 1,328 6,97 0,001 1,000

S = 1,87750 R-Sq = 95,8% R-Sq(adj) = 94,1% PRESS = 45,12 R-Sq(pred) = 89,25%

Analysis of Variance Source DF SS MS F P Regression 2 402,25 201,12 57,06 0,000 Residual Error 5 17,63 3,53 Lack of Fit 1 0,13 0,13 0,03 0,874 Pure Error 4 17,50 4,38 Total 7 419,87

Regression Analysis: SkorPro versus TenKer The regression equation is SkorPro = 23,5 + 5,37 TenKer

Predictor Coef SE Coef T P VIF Constant 23,50 10,11 2,32 0,059 TenKer 5,375 1,983 2,71 0,035 1,000

S = 5,60877 R-Sq = 55,0% R-Sq(adj) = 47,6% Analysis of Variance Source DF SS MS F P Regression 1 231,12 231,12 7,35 0,035 Residual Error 6 188,75 31,46 Total 7 419,87

Regression Analysis: SkorPro versus Upah The regression equation is SkorPro = 27,3 + 9,25 Upah

Predictor Coef SE Coef T P VIF Constant 27,25 11,61 2,35 0,057 Upah 9,250 4,553 2,03 0,088 1,000

S = 6,43881 R-Sq = 40,8% R-Sq(adj) = 30,9%

Analysis of Variance Source DF SS MS F P Regression 1 171,12 171,12 4,13 0,088 Residual Error 6 248,75 41,46 Total 7 419,87

Analisis dari perhitungan lewat tabel ANOVA dan out put Minitab:

Perhatikan bahwa koefisien regresi bagi X1yaitu b1=5,375, ternyata sama saja baik hanya X1saja yang ada di dalam model ataupun keduanya ada di dalam model. Hal yang sama berlaku untuk b2= 9,250. Hal ini menyimpulakan bahwa kedua variabel bebas tidak saling berkorelasi. (ciri pertama) Perahatikan nilai JKR (X1|X2) sama dengan jumlah Kuadrat Regresi JKR(X1) bila di dalam model hanya ada X1 saja : JKR (X1|X2) = JKG(X2)-JKG(X1,X2) = 248,750-17,625 = 231,125 JKR (X1) = 231,125 begitu pula pada nilai JKR (X1|X2) sama dengan jumlah Kuadrat Regresi JKR(X2) bila di dalam model hanya ada X2 saja.

Secara umum, bila dua atau lebih variabel bebas tidak berkorelasi, maka sumbangan salah satu peubah dalam menurunkan jumlah kuadrat galat bila variabel-nvariabel lain ada dalam model persisi sama dengan bila hanya variabel bebas ini saja yang ada di dalam model (ciri kedua)

Contoh:

dari buku

Komponen yang mengambil peran yang besar dalam kepemilikan usaha surat kabar adalah biaya percetakan surat kabar tersebut. Pihak penerbit tertarik untuk meneliti factor-faktor yang mempengaruhi konsumsi tahunan untuk percetakkan. Pada sebuah study(ilhat di Johnson and Wichern, 1997),didapatkn data yang mliputi konsumsi tahunan untuk percetakan (Y), banyaknya surat kabar yang beredar di kota (X1), logaritma6 dari banyaknya keluarga dalam sebuah kota (X2), dan logaritma total banyakya sales pengecer tiap kota (X3) yang dikumpulkan dari 15 kota (n=15). Akan diuji keberadaan multikolinearitas dan rekomendasi apa yang bisa diberikan

Perhatikan output dari buku

F hitung (18,54) dan p value (0,000) menunjukkan bahwa regressinya nyata. Nilai t hitung dari setiap variable bebas menunjukkan nilai yang kecil dengan nilai p value yang besar. Hal ini menunjukkan bahwa variable LnKeluarga tidak signifikan dan dengan demikian 2X2 dapat dikeluarkan dari model. Demikian juga 3X3 dapat di keluarkan dari model jika 1X1 dan 3X3 tetap dipertahankan dalam model. Nilai t(1.69) yang berhubungan dengan ketersediaan kertas ternyata signifikan secara marginal, namun 1X1 dapat dikeluarkan dari model jiak 2X2 dan 3X3 tetap dipertahankan. Terlihat bahwa regresinya bersifat signifikan tetapi masing-masing variable taksirannya tidak signifikan, mengapa?

Hal ini dikarenakan nilai VIF=1,7 untuk variable kertas. Variable taksiran ini memiliki tingkat hubungan yang lemah dengan variable yang lain, yaitu variabel LnFamily dan LnRetSales. VIF untuk LnFamily = 7,4 yang relatif cukup besar, menunjukkan adanya hubungan linier dengan variable yang lain. VIF LnRetSale = 8,1 menunjukkan adanya hubungan linier dengan variable yang lain. Karena variable Papers memiliki hubungan yang lemah dengan variable LnFamily dan LnRetSales,maka hubungan antarvariabel taksiran adalah hubungan antara variable LnFamily dan variable LnRetSales. Dan korelasi antara LnFamily dan LnRetSales yaitu r=0,93 menunjukan adanya hubungan linier yang kuat.

Jika adanya multikolienaritas dalam model menjadi suatu permasalahan, maka dapat dilakukan langkah berikut: Bangkitkan variable X yang baru, dan nyatakan dengan

Identifikasi dan hilangkan satu atau lebih kelebihan variable bebas dari fungsi regresi Pertimbangkan prosedur estimasi selain kuadrat terkecil Mundurkan respon Y pada kombinasi linier X yang tidak berhubungan Berhati-hatilah dalam memilih variable bebas yang potensial sejak awal penelitian. Hindari variable yang menyatakan hal yang sama

You might also like