Bab 7. Analisis Korelasi Dan Regresi

BAB 7.
ANALISIS KORELASI DAN REGRESI
eneliti sering dihadapkan pada data yang memiliki banyak peubah (misalnya data Nilai ujian nasional, terdiri atas beberapa peubah seperti jenis kelamin, identitas institusi, nilai ujian beberapa mata pelajaran). Dalam hal data mengandung banyak peubah, seseorang peneliti mungkin
tertarik untuk mengetahui (menguji) apakah suatu peubah berhubungan dengan peubah lainnya, baik dengan menghitung sebatas pada derajat asosiasi melalui analisis korelasi, maupun dengan menentukan bentuk fungsi/model hubungannya melalui analisis regresi. Pada bab ini akan dibahas analisis korelasi dan regresi sederhana.
KOMPETENSI
Setelah menyelesaikan materi pada bab ini pembaca dapat menghitung korelasi produk momen, memahami maknanya, dapat melakukan analisi regresi baik dengan satu maupun banyak peubah, serta dapat menginterpretasikan hasilnya.
MATERI
Korelasi Produk Momen Analisis regresi sederhana
Kompetensi 181
Analisis regresi peubah ganda Pengantar analisi regresi modern
7.1 ANALISIS KORELASI

Dalam analisis korelasi, kita menghitung derajat asosiasi antara satu peubah dengan peubah lain (misalnya antara berat badan dan tinggi badan, antara berat badan dengan kolesterol, antara nilai IQ dengan perolehan nilai ujian mata pelajaran matematika dan sebagainya). Ada dua jenis ukuran korelasi yang banyak dipakai yaitu: 1. Korelasi produk momen Pearson untuk mengukur derajat asosiasi antara beberapa peubah dengan skala interval atau rasio. 2. Korelasi Spearman untuk mengukur derajat asosiasi antara beberapa peubah dengan skala ordinal (rank).
Koefisien korelasi atau derajat asosiasi
dua peubah
(dinotasikan dengan r)
dihitung dengan rumus pada Pers. 7.1 yang sesungguhnya identik dan merupakan modifikasi dari rumus pada Pers. 3.12.
Pers. 7.1
r=
xi yi 1
i =1
n i =1
n
xi yi
i =1
x 1 xi n i =1 i =1
n n 2 i
n y 1 yi n i =1 i =1
2 i
182
ANALISISKORELASIDANREGRESI
Besarnya r berkisar antara 1 r 1 . Ilustrasi grafik sebaran data dengan berbagai nilai korelasi dapat disajikan dalam bentuk diagram pencar. Bentuk pencaran data terkait dengan besarnya korelasi dapat diilustrasikan seperti pada Gambar 7.1. 1. Korelasi negatif
menunjukan bahwa kedua peubah (X dan Y) memiliki
kecenderungan yang berlawanan (yaitu kenaikan nilai X, diikuti dengan penurunan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan kenaikan nilai Y), seperti pada Gambar 7.1 (a) dan Gambar 7.1 (b). Nilai r = 1 menunjukkan kedua peubah berkorelasi negatif secara sempurna. Sebaran data tepat membentuk garis lurus (hal yang dalam kenyatan jarang terjadi). 2. Korelasi nol (r=0) menunjukan bahwa kedua peubah tidak berkorelasi, yaitu kenaikan atau penurunan nilai peubah X, tidak mempengaruhi nilai peubah Y, seperti pada Gambar 7.1 (c). 3. Korelasi positif menunjukan bahwa kedua peubah memiliki kecenderungan yang sama, yaitu kenaikan nilai X, diikuti dengan kenaikan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan penurunan nilai Y, sebagaimana diilustrasikan pada Gambar 7.1 (d), Gambar 7.1 (e) dan Gambar 7.1 (f). Nilai r = 1 menunjukkan kedua peubah berkorelasi positif secara sempurna.
AnalisisKorelasi
183
(a) r=-0.99
-80
(b) r=-0.75
3
(c) r=0
-80
-90
-90
-100
-100
Y 40 45 X 50 55 -2 40 -1 0
-110
40
45 X
50
55
-120
45 X
50
55
(d) r=0.60
120
(e) r=0.70
110
(f) r=0.99
120
100
110
90 100
90
Y 80 70 40 45 X 50 55 80 40 90
70
80
40
45 X
50
55
100
45 X
50
55
Gambar 7.1
Diagram pencar data ( X,Y ) dengan berbagai nilai korelasi
7.1.1
MENGHITUNG KORELASI SECARA MANUAL
Untuk ukuran sampel yang relatif kecil, perhitungan koefisien korelasi secara manual menggunakan persamaan (8.1) masih mungkin dilakukan. Adanya Sebelum komputer atau kalkulator, perhitungan secara manual banyak juga dilakukan dengan mengunakan teknik yang disebut peta korelasi (lihat misalnya Hadi [8]).
184
Contoh 7.1
Berikut adalah contoh pasangan data fiktif dengan jumlah pasangan 10 sehinga masih mungkin dihitung secara manual.
x 8 10 5 6 7 8 9 5 10 4 72 y 5.00 4.00 3.00 3.00 4.00 4.00 5.00 3.00 5.00 2.00 38 3.8 xy 40 40 15 18 28 32 45 15 50 8 291 x2 64 100 25 36 49 64 81 25 100 16 560
2
xy
x
2
y y
2
y2 25 16 9 9 16 16 25 9 25 4 154
2
x /n y /n xy /n x
7.2
29.1
56 /n
15.4 /n
Hasil perhitugan pada tabel di atas selanjutnya dimasukkan ke dalam rumus pada persamaan 8.1 sehingga diperoleh:
r= 291 1/10 72 38 560 72 /10 154 38 /10
2 2
17, 4 = 0,87 19,98
Hasil yang sama diperoleh dengan menghitung mengunakan R.
7.1.2
MENGHITUNG KORELASI DENGAN RCOMMANDER
Ada dua macam korelasi yang dapat dihitung melalui RCommander, yaitu 1. Matriks korelasi yang sekaligus menghitung korelasi beberapa (lebih dari dua) peubah (lihat Gambar 7.2).
AnalisisKorelasi
185
2. Uji korelasi untuk menghitung dan menguji korelasi antara dua peubah. Dengan uji ini kita dapat menguji apakah korelasi antara dua peubah signifikan atau dapat diabaikan (Gambar 7.3).
Gambar 7.2 Menu dialog Matriks Korelasi untuk korelasi Pearson dan Spearman
Berikut adalah hasil keluaran matriks korelasi untuk empat peubah. Dalam matriks ini yang dihitung hanya besarnya korelasi tanpa ada uji apakah korelasinya bermakna atau tidak.
NFis NIng NMat Pkn
NFis 1.0000000 0.3040950 0.8152343 0.3533408 NIng 0.3040950 1.0000000 0.2653100 0.7178789 NMat 0.8152343 0.2653100 1.0000000 0.4906039 Pkn 0.3533408 0.7178789 0.4906039 1.0000000
186
Gambar 7.3 Menu dan Dialog Uji Korelasi Pearson dan Spearman
Salah satu korelasi dari empat peubah (misalnya antara NFis dengan Nmat) di atas dapat diuji lebih jauh melalui uji korelasi. Hasil analisisnya adalah sebagai berikut ini.
1. Pearson's product-moment correlation 2. data: DataSim$NFis and DataSim$NMat
3. t = 12.4323, df = 78, p-value < 2.2e-16 4. alternative hypothesis: true correlation is not equal to 0 5. 95 percent confidence interval: 0.7254628 0.8777313 6. sample estimates: cor 0.8152343
Keterangan 1. Judul uji yaitu Uji korelas produk momen dari Pearson
AnalisisKorelasi
187
2. Nama data dan peubah yang korelasinya diuji, yaitu data DataSim varianel NFis dan NMat. 3. Besarnya nilai t hitung (12,43), derajat kebebasan (78) dan nilai peluang p (<1%, yang berarti sangat signifikan). 4. Rumusan hipotesis alternatif (yaitu korelasi tidak sama dengan 0) 5. Interval keyakinan 95% dari korelasi populasi yaitu [0,73; 0,88]. 6. Korelasi sampel (cor), yaitu 0,82 yang secara manual pada prinsipnya dapat dihitung dengan menggunakan rumus pada persamaan Pers. 7.1. Dari hasil uji dapat disimpulkan bahwa nilai korelasi kedua peubah tersebut adalah 0,82. Hasil ini sangat signifikan (p-value < 2.2e-16). Interval keyakinan 95% korelasi populasi adalah 0,73 r 0,88.
Koefisien korelasi hanya mengukur derajat asosiasi asosiasi dua peubah acak, yaitu menjelaskan tren umum apakah kenaikan atau penurunan nilai pada salah satu peubah akan diikuti dengan kenaikan atau penurunan pada nilai peubah yang lain. Analisis korelasi belum bisa dijadikan alat untuk memprediksi nilai suatu peubah apabila nilai peubah yang lain diketahui. Jika kepentingannya adalah untuk memprediksi nilai suatu peubah berdasarkan nilai peubah yang lain, maka harus dilakukan uji regresi.
7.2 ANALISIS REGRESI SEDERHANA

Jika dalam analisis korelasi peneliti hanya tertarik pada derajat asosiasi atau kecenderungan umum dua buah peubah atau lebih, maka dalam analisis regresi peneliti ingin memperoleh hubungan fungsional antara dua peubah yang dinyatakan dalam bentuk Y = a + bX , yang merupakan penduga dari fungsi yang ada pada populasi yang biasa dinotasikan dengan Y = + X , atau Y = 0 + 1 X ,
atau
untuk
peubah
bebas
lebih
dari
satu
dinyatakan
sebagai
Y = 0 + 1 X 1 + 2 X 2 ,... Melalui analisis regresi peneliti ingin menghitung nilai

188 ANALISISKORELASIDANREGRESI
penduga untuk j yang sesuai dengan data. Selain melakukan penghitungan nilai penduga untuk j juga sekaligus melakukan uji apakah nilainya signifikan atau dapat diabaikan (tidak signifikan). Analisis regresi sederhana hanya terdiri atas satu peubah bebas (peubah penjelas/eksplanatori) X dan satu peubah terikat (respon) Y dengan hubungan linier. Kedua peubah ini merupakan peubah kuantitatif, khusus untuk Y harus dengan skala interval atau rasio. Dengan visualisasi secara geometris (lihat Gambar 7.9) dapat ditafsirkan bahwa dengan analisis regresi kita ingin menduga garis populasi yang sesungguhnya tidak pernah diketahui (garis lurus putus-putus) berdasarkan sampel pasangan data pada sampel. Persoalanvini merupakan persoalan estimasi uji inferensi daam regresi. Garis regresi penduga ini dapat dipergunakan untuk meramal (prediksi) rentang rata-rata nilai Y pada saat nilai X diketahui, demikian juga rentang nilai-nilai Y pada saat nilai tertentu dari X .Persoalan yang terakhirt ini merupakan persoalan prediksi dalam regresi
AnalisisRegresiSederhana
189
Diagram Pencar & Sabuk Keyakinan

150 y 0 0 50 100
10 x
15
20
25
Gambar 7.4
Ilustrasi Garis regresi populasi, regresi penduga dengan sabuk keyakinannya.
7.2.1
ESTIMASI DAN UJI INFERENSI PARAMETER REGRESI
Pendugan dengan metode statistika selain menghasilkan dugaan (garis lurus langsung), juga menghasilkan batas
berupa garis
simpangan garis secara
keseluruhan yang membentuk sabuk keyakinan. Secara umum, pendugaan termasuk baik, jika garis populasi masih berada didalam batas sabuk keyakinan yang terbentuk. Secara geometris, kita mencari garis yang menjadi penduga garis regresi populasi, adalah garis yang paling mewakili sebaran data yang kita miliki.
Garis yang paling mewakili adalah garis lurus sedemikian sehingga simpangan titik-titik data terhadap garis menjadi minimum. Salah satu cara menentukan penduga garis ini adalah dengan metode kuadrat terkecil yang pada dasarnya meminumkan bentuk kuadrat Q = ei2 = [ y ( 0 + 1 xi ) ] ,
2
terhadap parameter j untuk
j=1,2. Dengan kata lain kita mencari 0 , 1
sedemikian sehingga Pers. 7.2 memcapai nilai minimum. see = y 0 + 1 xi i =1

n
Pers. 7.2
Penurunan secara matematus menghasilkan Pers. 7.3
0 = y 1 x ,
Pers. 7.4
1 =
x y
i =1 i n
1/ n xi yi
i =1 i =1 n 2
x 1/ n xi i =1 i =1
2 i
Pers. 7.5 dengan
1 =
s xy s xx
Pers. 7.6
s xy = xi yi
i =1
xi yi
i =1 i =1
n xi n 2 , s xx = xi i =1 n i =1
Jika rumus pada Pers. 7.4 dikaitkan dengan rumus pada Pers. 8.1, maka dengan pengetahuan matematika yang mencukupi dapat ditunjukkan bahwa
Pers. 7.7
1 = rxy
sx , dengan s x = s xx ; s y = s yy sy
191
Oleh karena sx dan sy adalah nonnegatif, 8.3 diperoleh hubungan
maka tanda tanda koefisien regresi
(positif atau negatif) sama dengan koefisien korelasi. Selanjutnya dari Pers. 8.2 dan
see = s yy 1s xy ,
n yi n 2 dengan s yy = yi i =1 . n i =1 Selanjutnya penduga ragam populasi

Pers. 7.8
2 = s2 =
see . n2
Hal ini dijadikan dasar perhitungan kesalahan baku untukpenduga koefisien regresi dengan memperhatikan bahwa: 1. Y adalah peubah acak dengan ragam 2 , sementara X bukanlah peubah acak, dan. 2. var( ay + c ) = a 2 var( y ) untuk a dan c konstanta, maka kesalahan baku masingmasing penduga adalah
= s2 1 s2 x2 2 21 = + ,dan s s 0 s xx n s xx ) dan 0 / s 0 masing-masing menghasilkan distribusi t dengan
Pers. 7.9
3. rasio
1 / s 1
derajat kebebasan (n-2). 4. Sedangkan uji keseluruhan F = s xx menghasilkan distribusi F dengan see /( n 2)
2 derajat kebebasan (1,n-2). Secara praktis F diperoleh dari t 1
192
Selain melalui uji, kemanfaatan garis regresi yang diperoleh juga dilihat dari besarnya koefisien determinasi (kuadrat korelasi). Garis regresi akan semakin baik, jika nilai koefisien determinasinya mendekati 1. Dalam buku ini pembahasan lebih difokuskan pada interpretasi hasil perhitungan dengan menggunakan komputer. Prosedur pengujian analisis regresi sederhana adalah seperti berikut ini. 1. Rumusan Tujuan Untuk menguji apakah ada hubungan atau hubungan linier signifikan antara ) ) ) ) dua peubah yang ditunjukkan oleh Y = a + bX = + X = 0 + 1 X . 2. Asumsi a. Data peubah respons Y bedistribusi Normal dengan ragam konstan b. Sisa (residu), yaitu selisih antara data asli dengan garis regresi
berdistribusi normal dengan nilai-tengah nol dan ragam konstan. c. Hubungan antara peubah X dan Y bersifat linier. 3. Rumusan Hipotesis untuk masing-masing koefisien a. Hipotesis nihil Ho: semua koefisien koefisien regresi sama dengan 0. b. Ha untuk uji dua arah (two tails test) Ha: Tidak semua semua koefisien regresi sama dengan 0. 4. Rumusan Hipotesis untuk uji keseluruhan a. Hipotesis nihil Garis regresi yang diperoleh tidak signifikan b. Hipotesis alternatif
193
Garis regresi yang diperoleh signifikan 5. Rumus Manual (lihat persamaan-persamaan sebelumnya) 6. Kriteria a. Uji masing-masing koefisien dilakukan dengan melihat nilai tmasingmasing koefisien atau berdasarkanb p-value-nya. Berdasarkan nilai kritis
,
tn 2, / 2
untuk hipotesis dua arah, Ho ditolak jika dan hanya jika
| thitung | tn 2, / 2 . Sedangkan berdasarkan nilai p (p-value), Ho ditolak

dan Ha diterima jika p-value < 5%. Perhatikan bahwa nilai p berubah
sesuai jenis hipotesis alternatif yang dipilih (satu atau dua arah). Kriteria ini yang banyak diimplemantasikan pada paket-paket statistika. b. Uji keseluruhan dengan melihat nilaistatistik F dan menolak Ho Secara grafis, contoh sebaran data asli dan sisa yang ideal memenuhi asumsi dapat dilihat pada Gambar menyebar dengan 7.5. Pada gambar tersebut terlihat bahwa data dan sisa
lebar dari kiri ke kanan relatif sama (ragam konstan) dan
mengikuti garis lurus.

Sebaran Data Asli
10
Sisa
60
50
sisa
40
30
10
15
20 x
25
30
-10
-5
30
40 pred
50
60
Gambar 7.5 Diagram Pencar Data Asli (sebelah kiri) dan Sisa (sebelah kanan)
Contoh 7.2
Jika data pada Contoh 7.1 diteruskan dengan perhitungan koefisien regresi maka akan diperoleh
1 =
=
x y
i
1/ n xi yi
2
xi2 1/ n ( xi )
291 1/10 72 38 17,4 = =0,48 2 41,6 560-72 /10
Sementara itu,
0 = 1/ n yi
xi n = 3,8 0, 42 7, 2 = 0,788
Hasil yang sama diperoleh dengan menggunakan RCommander. Dialog analisis regresi sederhana dengan RCommander dapat dilihat pada Gambar 7.6.
Gambar 7.6 Dialog regresi linier sederhana untuk peubah NFis dan NMat
Contoh 7.3
Berikut adalah uji regresi untuk peubah NFis (Y) dan NMat (X) dari DataSim. Dialog untuk peubah ini dapat dilihat pada Gambar 7.6. Keluaran dari program tersebut adalah seperti berikut ini. Keluaran tersebut diberi nomor untuk
memudahkan penjelasan.
1. Call: AnalisisRegresiSederhana 195
lm(formula = NFis ~ NMat, data = DataSim) 2. Residuals: Min -29.4726 1Q -2.6436 Median -0.5996 3Q 1.0129 Max 34.2166
3. Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) NMat --4. Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 8.55473 0.83811 5.12003 0.06741 1.671 12.432 0.0988 . <2e-16 ***
5. Residual standard error: 7.175 on 78 degrees of freedom 6. Multiple R-Squared: 0.6646, Adjusted R-squared: 0.6603 p-value: < 2.2e-16
7. F-statistic: 154.6 on 1 and 78 DF,
Keterangan keluaran 1. Nama fungsi linier model (lm) R yang dipanggil, dengan data dan peubah terkait. Pada contoh di atas data diambil dari DataSim dengan bentuk model NFis=f(NMat), yaitu peubah respons adalah NFis dan peubah penjelas adalah NMat. Dalam konteks ini peneliti ingin memperoleh hubungan fungsional antara Nilai Ujian Fisika dengan Nilai Ujian Matematika. 2. Sebaran (statistik ringkas) dari kesalahan (sisa), yaitu penyimpangan antara dugaan garis regresi dengan data.Sisa ini secara teoritis harus berpusat di 0 simetris dan dengan ragam konstan. 3. Hasil pendugaan koefisien dan uji signifikansinya. Pada contoh di atas diperoleh:
a. intercept (titk potong/konstanta) a=8,55 dengan nilai p = 0,099. Angka ini menunjukkan bahwa konstanta regresi tidak signifikan. Walaupun nilainya cukup besar (8,55) tetapi secara statistik dapat diabaikan. Dengan kata lain model yang lebih tepat adalah model Y=bX. Ini juga menunjukkan bahwa pada saat tingkat nilai X=0, maka Y juga cenderung 0. Namun kusus untuk uji konstanta (intercept), nilai 0,09% dapat dianggap sebagai nilai marjinal (dekat dengan 5%),oleh karena itu konstanta cenderung dibiarkan pada model. b. Koefisien regresi untuk peubah NMat, b,besarnya 0,83 dengan nilai p <2e-16. Ini menunjukkan bahwa koefisien ini sangat signifikan
(walaupun secara matematis nominalnya jauh lebih kecil dibanding konstanta). Pada perhitungan ini dapat dilihat bahwa c. t0 = 1, 67 = Estimate = 8,55 Std .Error = 5,12
d.
t 1 = 12, 43 =
Estimate = 0,83 Std . Error = 0,067
4. Tingkat signifikansi yang diperoleh (0%, 0,1%, 1%, 5%, 10% dan 100%) 5. Kesalahan baku dari sisa dan derajat kebebasannya (besarnya n-2). 6. Koefisien determinasi asli dan koefisien determinasi yang telah disesuaikan. Koefisien determinasi yang baik adalah yang mendekati 1. Semakin mendekati 1, semakin baik. Koefisien determinasi yang rendah menunjukkan banyak data yang pemyebar jauh dari garis regresi. Besarnya koefisien determinasi berbanding terbalik dengan besarnya kesalahan baku sisa. Jika kesalahan baku besar, koefisien determinasi cenderung kecil (Lihat contoh keluaran berikutnya).
197
7. Uji signifikansi garis regresi secara keseluruhan yang menggunakan uji F

2 menghasilkan F=154,6 = (12,432)2 = t pada derajat kebebasan (1 dan n-2). 1
Pada contoh ini hasilnya signifikan (p-value: < 2.2e-16). Contoh di atas menunjukkan bahwa secara keseluruhan uji regresi menunjukkan hasil yang signifikan (ada hubungan signifikan antara nilai Fisika dan Matematika), tetapi hubungan yang diperoleh tidak cukup baik dipergunakan untuk prediksi karena koefisien determinasinya relatif rendah (0,66). Ini menunjukkan bahwa banyak nilai yang menyebar jauh dari garis regresi seperti ditunjukkan oleh diagram pencar pada Gambar 7.7.
NFis
50 50
60
70
80
90
60
70 NMat
80
90
Gambar 7.7
Diagram Pencar Data NMat dan Nfis dengan koefisien determinasi relatif rendah
198
Contoh 7.4
Pada contoh berikut ini diberikan ilustrasi hasil analisis regresi antara peubah Y dan X, dengan hasil yang signifikan baik pada koefisien maupun konstantanya serta dengan koefisien determinasi yang lebih tinggi.
Residuals: Min 1Q Median 3Q 0.696098 Max 3.630627
-1.927959 -0.797888 -0.003435
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x --Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 4.93500 -2.00117 1.76506 2.796 0.00742 ** < 2e-16 ***
0.03575 -55.973
Residual standard error: 1.083 on 48 degrees of freedom Multiple R-Squared: 0.9849, F-statistic: Adjusted R-squared: 0.9846 p-value: < 2.2e-16
3133 on 1 and 48 DF,
Hasil di atas menunjukkan bahwa uji regresi sangat
signifikan, baik untuk
konstanta maupun koefisien regresinya (semua nilai-p nya kurang dari 1%) demikian juga uji keseluruhan menggunakan uji F. Model yang diperoleh juga dapat digunakan untuk prediksi dengan baik dengan koefisien determinasi yang besar (0,98) dan kesalahan baku yang relatif kecil (1,08). Ini menunjukkan bahwa hubungan kedua peubah hampir sempurna dan sebaran datanya tidak jauh dari garis regresi, seperti ditunjukkan oleh diagram pencar pada Gambar 7.8.
199
y1
-110
-100
-90
-80
40
45 x
50
55
Gambar 7.8 Diagram Pencar X dan Y
7.2.2
PREDIKSI DALAM REGRESI
Setelah mendapat penduga regresi yang signifikan, yang ditunjukkan oleh adanya uji signifikansi secara keseluruhan, selanjutnya kita dapat menggunakan hasik tersebut untuk kepentingan prediksi nilai Y atau rata-rata Y pada saat nilai X tertentu (misalnya x). Sebagaimana telah disebutkan sebelumnya, prediksi ini akan bermanfaat atau lebih akurat apabila koefisien deterministiknya cukup besar (mendekati 1) yang berarti data menyebar secara homogin dekat dengan garis regresi. Secara umum ada dua jenis prediksi yang dapat dilakukan, seperti berikut ini: 1. Prediksi nilai rata-rata Y pada saat nilai X tertentu, misalnya xp. 2. Prediksi nilai Y pada saat nilai X tertentu. Prediksi di atas pada dasarnya adalah penduga interval dengan nilai penduga titik = 0 + 1 x . Kesalahan baku dari keduanya adalah sebagai berikut y
2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s s = see + + s xx n s xx n
2 y
Pers. 7.10
200
Pers. 7.11
2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s 1 + + s = see 1 + + s xx n s xx n 2 $ y
Kedua prediksi di atas berbeda dalam lebar interval dugaan karena penduga ratarata dan penduga nilai tunggal nilai Y memiliki kasalahan baku yang berbeda.
Dengan
seseorang
dapat
menghitung
prediksi
tersebut
sekaligus
mengilustrasikannya dalam bentuk grafik seperti pada Gambar 7.9. Pada gambar tersebut prediksi dilakukan pada saat nilai X sama dengan rata-rata X, yaitu
x =12,5. Pada saat itu nilai penduga titiknya adalah 67,66 (10,76 + 4,55x ) dengan
penduga interval 95% untuk rata-rata y |x =12,5 adalah [62,13; 73,18] dan interval
penduga 95% dari y |x =12,5 adalah [28,18; 107,10]
201
Diagram Pencar & Sabuk Keyakinan

150
100
Batas interval rata-rata Y Batas interval Y
y 0 0 50
10 x
15
20
25
Gambar 7.9
Ilustrasi Garis regresi populasi, regresi prediksi nilaiY dan ratarata Y pada saat nilai tertentu dari X dengan interval keyakinannya.
7.3 MODEL LINIER: REGRESI PEUBAH GANDA

RCommander menyediakan menu untuk analisis regresi dengan model yang lebih kompleks yaitu model dengan lebih dari satu peubah bebas (penjelas) baik berupa peubah kuantitatif maupun faktor (seperti jenis kelamin atau pengelompokan lain dalam populasi). Dialog untuk model linier diberikan pada Gambar 7.10. Dalam dialog itu ada beberapa hal yang harus diperhatikan yaitu:
202
1. Nama model yang terisi secara otomatis sesuai jenis regresi yang dipanggil (linier model, GLM dan sebagainya) 2. Nama-nama peubah (dengan jenisnya). Kita bisa mengetahui peubah yang berupa kuantitatif maupun faktor. meng-klik. 3. Rumusan formula model. Model dalam R dinyatakan dalam bentuk Y=f(X1,X2,...) dengan Y adalah peubah respons dan Xi adalah peubah bebas. Secara umum untuk peubah kuantitatif penambahan beberapa peubah kuantitatif dinyatakan dengan tanda +, misalnya X1+X2. Peubah-peubah ini bisa dipilih dengan
Gambar 7.10 Dialog Model Linier
Hasil analisis regresi dengan banyak peubah pada dasarnya sama dengan hasil analisis sebelumnya hanya koefisien yang diestimasi lebih banyak yaitu konstanta dan koefisien masing-masing peubah bebas. Berikut adalah contoh keluaran analisis regresi untuk dua peubah bebas NMat dan NIng terhadap NFis. Misalkan kita ingin menguji hubungan NFis = 0 + 1 NMat + 2 NIng . Dalam Formula dituliskan
ModelLinier:RegresiPeubahGanda
203
NFis ~ NMat + NIng Keluaran yang dihasilkan adalah seperti berikut ini.
Call: lm(formula = NFis ~ NMat + NIng, data = DataSim)
Residuals: Min -29.0987 1Q -2.9626 Median -0.4881 3Q 1.7663 Max 32.4172
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) NMat NIng --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 1.67825 0.81235 0.10519 7.07947 0.06950 0.07528 0.237 11.689 1.397 0.813 <2e-16 *** 0.166
Eksplorasi lebih jauh
1. Aktifkan salah satu data yang ada pada Ratau yang ada pada CD (format excel) 2. Lakukan uji regresi baik dengan 1 atau lebih peubah penjelas. 3. Periksa nilai pengujian masing-masing koefisien 4. Periksa nilai pengujian secara keseluruhan 5. Periksa nilai koefisien determinasinya 6. Jelaskankesimpulan anda terhadaphasil pengujian yang dilakukan.
7.4 DIAGNOSTIK MODEL MELALUI GRAFIK

Pemeriksaan terhadap kecocokan analisis regresi dengan kondisi data yang dianalisis disebut diagnostik model. Salah satu cara mendiagnostik model adalah dengan melihat sebaran sisa (residu). Residu atau sisa adalah selisih antara nilai observasi (observed value) dengan nilai dugaan yang diperoleh melalui garis regresi (predicted value). Residu ini merupakan penduga dari kesalahan atau error. Secara geometris, sebenarnya pencaran residu ini sama dengan pencaran data hanya sumbu X nya ditransformasi berimpit dengan garis regresi. Seperti telah disampaikan sebelumnya bahwa asumsi ideal untuk analisis regresi linier adalah bahwa sisa menyebar normal dengan rata-rata 0 dan ragam konstan. Syarat kekonstanan varians ditunjukkan oleh adanya sebaran merata sehingga lebar sebaran dari kiri ke kanan relatif konstan. Adanya ketidak konstanan ragam
ditandai dengan lebar sebaran yang tidak sama dari kiri ke kanan. Data yang mempunyai ragam konstan disebut bersifat homoskedastik sebaliknya disebut bersifat heteroskedastik. Pemeriksaan model dengan RCommander dapat
dilakukan dengan memilih menu model dan opsi grafik pada plot diagnostik dasar seperti terlihat pada Gambar 7.11 Diagnostik grafik ini menampilkan empat grafik dasar seperti berikut ini. 1. Grafik Nilai prediksi dengan sisa. Grafik ini menggambarkan hubungan antara garis regresi yang diperoleh dengan sisa. Secara umum sebaran sisa harus menunjukkan sebaran acak disekitar nilai nol dengan lebar yang relatif sama. Apabila sebaran menunjukkan pola tertentu (misalnya membentuk kurva, lebar tidak konstan), ini mengindikasikan bahwa model yang dipilih kurang baik.
DiagnostikModelMelaluiGrafik
205
Gambar 7.11 Menu dan Dialog Diagnostik Grafik
2. QQPlot Normal dari sisa yang telah dibakukan. QQ-Plot Normal pada dasarnya adalah grak yang mennyajikan sebaran quantil normal teoritis, dengan quantil data. Apabila datanya berdistribusi normal maka sebarannya akan mendekati garis lurus. Penyimpangan yang sangat mencolok pada ujung-ujung grak menunjukkan datanya menyimpang dari distribusi normal. Untuk data yang tidakmemenuhi distribusi normal dapatdilakukan transformasi ataupun dengan memilih alternatifregresi yang lain. 3. Grafik Nilai Prediksidengan akar Sisa baku. Penafsirannya sama dengan grafik pertama, hanya yang diperiksa sekarang adalah sisa yang telah dibakukan (standarized residual). 4. Grafik leverage terhadap sisa baku. Dalam grafik ini juga digambarkan batas jarak Cook (Cooks distance) untuk memeriksa adanya pencilan (outlier). Jika ada nilai residu yang berada di luar batas jarak, ini mengindikasikan adanya pencilan. Perlu diadakan pemeriksaan terhadap pencatatan dataapakah ada kesalahan pencatatan atau tidak. Jika pencilan tidak banyak (1-2 observasi), dapat dipertimbangkan mengecualikan observasi tersebut dalam analisis regresi.
206
Standardized residuals
Residuals vs Fitted
4
50
Normal Q-Q
2
50
Residuals
-6 -4 -2 0
22 43
-3 -2 -1 0
22 43
30
40
50
60
-2
-1
Fitted values
Theoretical Quantiles
1.5
43 50 22
Scale-Location
Residuals vs Leverage
59 20
1.0
0.5
-1 0
0.0
-3
Cook's distance 0.00 0.02 0.04
43
0.5
30
40
50
60
0.06
0.08
Fitted values
Leverage
Gambar 7.12
Grafik Diagnostik untuk Model Regresi yang relatif memenuhi syarat kenormalan dan bebas dari pencilan.
207
lm(y ~ x)
Residuals vs Fitted
60
13 3
Normal Q-Q
2 4
13 3
Residuals
-60 -20 20
-4
20
0
20
35
40
45
50
55
-2
-1
Fitted values
Theoretical Quantiles
2.0
1.0
0 2 4
13
3 20
Scale-Location
Residuals vs Leverage
3 13 1 0.5
0.0
Cook's distance 20 0.00 0.02 0.04 0.06
0.5 1
35
40
45
50
55
-4
0.08
Fitted values
Leverage
Gambar 7.13
Grafik Diagnostik untuk Model Regresi yang kurang memenuhi syarat kenormalan dan mengandung pencilan
Ada beberapa kondisi data yang menyimpang dari asumsi yang menjadi persyaratan analisis regresi seperti berikut ini. 1. Hubungan antara respon dengan peubah penjelas tidak linier. Kondisi ini dapat ditangani dengan melakukan transformasi pada peubah respon maupun pada peubah penjelas,lalu menganalisis data yang telah ditransformasi sehingga model yang dipergunakan tidak lagi sederhana seperti Y = 0 + 1 X , tetapi
208
model
yang
telah
ditransformasi
seperti
log(Y ) = 0 + 1 X
atau
Y = 0 + 1 log( X ) dan sejenisnya. 2. Respon tidak menyebar normal, termasuk adanya pencilan maupun hasil pengamatan ekstrim. Terhadap kondisi ini cara sederhana untuk menanganinya adalah dengan mencoba analisis tanpa mengikut sertakan pencilan (terutama kalau pencilannya hanya 1-2 pengamatan). Tentang persyaratan normal, secar emperik telah dibuktikan oleh para praktisi melalui simulasi bahwa dampak akibat penyimpangan terhadap distribusi normal tidak seserius seperti yang dikhawatirkan (Stafsof [22]). 3. Respon menyebar dengan ragam tidak konstan. Jika respon tidak homogen tetapi masih memenuhi distribusi normal, kondisi ini dapat ditangani dengan memberikan pembobotan (dengan invers ragam) pada perhitungan estimasi parameter. Metode ini disebut wighted least square yang secara umum telah diimplementasikan pada paket-paket program statistika. 4. Untuk peubah penjelas lebih dari satu, terjadi korelasi signifikan di antara beberapa peubah penjelas. Kondisi ini sering disebut multi kolinieritas. Hal ini akan berakibat pada kurang akuratnya hasil estimasi parameter, karena dalam perhitungannya akan melibatkan matriks yang mendekati singuler sehingga inversnya sulit dihitung. Cara sederhana menangani kondisi ini adalah dengan memilih hanya salahsatu dari peubah-peubah penjelas yang memiliki korelasi tinggi. Misalnya jika ternyata peubah X1, X3, dan X4 berkorelasi signifikan, maka cukup salah satu saja yang dimasukkan ke dalam model regresi.
Contoh 7.5
Dalam contoh berikut diilustrasikan analisis regresi dengan 1-2 nilai pencilan. Analisis regresi dilakukan dua kali dengan mengikutsertakan seluruh data dan mengecualikan data pencilan. Dapat kita lihat adanya perubahan signifikan dari hasil kedua analisis tersebut.
209
Berikut adalah contoh Analisis regresi dengan data yang mengandung satu pencilan. Data dianalisis dua kali msing-masing dengan menyertakan dan mengabaikan pengamatan pencilan tersebut. 1. Analisis data lengkap yang mengandung pencilan
Call: lm(formula = y1 ~ x1, data = DataSimReg)
Residuals: Min -17.842 1Q -5.810 Median -1.492 3Q 2.713 Max 86.675
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x1 --Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 31.3226 2.6286 14.0512 0.2769 2.229 0.0318 *
9.492 1.43e-11 ***
Residual standard error: 15.6 on 38 degrees of freedom Multiple R-Squared: 0.7033, Adjusted R-squared: 0.6955 F-statistic: 90.09 on 1 and 38 DF, p-value: 1.426e-11
210
2. Hasil analisis dengan mengecualikan pengamatan yang menjadi pencilan. Pada analisis ini data pencilan dikeluarkan dari analisis (dianggap munculnya pencilan sebagai akibat kesalahan pencatatan data).
Call: lm(formula = y1 ~ x1, data = DataSimReg)
Residuals: Min 1Q Median 0.5353 3Q Max
-9.1295 -3.9094
3.4954 10.4447
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x1 --Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 6.36779 3.08027 4.74300 0.09286 1.343 33.171 0.188 <2e-16 ***
Residual standard error: 5.037 on 37 degrees of freedom (1 observation deleted due to missingness) Multiple R-Squared: 0.9675, Adjusted R-squared: 0.9666 F-statistic: 1100 on 1 and 37 DF, p-value: < 2.2e-16
Ringkasan keduanya adalah sebagaimana disajikan dalam berikut (Diagram pencar diberikan pada Gambar 7.14)
No Komponen Data Lengkap Mengecualikan
211
Pencilan*)
1 2
df Koefisien Konstanta Koefisien X1
38
37
31,32 2,62 0,70
6,36 3,08 0,97
Koef Determinasi
Catatan : *) Dalam analisis ini, Satu observasi diabaikan dan dianggap hilang (yaitu data yang merupakan pencilan), sehingga derajat kebebasan berkurang satu.
220
200
180
160
y1
140
120
100
100 30
120
140
160
y1
180
200
220
30
40
50 x1
60
70
40
50 x1
60
70
Gambar 7.14
Diagram Pencar untuk Data Lengkap (kiri)dan untuk Data tanpa Pengamatan yang Dianggap Pencilan
Jika model memiliki residu yang menunjukkan adanya penyimpangan dari syarat yang harus dipenuhi, maka sebaiknya
212
dilakukan perbaikan model sehingga

persyaratan tersebut menjadi relatif terpenuhi. Salah satu yang biasanya dilakukan adalah dengan mentransformasikan data dengan suatu fungsi yang sesuai. Selanjutnya data hasil transformasi ini dianalisis dengan regresi klasik yang menggunakan asumsi distribusi normal dengan hubangan linier.
7.5 ANALISIS REGRESI ALTERNATIF

Dalam kenyataannya,tidak semua data yang dihadapi memenuhi asumsi regresi linier dengan baik. Selain melakukan hal-hal praktis seperti dianjurkan sebelumnya (misalnya membuang pengamatan, tidak menyertakan beubah), kita dapat juga melakukan hal lain yang lebih matematis, misalnya mentransformasikan data, atau memilih alternatif regresi yang tergolong dalam regresi modern.
7.5.1 TRANSFORMSI DATA
Jika sebaran residu menunjukkan ketidaklinieran, transformasi yang bisa dilakukan untuk mengatasi ketidak linieran diantaranya adalah seperti berikut ini.
AnalisisRegresiAlternatif
213
1. Jika sebaran membentuk kurva naik dan terbuka ke atas maka transformasi dapat dilakukan pada Y dan tranformasi yang bisa dicoba adalah Y1 = log(Y ) atau Y1 =Y atau Y1 =1/Y seperti terlihat pada Gambar 7.15.
120
140
100
log(y) 5 6 7 x 8 9 10
80
40
60
20
3.0 5
3.5
4.0
4.5
5.0
7 x
9 10
Gambar 7.15 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada Y
214
2. Jika sebaran membentuk kurva naik dan terbuka kebawah maka transformasi dilakukan pada X dan transformasi yang bisa dicoba adalah X1 = log(X) atau X1 = X atau X1 =1/X seperti terlihat pada Gambar 7.16
65
60
55
50
45
200
600 x
45 4.5
50
55
60
65
5.5 log(x)
6.5
Gambar 7.16 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X
215
3. Jika residu menyebar membentuk kurva menurun dan terbuka keatas maka transformasi dapat dilakukan pada kedua X atau Y dengan salah satu
transformasi sebelumnya seperti pada Gambar 7.17.
70
60
50
y 0 400 x 800
40
30
30 3
40
50
60
70
5 log(x)
Gambar
7.17 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X
Selain masalah keliniearan, masalah yang sering muncul dalam analisis regresi
adalah ketidak seragaman sebaran atau ragam data. Untuk menyeragamkan atau menghomoginkan varians, dapat dicoba beberapa transformasi diantaranya Y1 = log(Y), atau Y1 =Y atau Y1 =1/Y . Gambar 7.18 mengilustrasikan data asli yang
216
ragamnya tidakhomogin dan setelah melalui transformasi ragamnya menjadi homogin.
Plot Data Asli

150 80
Plot Residu
100
Residu 10 20 30 X 40 50
50
-40
20
40
60
40
60 Y-Prediksi
80
100
Plot Data Transformasi

5.0
Plot Residu
4.5
Residu 10 20 30 X 40 50
log(Y)
4.0
3.5
3.0
-1.0 3.4
-0.5
0.0
0.5
3.6
3.8
4.0
4.2
4.4
4.6
4.8
Y-Prediksi
Gambar 7.18Transformasi untuk Menghomoginkan Ragams
Pada dasarnya transformasi data dilakukan agar data yang tidak memenuhi peryaratan asumsi (kelinieran dan homoginitas varians)menjadi memenuhiasumsi dan dapat dianalisis dengan metode regresi klasik, Namun, ada kalanya transformasi untuk menangasi satu permasalahan (misalnya kelinieran), justru mendatangkan persoalan baru (misalnya ketidak seragaman varians), seperti diilustrasikan pada Gambar 7.19.
217
Plot Data Asli

1000 1500 2000 2500
Plot Residu
Residu 20 30 X 40 50
500
-100
100
200
500
1000 Y-Prediksi
1500
2000
Plot Data Transformasi

7.5 0.02
Plot Residu
7.0
Residu 2.6 2.8 3.0 3.2 log(X) 3.4 3.6 3.8
log(Y)
6.5
5.5
6.0
5.0
-0.01 5.0
0.0
0.01
5.5
6.0
6.5 Y-Prediksi
7.0
7.5
Gambar 7.19 Transformasi kelinieran menyebabkan ketidakhomoginan ragam
7.5.2
PENGANTAR REGRESI ALTERNATIF
Ada beberapa kondisi yang menyimpang atau lebih kompleks dari asumsi yang diperlukan untuk dapat melakukan analisis dengan regresi sederhana diantaranya: 1. Data mengandung peubah faktor/kualitatif dan kita ingin mengetahui apakah faktor tersebut mempengaruhi hubungan antara peubah kuantitatif lainnya. Misalnya apakah hubungan antara jumlah penghasilan dan jumlah pengeluaran konsumtif dipengaruhi oleh jenis kelamin atau pendidikan. Untuk melakukan analisis regresi seperti ini, secara teoritis kita dapat memperkenalkan peubah boneka (dummy variabel) yang dapat dilihat pada Neter etal. [20], Wonnacott & Wonnacott [35]. Aplikasi dengan R dapat dilihat pada Chamber & Hastie [2], Vanables & Ripley [32] 2. Terjadi pencilan yang cukupsignifikan mempengaruhi hasil analisis. Untuk data dengan pencilan yang
218
pencilannya tidak mungkin dibuang begitu saja,ada

analisis regresi yang disebut regresi tegar (robust regression) yangdapat mengurangi pengaruh adanyapencilan (lihat Venables & Ripley [32] 3. Respon berupa skala interval atau ordinal misalnya jumlah anak, jumlah istri atau jumlah kendaraan roda empat yang dimiliki, lulus-gagal, jenis merek barang yang banyak dipilih dan sejenisnya. Analisis regresi jenis ini termasuk dalam model linier tergeneralisir atau lebih dikenal dengan GLM (Generalized Linear Models). Analisis lain yang termasuk dalamkelompokinidiantaranya adalah Regresi logistik atau analisis Probit/Logit (untuk respon dengan distribusi Binomial atau bersekala nominal) dan log-linier untuk respon dengan distribusi Poison atau bersekala ordinal). Referensi untuk model linier ini diantaranya adalah McCullagh & Nelder [15], Chamber & Hastie [2], Vaeables & Ripley [32]. 4. Respon berupa peubah ganda, misalnya dalam eksperimen yang diamati
dampak lebih dari satu perlakuan (misalnya satu unit percobaan mendapat tiga atau lebih perlakuan) atau pengaruh satu perlakuan dilihat dalam lebih dari dua kurun waktu. (misalnya hubungan tekanan darah dan kolesterol yang diamati pada pagi, siang, dan sore hari. Percobaan seperti ini sering disebut pengukuran berulang (repeated meassure) atau studi jangka panjang (longoitudinal study). Salah satu analisis regresi atau model linier yang banyak dipakai untuk ini adalah GEE (generalized estimating equations) yang dipelopori oleh Liang & Zeger [13], [36] dan Diggle et al.[3] 5. Terjadi korelasi yang signifikan (multi kolinieritas) diantara peubah penjelas. Multi kolinieritas ini akan berakibat sulitnyamenghitung invers matriks yang diuperlukan dalam menghitung estimasi parameter. Selain menghilangkan dari model peubah yang berkorelasi, kondisi ini dapat juga ditangani melalui beberapa jenis analisi regresi diantaranya adalah regresi gulud (Ridge regression) Neter et al.[20], atau menggabungkan regresi dengan analisis komponen utama
219
7.6 RINGKASAN DAN BACAAN LEBIH LANJUT

7.6.1 RINGKASAN
1. Korelasi dan regresi merupakan dua analisis yang saling terkait. Analisis korelasi hanya mempelajari derajat asosiasi antara beberapa peubah sedangkan analisis regresi mempelajari fungsi atau model hubungan antara beberapa peubah yang diperlukan untuk memprediksi nilai suatu peubah bila nilai peubah lain diketahui. 2. Kondisi hubungan dua peubah, secara kasar dapat dilihat melalui diagram pencar. Pada diagram pencar data harus menyebar secara acak dengan kecenderungan membentuk garis lurus. 3. Koefisien determinasi adalah kuadrat dari koefisien korelasi. Model dengan koefisien determinasi tinggi (mendekati 1) menunjukkan data menyebar dekat dengan garis regresi, karenanya model yang diperoleh bermanfaat dalam melakukan prediksi.
7.6.2 BACAAN LEBIH JAUH
Analisis regresi atau modellinier telah berkembang dari analisis yang sederhana sampai berbagai bentuk khusus untuk menangani kondisi data yang kompleks. Pembahasan tentang regresi linier sederhana dapat dijumpai dalam banyak bukubuku teks statistika (Hadi[8], Sujana[23], Mendenhall[16],[17]). Sedangkan untuk regresi khusus (seperti regresi gulud, lihat Neter et al. [20]) dan regresi modern (misalnya GLM, HGLM, regresi tegar), pembaca dapat membaca Statsoft [22], Chamber & Hastie [2], Garson [5], McCullagh & Nelder [15], Vanables & Ripley [32].
220
DAFTAR PUSTAKA
[1]
Baird JH.2003. How Statistics Can Lie. Green Section Recoed. [Agustus 2008]
[2] [3]
Chamber JM & Hastie TJ.1993. StatisticalModels in S.Chapman & Hall Diggle PJ, Liang K-Y & Zeger SL, 1994. Analysis of Longitudinal Data. Oxford Science Publications.
[4]
Faraway JJ. 2002. Practical Regression and Anova Using R. http://www.stat. Isa.umic.edu/~faraway/book/
[5]
Garson
DG.
StatNotes:
Topics
in
Multivariate
Analysis. [Maret
http://StatNote/www2.chass.ncsu.edu\garson/pa765/statnote.htm 2008] [6]
Gravetter FJ & Wallnau LB. 2004. Statistics for the Behavioral Sciences. Thomson. International Student Eddition (6th Edition).
[7]
Guilford JP & Fruchter. 1978. Fundamental Statistics in Psychology and Education. International Student Edition(6th Edition). McGraw-Hill.
[8]
Hadi S. 1982. Statistika. Andi Offset, Yogyakarta.
RingkasandanBacaanLebihLanjut
221
[9]
Hair JF, Black WC, Babin BC, Anderson RE & Tatham RL. 2006. Multivariate Analysis. Pearson, Prentice Hall.
[10] Hogg RV, McKean JW, Craig AT. 2005. Introduction to Mathematical Statistics. 6-th edt. London: Pearson Education International [11] Kuhnert P & Venables WN. 2005. An Introduction to R: Software for Statistical Modelling & Computing. http://cran.r-project.org/
doc/contrib/Kuhnert+Venables-R_Course_Notes.zip [12] Lewis P. MODULE: Basic Statistics. http://philosophy.hku.hk/think/stat/ 5 Agustus 2008] [13] Liang K-Y. & Zeger.SL. 1986. Longitudinal data analysis using generalized linear models. Biometrka.73:13-22. [14] Maindonald JH. 2001. Using R for Data Analysis and Graphics An Introduction. http://www.r.project.org. [15] McCullagh P & Nelder JA. 1989. Generalized Linear Models. Chapman & Hall [16] Mendenhall W. 1979. Introduction to Probability and Statistics 5th edt. Massachussets:Duxbury. [17] Mendenhall W. 1993. Beginning Statistics A to Z. Duxbury [18] Murrell, P. 2006. R Graphics. Chapman & Hall/CRC [19] Nelder J.A. & Wedderburn, Generalized Linear Models. J.R.Statist.Soc.57: 359-407. [20] Neter J. Wasserman, Kutner. (1985) Applied Statistical Model. Homewood, Illinois :Irwin. [21] NIST/SEMATECH e-Handbook of Statistical Methods,
http://www.itl.nist.gov/div898/handbook/, [Januari 2008]
222
DAFTARPUSTAKA
[22] StatSoft. 2006. Electronic Statistics Textbook. http://www.statsoftinc.com/ textbook/ stathome.html [23] Sudjana. 1996. Metode Statistika. Tarsito, Bandung.
[24] Tirta.2005. Potensi dan Prospek Pemanfaatan OSS-R dalam Analisis Data dan Pengajaran Statistika. Pancaran Pendidikan. XVIII (61): 195-208 [25] Tirta, IM.2005. Panduan Program Statistika R. Penerbit Universitas Jember
[26] Tirta IM, Lestari B & Dewi YS. 2006. Estimasi Efek Tetap dan Acak pada Model Multiplikatif
7:59-66.
dengan Likelihood Bersama. Jurnal ILMU DASAR.
[27] Tirta IM. 2007. Analisis Data dengan Respons tidak Saling Bebas dengan paket hglm dan gee pada OSS-R. Makalah disampaikan pada Seminar Nasional Statistika VIII di ITS Surabaya. 3 Nopember 2007.
[28] Tirta IM. 2007. Pengembangan Piranti Lunak Statistika Berbasis OSS-R
(Development of Statistical Software). disajikan dalam seminar Nasional Statistika ke - 8 (SNS VIII) di FMIPA ITS surabaya pada tanggal 3 Nopember 2007
[29] Tirta IM.2007. R.GUI: Mendesain Paket Analisis dan Media Pembelajaran
Statistika. Penerbit Universitas Jember
[30] Tirta IM. 2008. Paket RcmdrPlugin.StatDemo. http://r.unej.ac.id [31] Tirta IM. 2008. Paket StatDemo. http://r.unej.ac.id [32] Venables WN & Ripley BD. 1994. Modern Applied Statistics with S-plus. Springer. [33] Vezalini J. 2002. Using R for Introductory Statistics.
http://www.r.project.org. [34] Wackerly, DD., Mendenhall W., Scheafer RL., 1996. Mathematical Statistics with Application. Massachussets:Duxbury.
RingkasandanBacaanLebihLanjut
223
[35] Wannacott TH & Wannacott RJ. 1990. Introductory Statisticsfor Business and Economics. Williey International Edition. [36] Zeger SL.& Liang KY. 1986. Longitudinal Data Analysis for Discrete and Continuous Outcomes. Biometrics. 42: 121-130 [37] Zoonekyn V. 2005. Statistics with R. http://zoonek2.free.fr/
UNIX/48_R/all.html
224
DAFTARPUSTAKA
LAMPIRAN
MENGUNDUH DAN MENGINSTAL R
R adalah program open source yang dapat diunduh dari internet. Berikut diuraikan cara mengunduh dan menginstal R terutama pada sistem opeasi Windows.
MENGUNDUH (MEN-DOWNLOAD) R
Ada beberapa cara yang dapat ditempuh untuk memperoleh program R beserta peket-peket pendukung (library)nya diantaranya adalah sebagai berikut. 1. Mengunjungi situs http://www.cran.r-project.org, lalu memilih situs bayangan (mirror) yang paling dekat dengan lokasi kita. Salah satu diantaranya adalah situs yang ada di Australia yaitu http://cran.au.r-project.org. Pengguna dapat mengunduh (download) program secara cuma-cuma. 2. Menghubungi Laboratorium Statistika Jurusan Matematika FMIPA Universitas Jember. Kepada pengguna dikenakan biaya mengunduh (download) dan pengemasan yang tidak mahal; 3. Menghubungi UPT Penerbitann Universitas Jember dan membeli salah satu panduan atau manual tentang R yang berisi paket Program R, diantaranya adalah Tirta [25] [29];
MengunduhdanMenginstalR
225
4. Mengunjungi situs http://r.unej.ac.id yang menyediakan salah satu versi R yang relatif masih baru. Komponen program yang diperlukan untuk dapat menjalankan R dan RCommander dengan baik adalah: 1. program R untuk windows yang biasanya diberi nama R-Versi-win32.exe; 2. semua paket pendukung/pustaka/library versi windows yang dibutuhkan seperti: aaMI_versi.zip,, zoo_versi.zip; 3. bagi yang ingin menggunakan R melalui skrip pemrograman diperlukan juga Tinn-R yaitu Tinn-R_versi_setup.exe. 4. Dalam notasi di atas, versi menunjukkan angka yang terkait dengan versi program bersangkutan, misalnya 2.5.0; 7.0.1 dan sebagainya.
MENGINSTAL R
Setelah memperoleh file R-versi-win32.exe, maka instalasi dilakukan sebagai berikut ini. 1. Klik R-versi-win32.exe, lalu akan muncul jendela dialog pemilihan bahasa. Saat ini belum ada dialog berbahasa Indonesia, untuk itu pilih English dan klik OK
Gambar 0.1 Tampilan Pemilihan Bahasa Instalasi 226 LAMPIRAN
2. Selanjutnya akan muncul dialog pembukaan, seperti berikut ini, kita tinggal klik Next, lalu akan muncul dialog tentang informasi Copy Right. Sempatkan membaca ketentuan yang berlaku, selanjutnya klik next.
Gambar 0.2 Tampilan Mulai Instalasi
Gambar 0.3 Tampilan Konfirmasi Lisensi GPL ( General Public License )
227
3. Untuk pemilihan direktori sebaiknya ikuti sesuai yang ada pada dialog, misalnya C:\Program Files\R\... Kecuali, untuk yang menggunakan Windows Vista, sebaiknya R diinstal tidak di hardisk C, tetapi di D atau E.
Gambar 0.4 Konfirmasi Direktori
4. Untuk dokumentasi, jika ruang hardisk anda cukup longgar sebaiknya pilih semua dokumentasi terkait. Jika tidak, pilih yang penting diantaranya adalah: HTML files help, Online (pdf) manual, Support files for tcltk, Message Translation, PDF Reference manuals.
228
LAMPIRAN
Gambar 0.5 Tampilan Konfirmasi Komponen R
5. Kustomisasi atau pengaturan Opsi Startup, pilih yes. Dengan pilihan tersebut selanjutnya akan muncul beberapa dialog berikut. Untuk mengatur agar tampilan grafik dan jendela R terpisah,
pilih SDI.
Untuk dokumentasi
bantuan/help bisa pilih CHM atau HTML. Untuk Startup ikuti pilihan yang telah disiapkan (default) R.
229
Gambar 0.6 Tampilan Pemilihan Pengaturan Startup Aplikasi
Gambar 0.7 Tampilan Pemilihan Jenis Tampilan
230
LAMPIRAN
Gambar 0.8 Tampilan Pemilihan Bahasa Instalasi
Gambar 0.9 Tampilan Pemilihan Folder Startmenu
6. Untuk tugas tambahan (Additional Tasks), minimal bisa dipilih (di klik check), Create desktop icon dan Create a Quick launch
231
Gambar 0.10 Tampilan Pemilihan Task Tambahan
7. Selanjutnya proses instalasi akan dimulai
Gambar 0.11 Tampilan Proses Instalasi
8. Jika selesai akan muncul dialog terakhir berikut. Klik finish untuk menyelesaikan instalasi R
232 LAMPIRAN
Gambar 0.12 Tampilan Akhir Proses Instalasi
MENGAKTIFKAN R DAN MENGINSTAL PAKET TAMBAHAN

Untuk memanggil atau mengaktifkan R kita bisa klik icon R yang ada di desktop. Untuk memunculkan menu atau dialog dalam Bahasa Indonesia perubahan pada properties icon ini. Pada baris target ditulis lakukan
"C:\Program Files\R\R-2.5.0\bin\Rgui.exe" LANGUAGE=id
Perlu diketahui bahwa, sampai saat ini menu dan dialog dalam Bahasa Indonesia hanya tersedia pada paket RCommander, belum sampai pada menu RGUI (Rconsole). Untuk memulai R, kita dapat mengklik short cut yang ada pada desktop, atau melalui Start Menu. Setelah R dipanggil, kita akan memperoleh tampilan yang disebut Console R dengan RGUInya seperti pada Gambar 0.14 atau Gambar 0.15 tergantung bahasa yang dipilih (Untuk menu RGUI belum ada pilihan Bahasa Indonesia).
MengaktifkanRdanMenginstalPaketTambahan 233
Gambar 0.13 Mengatur Pilihan Bahasa Menu dan Dialog R
234
LAMPIRAN
Gambar 0.14 Tampilan Rconsole dalam Bahasa Inggris
Gambar 0.15 Tampilan Rconsole Dalam Bahasa Indonesia
Berikut adalah langkah-langkah untuk menginstal paket tambahan.
MengaktifkanRdanMenginstalPaketTambahan
235
1. Aktifkan menu Packages sepert terlihat pada Gambar 0.17 Memilih Paket Tambahan
Paket-> Menginstal paket dari Zip lokal.
2. Selanjutnya pilih direktori tempat anda menaruh paket-paket tambahan (library) dari R, seperti pada Error! Reference source not found.. Ada
beberapa paket penting yang harus diinstal untuk dapat mengikuti penjelasan dalam buku ini yaitu: a. Rcmdr beserta paket-paket terkait (car, dsb), merupakan paket RGUI untuk analisis data yang dikembangkan oleh Fox dan dengan kontribusi menu bahasa Indonesia oleh Tirta. b. StatDemo_versi.zip merupakan paket khusus bernahasa Indonesia untuk ilustrasi pembelajaran statistika yang dikembangkan oleh Tirta [31] c. RcmdrPlugin.StatDemo sama dengan statDemo di atas, tetapi menunya bergabung dengan menu RCommander (Tirta [30]) d. RcmdrPlugin.hglm berisi paket hglm dan Menu GEE yang bergabung dengan menu RCommander. Paket hglm ditulis oleh Tirta et al. [26], sedangkan gee merupakan paket yang telah ada pada R, tetapi integrasi menu dalam bahasa Indonesia di RCommander dibuat oleh Tirta[28].
236
LAMPIRAN
Gambar 0.16 Menu Menginstal Paket Tambahan
Gambar 0.17 Memilih Paket Tambahan
MengaktifkanRdanMenginstalPaketTambahan
237
STRUKTUR MENU RCOMMANDER

Panel-----|-|-|-|-|-Data set aktif Edit data set Lihat data set Model aktif Submit (Eksekusi)
Menu Data ------|--Data set Baru |--Impor data --------|--Dari Teks |--Dari SPSS |--Dari Minitab |--Data pada R -------|--Daftar data |--Data dari paket aktif Statistika-|--Ringkasan ---------|--Data set aktif |--Numerik |--Matriks korelasi |--Tabel kontingensi -|--Satu arah |--Multi arah |--Analisis dua arah |--Proporsi ----------|--Sampel Tunggal |--Sampel ganda |--Varians ----------|--Uji F beda varians |--Uji Bartlett |--Uji Levene |--Nonparametrik ------|--Uji Wilcoxon sampel tunggal |--Uji Wilcoxon sampel ganda |--Uji Kruskal Walis |--Regresi -----------|--Regresi Sederhana |--Model Linier |--Model Linier Tergeneralisir (GLM) |--Uji Beda ----------|--Uji |--Uji |--Uji |--Uji |--Uji t sampel tunggal t sampel ganda t sampel berpasangan anava satu faktor anava multi faktor
|--Analisis ---------|--Reliabilitas skala dimensional |--Analisis Komponen Utama (RKU/PCA) |--Analisis faktor |--Analisis klaster Grafik-----|--Grafik indeks
238
LAMPIRAN
|--Histogram |--Boxplot |--QQplot |--Diagram kuantil-kuantil |--Diagram pencar |--Matriks diagram Pencar |--Grafik garis |--Diagram rata-rata |--Grafik batang |--Grafik lingkaran |--Grafik 3D Distribusi-|--Distribusi Kontinu--|--Distribusi |--Distribusi |--Distribusi |--Distribusi |-- ... |--Distribusi Normal t Chi-kuadrat Seragam Gumbel
-|--Distribusi Diskrit--|--Distribusi Binomial |--Distribusi Poisson |-- ... |--Distribusi Hipergeometrik Alat ------|--Aktifkan paket |--Aktifkan Plug-in |--Pilihan Bantuan ---|--Bantuan Commander |--Pengantar RCommander |--Bantuan data (jika ada) |--Tentang Rcmdr
StrukturMenuRCommander
239
GLOSARIUM
Inferensi
pengambilan
kesimpulan
terhadap
sesuatu
berdasarkan sebagian informasi yang ada. Inferensi dapat

Subjek (dalam penelitian) Pustaka(Library)
berupa
pendugaan
(estimasi)
maupun
pengambilan kesimpulan (uji hipotesis) sekumpulan orang atau unit terkecil dalam penelitian yang memiliki karakteristik yang menjadi perhatian. direktori yang memuat kumpulan paket-paket
program yang tersedia untuk R. Library dapat ditambah maupun dikurangi sesuai kebutuhan
Skrip
naskah
yang berisi berbagai perintah yang harus
dilaksanakan oleh komputer melalui suatu bahasa atau program tertentu.

CLI (Command Line Interface)
program yang menjembatani komunikasi antara komputer dengan pengguna dengan menggunakan perintah-perintah yang ditulis dalam baris perintah, tidak menggunakan grafis ataupun maouse. CLI merupakan interface utama dari R.
GUI (Graphical User Interface)
program menjembatani komunikasi antara komputer dengan pengguna dengan menggunakan tampilan
grafis seperti menu atau ikon, yang biasanya siap diklik dengan mouse. Program GUI untuk R biasa disebut RGUI
Paket ( package) pada R
kumpulan fungsi-fungsi dalam bahasa R yang dikemas menjadi satu kesatuan metode analisis atau teori tetertentu sebagai aplikasi
Plugn/Plug-in
adalah program yang dapat digabungkan menjadi
240
LAMPIRAN
bagian dari proram lain yang lebih besar. Dalam buku ini Paket-peket Plug-in R Commander, menunya dapat digabungkan menjadi bagian dari menu R Commander
Distribusi kontinu
sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan nonnegatif, a x b ) interval
(misalnya seluruh bilangan real, bilangan real

Distribusi diskrit
sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan titik-titik
yang tercacah (misalnya sebagian himpunan bilangan cacah, sebagian himpunan bilangan asli)
Antarmuka
bagian program/alat yang menjembatani komunikasi antara pengguna dengan komputer, antara alat ukur dengan komputer, dan sejenisnya}
Alpha ()
Taraf signifikansi = peluang kesalahan tipe I, peluang secara keliru menolak hipotesis null yang benar.
AIC (Akaike's Information Criterion)
salah satu kriteria yang dijadikan patokan memilih modelyang baik dengan menghitung perimbangan besarnya maksimum AIC= -2 likelihooddan banyaknya yang
peubah yang dipergunakan dalam model, lebih tepatnya model. log-likelihood dimaksimumkan + 2 banyaknya parameter dalam
Analisis data eksploratori (EDA)
Sekumpulan teknik untuk menampilkan data secara visual dan bermakna.
Analisis variansi (ANAVA) Suatu teknik statistika untuk menguji beda nilai-
tengah kelompok lebih dari dua.

GLOSARIUM 241
ANAVA Satu arah b (Beta) Bimodal Boxplot Densitas Derajat kebebasan (db)
Analisis variansi dengan pengelompokan hanya pada satu peubah bebas. Peluang kesalahan tipe II, yaitu peluang secara keliru menerima hipotesis nol yang salah. Distribusi yang memiliki dua puncak atau peluang maksimum. Presentasi grafik dari posisi median dan sebaran data. Kurva yang menunjukkan niai peluang suatu pengamatan pada interval nilai suatu peubah acak. Angka yang mennjukkan banyaknya informasi yang saling bebas setelah mengestimasi beberapa
parameter.
Deviasi baku Dispersi
Akar kuadrat dari variansi ukuran yang menyatakan sejauh mana data menyebar terhadap nilai-tengah Distribusi suatu peubah acak (Y) untuk nilai X yang tetap. Distribusi yang menggambarkan peluang munculnya sejumlah (misalnya kejadian peluang pada percobaan x Bernouli dari
Distribusi bersyarat Distribusi Binomial
munculnya
Angka
pelemparan uang logam sebanyak n kali).

Distribusi normal baku
Distribusi normal dengan nilai-tengah 0 dan deviasi baku 1, dinotasikan dengan N(0,1).
Distribusi sampling Distribusi sampling beda nilai-tengah Distribusi sampling nilai tengah
Distribusi statistik dari pengambilan sampel yang berulang-ulang yang berasal dari populasi tertentu. Distribution beda nilai-tengah dua kelompok sampel dari pengambilan sampel berulang-ulang Distribusi nilai-tengah dari pengambilan sampel yang berulang-ulang yang berasal dari populasi tertentu.
LAMPIRAN
242
Estimasi titik Faktor Hipotesis alternatif (HA)
Nilai tertentu yang merupakan penduga suatu parameter. Istilah lain untuk peubah independen (umumnya berupa peubah kualitatif) pada analisis variansi. Disebut juga hipotesis kerja yaitu hipotesis yang dirumuskan sesuai dengan hasil kajjian teori yang melandasi penelitian.
Hipotesis nul (H0 )
Disebut juga hipotesis nihil, yaitu hipotesis yang diuji pada prosedur statistika, yang menyatakan kenetralan (tidak ada beda signifikan, tidak ada hubungan signifikan dan sebagainya).
Histogram
Grafik
yang
menggunakan
segiempat
sebagai
representasi frekuensi atau peluang dari observasi pada setiap interval.

Homogenitas variansi Hubungan kurvilinier Intersep/ konstanta Interval keyakinan
Situasi dimana beberapa populasi atau subpopulasi memiliki variansi yang sama. Situasi yang dapat tidak linier. Koefisien dalam regresi yang menyatakan nilai Y, pada saat nilai X sama dengan 0. Disebut juga estimasi interval,yaitu suatu interval yang memiliki peluang tertentu memuat parameter yang diestimasi. diwakili oleh hubungan yang
Jarak Cook Kesalahan baku tengah Kesalahan prediksi Kesalahan sampling

GLOSARIUM
Suatu ukuran yang menunjukkan pengaruh suatu nilai pengamatan pada regresi berganda. Deviasi baku dari distribusi sampling.
Kesalahan baku selisih nilai Deviasibaku dari distribusi sampling beda nilai-
tengah. Selisih antara nilai observasi dengan nilai prediksi. Variabilitas suatu nilai statistik sampelsatu ke sampel
243
lainnya.
Kesalahan Tipe II Kesalahan Tipe I Koefisien korelasi
Kesalahan secara keliru tidak menolak H0 yang salah. Kesalahan secara keliru menolak H0 yang benar. Suatu ukuran yang menunjukkan derajat hubungan atau asosiasi antara beberapa peubah.
Kolinearitas Kombinasi Kovariansi (sxy or covxy)
Kondisi yang dimana peubah penjelas berkorelasi satu sama lain.
saling
Banyaknya cara sejumlah objek dapat dipilih tanpa memperhatikan urutannya. Ukuran statistik yang menunjukkan derajat dua peubah berubah bersama-sama.
Leverage Matriks kovariansi (S)
Ukuran yang menunjukkan penyimpangan nilai observasi terhadap nilai prediktor. Suatu matriks yang menunjukkan nilai variansi dan kovariansi antar beberapa peubah. Istilah lain untuk regresi peubah ganda, terdiri atas
Model
model linier, model linier terampat/tegreneralisir, model nonlinier, model linier campuran dan lain-lain Disebut juga model linier terampat, yaitu analisis
Model linier tergeneralisir Model log-linear Multikolinearitas Nilai kritis
Model/regresi untuk data dengan respon yang tidak berdistribusi normal. Model untuk menangani data kategori berganda. Kondisi yang menunjukan adanya korelasi yang tinggi di antara peubah-peubah prediktor. Suatu nilai statistik yang menjadi batas penerimaan atau penolakan Ho .
Nilai-tengah bersyarat Nilai-tengah geometrik
Nilai-tengah suatu peubah pada nilai tertentu dari peubah yang lain. Nilai tengah yang diambil dari n objek dengan
244
LAMPIRAN
menghitung akar pangkat n dari hasil kali (produk) n objek tadi.

Outlier/pencilan p level
Nilai observasi yang terletak jauh dari distribusi kelompoknya. Peluang kesalahan tipe I, yaitu peluang yang menunjukkan bahwa hasil yang dicapai merupakan hal yang kebetulan jika ternyata Ho benar.
Parameter Peluang bersyarat Percobaan Bernoulli Populasi
Nilai yang menunjukkan pengukuran data populasi. Peluang suatu kejadian pada saat diketahui terjadinya suatu kejadian lain. Percobaan dengan hasil salah satu dari dua kejadian yang saling lepas misalnya lulus-gagal. kumpulan seluruh data yang menjadi perhatian dalam penelitian. Jadi populasi adalah seluruh subjek penelitian beserta karakteristiknya yang menjadi kepentingan
Regresi linier Regresi logistik Regresi multivariat Residu/sisa
Analisis regresi dengan hubungan linier. Analisis regresi untuk data dengan respon bersifat dikotomus (misalnya lulus/gagal). Analisis degression lebih dari dua peubah bebas. Selisih antara nilaiobservasi Y dengan nilai
). prediksinya ( Y
Saling lepas (Mutually exclusive) Sampling
Dua kejadian yang tidak bisa terjadi bersama-sama.
Prosedur unduk memperoleh sampel yang mewakili populasi dengan baik (baik struktur maupun sifatsifatnya)
Skala Nominal
Angka yang hanya dipakai untuk membedakan objek.
GLOSARIUM
245
Skala ordinal Skala rasio Kesalahanbaku penduga Statistik Statistik Deskriptif Statistika inferensial
Angka hanya dipakai untuk menunjukkan urutan objek. Skala yang memiliki nilai 0 mutlak dan rasio/ perbandingan memiliki makna. Rata-rata deviasi kuadrat terhadap garis regresi Angka-angka yang menunjukkan pengukuran pada data. Statistika yang mendeskripsikan sampel tanpa
menarik kesimpulan tentang populasi Bagian statistika berkaitan dengan pengambilan keputusan tentang parameter populasi asal asal sampel.
Teorema limit pusat
Teorema yang sifat alami dari sebaran sampel dari nilai tengah. Apapun distribusinya jika sampling dilakukan banyak kali, distribusi nilai tengah akan mendekati distribusi normal
Tingkat Signifikansi
Nilai yang menunjukkan batas maksimum peluang kita secara keliru menolak H0 yang kenyataannya benar.
Uji bebas distribusi
Disebut juga uji nonparametrik, yaitu statistika yang tidak bergantung pada asumsi distribusi atau asumsi distribusi.
Uji Hipothesis
Suatu proses pengambilan keputusan berkaitan dengan nilai parameter populasi yang sebelumnya telah dinyatakan.
Uji nonparametrik Uji parametrik Ukuran pemusatan

246
Uji statistik yang tidak bergantung pada estimasi parameter atau asumsi distribusi. Uji statistika yang bergantung pada estimasi
parameter populasi atau asumsi distribsi populasi Nilai yang menunjukkan pusat suatu distribusi.
LAMPIRAN
Unimodal Peubah (dari data)
Distribusi maksimum.
yang
memiliki
satu
puncak
atau
karakteristik yang bervariasi antara satu subjek ke subjek lain yang menjadi perhatian dari sampel atau populasi
Peubah dikotomus Peubah independen Peubah tetap Variansi population
Peubah yang hanya memiliki salah satu dai dua nilai yang bebeda. Peubah yang dikontrol dalam percobaan. Suatu peubah bebas (eksplanatori) yang nilainya ditentukan peneliti. Variansi dari populasi yang dalam kenyataannya diestimasi bukan dihitung.
GLOSARIUM
247
DAFTAR PERSAMAAN
Pers. 3.1
P( A| B ) =
P( A B) ......................................................................... 48 P( B )
Pers. 3.2 Pers. 3.3 Pers. 3.4 Pers. 3.5 Pers. 3.6
P ( A B ) = P( A) + P( B ), untuk A B = ...................................... 48
P ( A B ) = 0, untuk A B = ........................................................ 48
A|| B P( A) = P( A| B ) ................................................................... 49 A|| B P( A B ) = P( A) P ( B ) ................................................... 49 P ( A B ) = P( A) + P( B ) P ( A B ), untuk A B ................... 50
Pers. 3.7
n p ( x ) = x (1 ) n x , x = 0,1, 2,..., n ............................................... 55 x
Pers. 3.8
x=
1 n xi .......................................................................................... 57 n i =1
Pers. 3.9
2 sx = i =1
1 n 2 x xi i xx n i =1 i =1 ................................................ 60 = n 1 n 1
Pers. 3.10
r=
n n n n xi yi xi yi i =1 i =1 i =1 n 2 n 2 n 2 n 2 ................................... 61 n xi xi n yi yi i =1 i =1 i =1 i =1
Pers. 4.1
1 x 2 1 exp f ( x) = ; 2 2
< x < .............................. 72
248
LAMPIRAN
Pers. 4.2
z2 1 1 2 f ( z) = e ; 2
< z < .................................... 72
Pers. 4.3
Z=
sebaliknya X = + Z ................................................... 74
Pers. 4.4
n n n Y = ai X i berdistribusi N ai , 2 ai2 ................................ 82 i =1 i =1 i =1
Pers. 4.5 X =
X 1 n 2 ~ N (0,1) ............................... 82 X i ~ N ( , n ) atau Z = n i =1 n
Pers. 7.1
=x=
1 n xi ................................................................................ 135 n i =1
Pers. 7.2
( x x)
i =1 i
........................................................................ 135
n 1
Pers. 7.3 Pers. 7.4
x z / 2
x tn 1, / 2
s
< < x + z / 2
n
. ................................................ 136 ................................................ 136
< < x + tn 1, / 2
n
Pers. 8.1
r=
x y
i =1 i
1
2
x y n
i =1 n i i =1
i n 2
x
i =1 n
2 i
1 xi n i =1
n
y
i =1 2
2 i
1 yi n i =1
............................... 182
Pers. 8.2
see = y 0 + 1 xi ................................................................ 191 i =1
Pers. 8.3
0 = y 1 x , .................................................................................... 191
DaftarPersamaan
249
Pers. 8.4
1 =
xi yi 1/ n xi yi
i =1 i =1 i =1
x 1/ n xi i =1 i =1
n n 2 i
, .......................................................... 191
Pers. 8.5
1 =
s xy s xx
, ........................................................................................... 191
Pers. 8.6
n x y xi i i n n 2 i =1 i =1 , s xx = xi i =1 .............................. 191 s xy = xi yi n n i =1 i =1
n n
Pers. 8.7
1 = rxy
sx , dengan s x = s xx ; s y = s yy .......................................... 191 sy
Pers. 8.8
2 = s2 =
see . ............................................................................... 192 n2
Pers. 8.9
= s2 1
s2 x2 2 21 = + ,dan s s ...................................................... 192 0 s xx n s xx
Pers. 8.10
2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s .............. 200 s = see + + s xx n s xx n 2 y
Pers. 8.11
2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s 1 + + .... 201 s = see 1 + + sxx n s xx n 2 $ y
250
LAMPIRAN
DAFTAR CONTOH
Contoh 1.1. ............................................................................................................. 12 Contoh 1.2 .............................................................................................................. 13 Contoh 1.3 .............................................................................................................. 13 Contoh 3.1 .............................................................................................................. 48 Contoh 3.2 .............................................................................................................. 52 Contoh 3.3 .............................................................................................................. 53 Contoh 3.4. ............................................................................................................. 56 Contoh 3.5. ............................................................................................................. 56 Contoh 3.4 .............................................................................................................. 58 Contoh 3.5 .............................................................................................................. 59 Contoh 3.6 .............................................................................................................. 61 Contoh 4.1 .............................................................................................................. 75 Contoh 4.2 .............................................................................................................. 78 Contoh 4.3 .............................................................................................................. 80 Contoh 7.1 ............................................................................................................ 136 Contoh 7.2 ............................................................................................................ 137 Contoh 8.1 ............................................................................................................ 185 Contoh 8.2 ............................................................................................................ 194 Contoh 8.3 ............................................................................................................ 195 Contoh 8.4 ............................................................................................................ 199
DaftarContoh 251
Contoh 8.5 ............................................................................................................ 209
252
LAMPIRAN
INDEKS
253
INDEKS
Alternatif ........................ 13, 200, 235 Anava ......... xx, 82, 83, 165, 194, 197 Animasi .................................... xv, 44 Berpasangan ............. 12, xx, 185, 196 Binomial............................................. 6, 25, 53, 79, 240, 241, 242, 243, 244, 246, 260, 263 Box-plot ......................................... 21 chi-kwadrat..................... 53, 107, 144 CIS ................................................... 9 Derajat .................................... 57, 208 Deskriptif ................... 5, 90, 127, 267 Determinasi .................................. 234 Deviasi ............................................... ........ xv, 57, 63, 168, 195, 263, 264 Histogram........................................... Diagnostik .......................................... .................. xxi, 227, 228, 229, 230 Distribusi ............................................ xiv, xv, xvi, 25, 29, 32, 33, 34, 35, 52, 53, 56, 59, 60, 61, 62, 67, 68, 69, 70, 75, 76, 86, 106, 143, 240, 242, 260, 262, 263, 267 Intervalxv, 36, 93, 130, 173, 184, 189, 214, 264 Keyakinan ...................... 7, xv, 36, 37 xvi, xvii, xviii, xix, xx, 21, 78, 109, 110, 123, 146, 147, 160, 260, 264 Inferensial......................................... 6 EDA ......................... 5, 108, 145, 262 Eksponensial ................ 25, 53, 60, 79 F 21, 53, 79, 81, 82, 113, 150, 195, 198, 217, 218, 221, 222, 224, 232, 233, 259 Frekuensi............................................ xv, xvii, xviii, 42, 43, 45, 106, 143 GUI.......... iv, 20, 21, 38, 39, 257, 261 HGLM............................................ 84 hipotesis ............................................. 80, 165, 168, 169, 171, 173, 176, 177, 178, 179, 181, 183, 184, 186, 187, 189, 190, 195, 218 Hipotesis............................................. 9, 12, 14, 80, 168, 169, 172, 180, 186, 194, 199, 200, 218, 264
254
LAMPIRAN
Korelasi .............................................. xvii, xviii, xxi, 21, 57, 83, 107, 144, 207, 208, 209, 211, 212, 213, 214, 254 Kuantil................................................ xvii, xviii, xix, 54, 55, 113, 114, 122, 150, 151, 159 kumulatif ............ 59, 60, 73, 243, 248 Library.......................................... 261 Mean... 21, 32, 33, 36, 54, 56, 63, 195 Median ............................................... xv, 54, 55, 56, 61, 62, 104, 105, 112, 141, 142, 149, 220, 223, 226, 232, 233, 247, 248, 249, 251 Modus........................... xv, 54, 56, 62 Nominal.......................... 92, 129, 266 Normal ............................................... xv, xvi, 6, 21, 25, 32, 33, 34, 35, 42, 52, 53, 55, 56, 60, 67, 68, 69, 71, 73, 75, 76, 78, 79, 83, 87, 88, 113, 114, 150, 151, 172, 180, 186, 194, 217, 218, 228, 240, 241, 242, 248, 251, 260 Ordinal ................................... 92, 129 Parameter ........... 11, 32, 37, 165, 266 Pemusatan ................ 8, xv, 54, 62, 63
INDEKS
pencar ................................................. 25, 109, 120, 146, 157, 209, 210, 222, 224, 260 Pencar................................................. 10, 11, xvii, xviii, xix, xx, xxi, 21, 120, 121, 122, 123, 157, 158, 159, 160, 219, 223, 224, 234, 260 Pencilan......................... xxi, 233, 234 Penyebaran ................................. 8, 57 plugin ............................................. 10 Plug-in..................... xiv, 31, 260, 261 Populasi.................................. 14, 266 Proporsi .............................................. xxi, 21, 83, 165, 199, 200, 201, 202, 259 p-value................................................ 106, 143, 173, 174, 177, 178, 181, 184, 185, 187, 188, 189, 190, 195, 201, 203, 213, 214, 218, 221, 222, 224, 232, 233 Ragam ............................. xvi, 69, 191 Range ....................................... 54, 57 Rasio................................. 44, 93, 130 Rcmdr......................... 20, 22, 30, 260
Page255
RCommander .................................... i v, v, xiv, xvi, xviii, 10, 19, 20, 21, 22, 24, 25, 30, 31, 37, 38, 72, 74, 80, 87, 90, 94, 95, 97, 98, 101, 104, 108, 109, 113, 127, 131, 132, 134, 135, 138, 141, 145, 146, 150, 165, 171, 179, 186, 193, 211, 219, 225, 227, 259, 260 Regresi7, 12, 13, xv, xxi, 21, 36, 37, 84, 120, 157, 214, 225, 229, 230, 233, 234, 235, 244, 250, 254, 259, 266 Rentang ........................................ 242 Rerata28, 71, 80, 117, 118, 119, 154, 155, 156, 165, 170, 171, 179, 185, 195 Sampel8, 9, 12, xx, xxi, 14, 42, 49, 54, 76, 171, 175, 176, 182, 199, 201, 202, 259 SciViews ........................................ 20 signifikansi34, 35, 108, 145, 168, 222, 243, 246, 262 simetris ............................................... 34, 35, 52, 53, 55, 56, 60, 62, 67, 69, 86, 109, 112, 146, 149, 221, 240
StatDemo............................................ iv, v, 7, xiv, 10, 19, 21, 22, 23, 30, 31, 32, 41, 45, 62, 75, 87, 174, 179, 181, 185, 190, 257 Statistik............................................... vi, 10, 11, xvi, xviii, 4, 15, 104, 141, 266, 267 Statistika............................................. i, iii, iv, vi, 9, xiv, 4, 5, 6, 7, 9, 10, 15, 23, 25, 28, 30, 39, 42, 79, 80, 90, 127, 255, 256, 257, 259, 267 T .......... 33, 34, 81, 82, 168, 181, 182 Tinn-R ............................................ 20 Unimodal...................................... 267 Variansi .............................................. 57, 118, 155, 191, 193, 197, 259, 268 Wilcoxon................................ 21, 259 Z xv, 35, 68, 75, 78, 81, 82, 168, 256

Bab 7. Analisis Korelasi Dan Regresi

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bab 7. Analisis Korelasi Dan Regresi

Uploaded by

Copyright:

Available Formats

BAB 7.

ANALISIS KORELASI DAN REGRESI

Analisis regresi peubah ganda Pengantar analisi regresi modern

7.1 ANALISIS KORELASI

Koefisien korelasi atau derajat asosiasi

menunjukan bahwa kedua peubah (X dan Y) memiliki

Diagram pencar data ( X,Y ) dengan berbagai nilai korelasi

MENGHITUNG KORELASI SECARA MANUAL

17, 4 = 0,87 19,98

Hasil yang sama diperoleh dengan menghitung mengunakan R.

MENGHITUNG KORELASI DENGAN RCOMMANDER

7.2 ANALISIS REGRESI SEDERHANA

Y = 0 + 1 X 1 + 2 X 2 ,... Melalui analisis regresi peneliti ingin menghitung nilai

Diagram Pencar & Sabuk Keyakinan

Ilustrasi Garis regresi populasi, regresi penduga dengan sabuk keyakinannya.

ESTIMASI DAN UJI INFERENSI PARAMETER REGRESI

simpangan garis secara

terhadap parameter j untuk

j=1,2. Dengan kata lain kita mencari 0 , 1

sedemikian sehingga Pers. 7.2 memcapai nilai minimum. see = y 0 + 1 xi i =1

Penurunan secara matematus menghasilkan Pers. 7.3

Pers. 7.5 dengan

Oleh karena sx dan sy adalah nonnegatif, 8.3 diperoleh hubungan

maka tanda tanda koefisien regresi

n yi n 2 dengan s yy = yi i =1 . n i =1 Selanjutnya penduga ragam populasi

2 derajat kebebasan (1,n-2). Secara praktis F diperoleh dari t 1

untuk hipotesis dua arah, Ho ditolak jika dan hanya jika

| thitung | tn 2, / 2 . Sedangkan berdasarkan nilai p (p-value), Ho ditolak

lebar dari kiri ke kanan relatif sama (ragam konstan) dan

mengikuti garis lurus.

291 1/10 72 38 17,4 = =0,48 2 41,6 560-72 /10

7. F-statistic: 154.6 on 1 and 78 DF,

Estimate = 0,83 Std . Error = 0,067

7. Uji signifikansi garis regresi secara keseluruhan yang menggunakan uji F

-1.927959 -0.797888 -0.003435

3133 on 1 and 48 DF,

Hasil di atas menunjukkan bahwa uji regresi sangat

signifikan, baik untuk

Gambar 7.8 Diagram Pencar X dan Y

PREDIKSI DALAM REGRESI

penduga 95% dari y |x =12,5 adalah [28,18; 107,10]

Diagram Pencar & Sabuk Keyakinan

Batas interval rata-rata Y Batas interval Y

7.3 MODEL LINIER: REGRESI PEUBAH GANDA

Gambar 7.10 Dialog Model Linier

Residuals: Min -29.0987 1Q -2.9626 Median -0.4881 3Q 1.7663 Max 32.4172

Eksplorasi lebih jauh

7.4 DIAGNOSTIK MODEL MELALUI GRAFIK

Gambar 7.11 Menu dan Dialog Diagnostik Grafik

Cook's distance 0.00 0.02 0.04

Cook's distance 20 0.00 0.02 0.04 0.06

Residuals: Min -17.842 1Q -5.810 Median -1.492 3Q 2.713 Max 86.675

9.492 1.43e-11 ***

Residuals: Min 1Q Median 0.5353 3Q Max

df Koefisien Konstanta Koefisien X1

31,32 2,62 0,70

6,36 3,08 0,97

dilakukan perbaikan model sehingga

7.5 ANALISIS REGRESI ALTERNATIF

transformasi sebelumnya seperti pada Gambar 7.17.

ragamnya tidakhomogin dan setelah melalui transformasi ragamnya menjadi homogin.

Plot Data Asli

Plot Data Transformasi