You are on page 1of 22

1

5.1 PENGERTIAN UMUM


Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah
variabel. Mengingat analisis kumpulan data yang terdiri atas banyak variabel
pada dasarnya merupakan perluasan dari analisis yang datanya terdiri atas dua
variabel, maka di sini terutama akan dibicarakan penelaahan kumpulan data yang
dilukiskan oleh dua variabel saja. Untuk keperluan penelaahan, kepada kedua
variabel itu digunakan simbul yang lazim dipakai, ialah X dan Y yang dapat
diberi indeks menurut keperluannya yaitu :
1 2
, ,. .. ,
n
x x x dan
1 2
, ,. . .,
n
y y y
Atau pasangan ( )
,
i i
x y ; i = 1,2, , n
Sehingga sampel yang berukuran n itu terdiri atas n buah pasang data.
Contoh 5.1 :
Jika
i
x
menyatakan banyak pengunjung ke suatu toko swalayan dan
i
y
diartikan
orang-orang diantara pengunjung itu yang berbelanja di toko tersebut misalnya,
maka akan diteliti kumpulan data seperti dalam daftar berikut :
Tabel 5.1 : Jumlah pengunjung dan belanja di suatu toko swalayan
Pengunjung (
i
x
) Yang Berbelanja (
i
y
)
300 156
290 151
BAB V
ANALISIS REGRESI DAN KORELASI
2
345 175
419 203
378 196
353 189
435 241
361 197
394 212
436 232
Hal-hal yang akan dipelajari mengenai kumpulan data yang terdiri atas
dua variabel yaitu :
a. Mempelajari derajat asosiasi antara kedua variabel. Bagian ini
dalam statistika dikenal dengan nama ANALISIS KORELASI.
Hubungan korelasional ini tidak menjelaskan apakah suatu variabel
menjadi penyebab dari variabel yang lainnya.
b. Mempelajari hubungan yang ada di antara variabel-variabel
sehingga dari hubungan yang diperoleh dapat menaksir variabel yang
satu apabila harga variabel lainnya diketahui. Bagian ini dikenal dengan
nama ANALISIS REGRESI.
Contoh 5.2 :
a. Dari data yang tertera dalam daftar di atas, dapat dicari
hubungan yang ada antara pengunjung dan yang belanja. Jika pada
suatu hari ada 390 pengunjung, dari hubungan yang diperoleh dapat
diperkirakan ada berapa yang akan belanja di toko itu. Selain daripada
itu, juga dapat ditentukan berapa kuat jumlah pembeli ditentukan oleh
adanya pengunjung
b. Diketahui bahwa produk nasional kotor ditentukan oleh produk-
produk. Lainnya, antara lain jasa, Jika data selama waktu-waktu tertentu
diketahui, hubungan antara produk-produk nasional kotor dan jasa dapat
dihitung. Dari hubungan ini, produk nasional kotor dapat diperkirakan
jika jasa dapat diketahui.
3
5.2 ANALISIS REGRESI
Untuk menjelaskan bagaimana hubungan antara dua variabel, perhatikan
data yang tercantum dalam tabel berikut :
Tabel 5.2 : Banyak pengunjung dan belanja di suatu toko swalayan selama 30
hari.
HARI
KE
PENGUNJUNG
(Xi)
BELANJA
(Yi)
HARI
KE
PENGUNJUNG
(Xi)
BELANJA
(Yi)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
35
39
34
40
31
43
40
30
34
39
33
32
36
40
43
32
36
31
38
29
42
33
29
29
36
31
31
33
37
36
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
41
32
34
30
35
36
37
39
41
33
34
36
38
37
38
37
30
30
28
35
29
34
35
36
32
32
34
37
34
Dalam daftar di atas merupakan banyak pengunjung (dinyatakan dengan
Xi) dan yang berbelanja (dinyatakan dengan Yi) yang telah dicatat oleh
seseorang pengusaha di tokonya.
Kebiasaan yang digunakan dalam penentuan simbul-simbul yang lazim,
ialah Xi untuk hal yang diperkirakan lebih tepat dapat digolongkan ke dalam
variabel yang sifatnya bebas, sedangkan Yi untuk variabel yang diperkirakan
akan bergantung pada Xi. Variabel Xi disebut variabel bebas sedangkan Yi
disebut variabel tak bebas.
Representasi untuk data dalam Tabel 6.2 di atas, diagram pencarnya
dapat dilihat seperti dalam gambar berikut !
4
Gambar 5.1 : Diagram pencar dari data pada Tabel 6.2
Dengan menggunakan diagram ini dapat dilihat apakah ada sesuatu
hubungan yang berarti diantara titik-titik itu pada atau sekitar garis lurus ? Jika
demikian halnya, cukup alasan bagi kita untuk menduga bahwa antara variabel-
variabel itu ada hubungan linear. Dalam hal lainnya, antara variabel-variabel itu
diduga terdapat hubungan non linear.
Setelah diketahui bentuk hubungan antara variabel itu, tugas selanjutnya
ialah menentukan hubungan tersebut dirumuskan dalam suatu persamaan
matematis. Kemudian disusun dalam suatu persamaan garis yang
merepresentasikan persamaan matematisnya. Garis ini dikenal dengan nama garis
regresi. Jika hubungan Y = f(X) itu linear, maka garis yang didapat adalah
garis regresi linear. Dalam hal lainnya didapat regresi nonlinear.

REGRESI NON LINEAR
Gambar 5.2 : Representasi garis regresi linear dan non linear
. .
. .
. .
. .
5
Gambar di atas memperlihatkan diagram pencar untuk data dalam daftar
dengan garis lurus atau regresi linear yang diduga cocok dengan letak titik-titik
diagram. Gambar 5.2 melukiskan regresi non linear untuk sesuatu persoalan.
Oleh karena regresi linear merupakan bentuk regresi yang paling mudah
ditelaah, kecuali itu juga karena banyak regresi nonlinear yang dapat diselesaikan
dengan bantuan regresi linear, maka di sini terutama hanyalah regresi tersebut
yang akan dibicarakan.
Bagaimanakah menentukan persamaan regresi yang linear ini? Yang
paling mudah ialah dengan jalan kira-kira menurut penglihatan kita. Pada
kumpulan titik-titik itu ditarik sebuah garis lurus yang akan paling dekat titik-
titik itu berkerumun sekitar garis yang ditarik tadi. Sesudah itu ditentukan
bagaimana persamaannya.
Meskipun cara tersebut sangat mudah dilakukan namun untuk penelitian
jarang dilakukan oleh karena kecuali terlalu kasar hasilnya, juga terlalu subyektif
dan ini sedapat mungkin harus dihindarkan. Karenanya akan ditinjau cara yang
dianggap cukup baik dan sering digunakan. Cara yang dimaksud adalah
METODA KUADRAT TERKECIL. Sebelum cara ini dibicarakan, terlebih
dahulu akan ditinjau seperlunya macam-macam regresi linear yang mungkin,
sehubungan dengan variabel bebas.
Di atas dikatakan, bahwa jika variabel X yang diketahui terlebih dahulu
dan kemudian Y ditentukan berdasarkan X ini, maka ditentukan hubungan
Y=f(X). Rumusan hubungan ini lebih dikenal dengan nama Regresi Y atas X.
Jika regresi Y atas X ini linear, maka persamaannnya dapat dituliskan
dalam bentuk linear :

Y a bX +
(5.1)
Dengan

Y
berarti taksiran nilai X untuk harga Y yang diketahui.
6
Untuk menentukan koefisien-koefisien a dan b ini akan digunakan
METODA KUADRAT TERKECIL. Ternyata bahwa untuk regresi linear dalam
rumus 6.1, harga-harga a dan b dapat dihitung berdasarkan sekumpulan data
sebanyak n buah dengan menggunakan sistem persamaan :
1 1
2
1 1 1
i
n n
i i
i i
n n n
i i i
i i i
Y an b X
X Y a X b X


+
+


.............. (5.2)
Pasangan persamaan dengan dua anu a dan b ini, bentuk rumus 6.3, disebut
persamaan-persamaan normal untuk bentuk regresi dalam rumus 6.1. Setelah
diselesaikan, akan didapat harga-harga a ddan b yang dicari, yakni:
2
1 1 1 1
2
2
1 1
1 1 1
2
2
1 1
i
i
n n n n
i i i i i
i i i i
n n
i
i i
n n n
i i i i
i i i
n n
i
i i
Y X X X Y
a
n X X
n X Y X Y
b
n X X




,




.............. (5.3)
Untuk menjelaskan penggunaan rumus 5.3 di atas, sekarang ditinjau contoh
mengenai banyak pengunjung dan yang berbelanja ke sebuah toko yang datanya
tertera dalam Tabel 5.2. Dari diagram pencar gambar 5.1 mudah dilihat bahwa
titik-titik itu terletak sekitar garis lurus. Untuk menentukan regresi linear Y atas
X, maka sebaliknya dibuat sebuah daftar seperti Tabel 5.3 berikut ini.
7
Tabel 5.4 : Tabel penyelesaian persamaan regresi linear
Xi Yi Xi
2
Yi
2
XiYi Xi Yi Xi
2
Yi
2
XiYi
34
38
34
40
31
43
40
30
33
39
33
32
36
40
42
32
36
31
38
29
42
33
29
29
36
31
31
33
37
36
1156
1444
1156
1600
961
1849
1600
900
1089
1521
1089
1024
1296
1600
1764
1024
1296
961
1444
841
1764
1089
841
841
1296
961
961
1289
1369
1296
1088
1368
1054
1520
899
1806
1320
870
4957
1296
1023
992
1089
1480
1512
40
41
32
34
30
35
36
37
39
40
33
34
36
37
37
38
37
30
30
28
35
29
34
35
36
32
32
34
37
34
1600
1681
1024
1156
900
1225
841
1156
1225
1296
1024
1024
1156
1369
1156
1444
1369
900
900
784
1225
841
1156
1225
1296
1024
1024
1156
1369
1156
1520
1517
960
1020
840
1225
1044
1258
1365
1440
1056
1088
1224
1369
1258
545 503 20049 17073 18481 541 501 19651 16869 18184
Dari daftar di atas diperoleh :
1
1
2
1
1
1086
1044
39700
36. 665
n
i
i
n
i
i
n
i
i
n
i i
i
X
Y
X
X Y

Disubstitusikan harga-harga tersebut dengan rumus regresi linear dengan


mengambil n = 30, didapat :
8
2
2
1044. 39700 - 1086. 36665
30. 38700 - 1086
1, 6
30. 36665 - 1086. 1044
30. 39700 - 1086
0, 88
a
a
b
b

Sehingga garis regresi linear yang dimaksud mempunyai persamaan :

1, 6 0, 88 Y X +
Dengan menggunakan persamaan yang diperoleh ini dapat diperkirakan berapa
orang diantara pengunjung itu yang akan berbelanja, apabila jumlah pengunjung
dapat diketahui. Apabila rata-rata perjam ada 40 orang yang berkunjung ke
toko itu, maka dapat diperkirakan dari

1, 6 0,88 Y X +
diperoleh :
Y = 1,6 + (0,88)(40)
= 36,81 orang yang berbelanja.
5.3 REGRESI NON LINEAR
Setelah dipelajari seperlunya mengenai bentuk hubungan linear antara
dua variabel X dan Y sekarang akan diperhatikan bentuk hubungan nonlinear
antar dua variabel. Tidak akan dibicarakan secara luas dan mendalam mengenai
regresi nonlinear ini, tetapi hanya merupakan suatu tinjauan singkat saja, tinjauan
yang pada umumnya dapat ditelaah berdasarkan teori regresi linear.
Meskipun terdapat banyak sekali bentuk regresi non linear yang biasa
digunakan tetapi di sini hanyalah akan ditinjau beberapa saja yang penting dan
termudah. Untuk regresi nonlinear Y atas X yang akan ditinjau di sini, antara
lain berbentuk lengkungan :
a. Parabola kuadratis dengan persamaan
2
Y a bX cX + +
b. Parabola kubis dengan persamaan
2 3
Y a bX cX dX + + +
c. Logaritmis dengan persamaan :
b
Y aX
9
d. Hiperbola dengan persamaan :
1
Y
a bX

+
5.4 REGRESI LINEAR BERGANDA
Ada banyak kenyataan bahwa pengamatan akan terdiri atas lebih dari dua
variabel. Sehingga yang harus digunakan adalah regresi dengan variabel bebas
lebih dari satu.
Contoh :
1. Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga
oleh harga bensin, upah buruh dan sebagainya.
2. Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur
yang ada saja, tetapi juga dari banyak makanan yang diberikan, umur
ayam dan barangkali masih ada faktor lainnya.
Apabila ada satu variabel terikat Y dan k variabel bebas
1 2
, ,. . . ,
k
X X X

sehingga terdapat hubungan semacam garis regresi Y atas
1 2
, ,. . . ,
k
X X X
.
Dalam bagian ini akan dijelaskan secara singkat bagaimana garis regresi yang
dimaksud dapat ditentukan dan yang akan ditinjau di sini hanyalah garis regresi
Y atas
1 2
, ,. . . ,
k
X X X
yang paling sederhana ialah yang dikenal dengan nama
regresi linear berganda. Persamaan umum untuk regresi linear berganda ini
adalah :

0 1 1
. . .
k k
Y a a X a X + + +
Dimana
0 1
, ,. . . ,
k
a a a
harus ditentukan dari data hasil pengamatan. Mudah
dilihat bahwa regresi di atas ini merupakan perluasan dari regresi linear
sederhana.
10
Pertanyaan yang timbul adalah : bagaimana koefisien-koefisien
0 1
, ,. . . ,
k
a a a

ditentukan ? Secara sama dengan regresi linear sederhana, maka
dipergunakan metode KUADRAT TERKECIL. Oleh karena ada k+1 parameter
yang harus dicari maka diperlukan k+1 persamaan dengan k+1 anu. Dapat
dibayangkan bahwa hal itu memerlukan metode penyelesaian yang lebih baik dan
karenanya memerlukan matematika yang lebih tinggi lebih-lebih untuk variabel
yang cukup banyak.
Untuk regresi linear berganda yang sederhana :
0 1 1 2 2
Y a a X a X + +

Misalnya kita harus menyelesaikan 3 persamaan dengan 3 anu yang berbentuk :
0 1 1 2 2
1 1 1
2
1 0 1 1 1 2 1 2
1 1 1 1
2
2 0 2 1 1 2 2 2
1 1 1 1
n n n
i i i
i i i
n n n n
i i i i i i
i i i i
n n n n
i i i i i i
i i i i
Y na a X a X
Y X a X a X a X X
Y X a X a X X a X



+ +
+ +
+ +



Untuk persamaan regresi dengan 4 variabel bebas, maka diperlukan 4 persamaan.
Demikian seterusnya.
5.5 ANALISIS KORELASI
Dalam bagian yang lalu, telah dipelajari bagaimana hubungan antara dua
variabel X dan Y dapat ditentukan. Hubungan yang diperoleh dinyatakan dalam
bentuk persamaan matematis yang dalam statistika dikenal dengan nama garis
regresi. Jika X merupakan variabel bebas dan Y variabel tak bebas, regresi Y
atas X dapat digunakan untuk meramalkan nilai Y apabila nilai X diketahui.
Dalam banyak soal, jika nilai-nilai pengamatan terdiri atas lebih dari
sebuah variabel, bukan saja regresinya yang perlu dihitung, tetapi juga kekuatan
11
hubungan antara variabel-variabel itu. Ukuran yang digunakan untuk itu adalah
koefisien korelasi.
Untuk keperluan analisis tentang korelasi ini, seperti biasa akan
dibedakan antara statistik (ialah koefisien korelasi untuk data dalam sampel) dan
parameter (untuk menyatakan koefisien korelasi populasi. Koefisien korelasi
untuk sampel, jadi merupakan statistik, akan dinyatakan dengan r sedangkan
parameternya dengan (baca : rho).
Dalam bagian berikut ini akan diuraikan bagaimana r dihitung dan
selanjutnya akan diberikan penjelasan mengenai pengujian derajat asosiasi.
a. Koefisien Korelasi
Karena ternyata korelasi dan regresi berhubungan erat, maka
untuk menentukan ukuran asosiasi atau koefisien korelasi, perlu
terpenuhi syarat-syarat :
1) Koefisien korelasi harus besar apabila derajat asosiasi
tinggi dan harus kecil apabila derajat asosiasi rendah.
2) Koefisien korelasi harus bebas daripada satuan yang
digunakan untuk mengukur variabel.
Untuk mencapai kedua syarat di atas, maka untuk menentukan
koefisien korelasi r biasa digunakan statistik :
( ) ( ) ( )
( )
1
1
n
i i
i
x y
X X Y Y
r
n S S

Inilah rumus koefisien korelasi yang pertama yang disebut KOEFISIEN


KORELASI PERSON atau PRODUCT MOMENT.
Koefisien korelasi r menunjukkan apakah cukup beralasan bagi kita
untuk menyatakan ada atau tidak adanya hubungan linear antara
variabel-variabel X dan Y. Rumus lain yang juga sering dipergunakan
adalah :
12

1 1 1
2 2
2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y


_ _

' ;' ;

, ,




Dengan menggunakan perhitungan matematika, ternyata dapat
dibuktikan bahwa batas-batas koefisien korelasi itu berada dalam
daerah / interval :
-1 r 1
Tanda positif menyatakan bahwa antara variabel-variabel itu terdapat
korelasi positif atau korelasi langsung yang berarti nilai variabel X yang
kecil berpasangan dengan nilai variabel Y yang kecil serta nilai variabel
X yang besar berpasangan dengan nilai variabel Y yang besar pula.
Korelasi positif menunjukkan letak titik-titik dalam diagram
pencar berada sekitar garis lurus yang koefisien arahnya positif. Makin
dekat letak titik-titik itu pada garis lurus, makin kuatlah korelasi positif
itu dan harganya makin dekat kepada satu.
Jika titik-titik itu terletak pada garis lurus yang arahnya positif,
akan diperoleh harga r = +1.
Jika variabel X yang besar berpasangan dengan Y yang kecil dan
jika X kecil berpasangan dengan Y yang besar, akan diperoleh Korelasi
negatif atau korelasi invers.
r = +1
r = -1
13
Dilihat dari diagram pencarnya, letak titik-titik akan berada
sekitar sebuah garis lurus yang koefisien arahnya negatif. Makin dekat
letak titik-titik itu pada garis yang dimaksud, makin dekat pula nilai r
kepada -1. Dan akhirnya jika titik-titik itu terletak pada garis lurus yang
koefisien arahnya negatif didapat harga r = -1.
Dalam prakteknya jarang sekali didapatkan diagram pencar yang
letak titik-titiknya pada sebuah garis lurus seperti dalam gambar di atas
sangat jarang. Yang sering didapati adalah bentuk yang menyebabkan
nilai koefisien korelasi tidak sama dengan 1 atau -1. Makin terpencar
letak titik-titik itu dari sebuah garis lurus, makin dekatlah r kepada nol.
Setelah dikenal apa arti koefisien korelasi, masih ada ukuran lain
yang sebenarnya lebih mudah untuk ditafsirkan dalam penggunaannya.
Ukuran tersebut ialah yang dinamakan koefisien determinasi yang tiada
lain daripada kuadrat koefisien korelasi. Jadi :
Koefisien Determinasi = r
2
Karena sudah diketahui bahwa koefisien korelasi berada -1 r +1,
maka tentulah koefisien determinasi mulai dari nol sampai dengan 1,
atau :
0 r
2
1
Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan
penafsirannya adalah jika r = 0,94 sehingga r
2
= 0,8836 atau 88,36%
maka ditafsirkan sebagai 88,36% variasi suatu variabel yang disebabkan
oleh variabel lainnya.
Koefisien determinasi banyak digunakan dalam penjelasan tambahan
untuk hasil perhitungan koefisien regresi.
b. Menghitung r Untuk Data Berkelompok
Rumus-rumus di atas adalah rumus-rumus untuk menentukan r
apabila datanya massih belum disusun dalam daftar distribusi frekuensi.
Rumus-rumus tersebut pula cukup menyenangkan untuk digunakan
14
apabila datanya tidak terlalu banyak. Jika data yang sedang dicari
korelasinya itu banyak sekali, dengan menggunakan rumus-rumus
tersebut akan memakan waktu yang lama dari perhitungannya. Oleh
karena itu perlu ada usaha untuk mempersingkatnya. Jalan yang lazim
ditempuh ialah terlebih dahulu menyusun data ke dalam daftar distribusi
frekuensi. Oleh karena kita sedang berhadapan dengan penelitian yang
terdiri atas dua variabel, maka kitapun akan memperoleh dua distribusi
frekuensi. Kedua distribusi frekuensi ini harus disajikan dalam daftar
yang berklasifikasi dua, sedemikian sehingga dampaknya banyak seperti
daftar kontingensi. Banya baris sesuai dengan banyak kelas interval
distribusi frekuensi variabel yang satu, sedangkan banyak kolom sesuai
dengan banyak kelas interval dari distribusi frekuensi variabel kedua.
Untuk variabel yang satu, yang terdapat dalam baris, kelas-kelas
intervalnya mulai dari atas ke bawah disusun seperti biasa, yakni dari
data yang kecil hingga yang paling besar. Variabel yang terdapat dalam
kolom, kelas-kelas intervalnya dari kiri ke kanan yang dimulai dari data
yang kecil hingga yang besar.
Frekuensi data dalam daftar ini akan didapati dalam tiap-tiap sel.
Jadi frekuensi dalam setiap sel merupakan banyak data yang ada dalam
kelas interval variabel yang satu dan juga yang ada dalam kelas interval
variabel yang lain.
Contoh :
Berikut data gaji tentara (data fiktif, tahun 95) beserta pengeluarannya
untuk keperluan rekreasi bersama keluarga.
Daftar gaji tentara dan pengeluaran untuk wisata
(dalam puluhan ribu rupiah)
Gaji 30-39 40-49 50-59 60-69 70-79 80-89 90-99 jumlah
15
wisata
0,00-0,99 1 1
1,00-1,99 2 3 1 6
2,00-2,99 1 2 10 2 15
3,00-3,99 5 6 5 1 1 1 19
4,00-4,99 2 4 3 2 1 12
5,00-5,99 1 10 6 2 19
6,00-6,99 2 5 2 2 11
7,00-7,99 1 1 2
Jumlah 4 10 19 14 19 12 7 85
Dari daftar dapat dilihat bahwa ada 4 tentara dengan gaji Rp. 300.000
sampai dengan Rp. 400.000 sebulannya, dengan pengeluaran untuk
wisata masing-masing 1 orang Rp. 0 sampai dengan Rp. 99.000.
Sekarang persoalannya adalah bagaimana menentukan koefisen korelasi
antara keduanya ?
Untuk itu dipergunakan rumus berikut :
2 2
2 2
-
x y
x x
n fuv f u f v
r
n f u f u n fuv fuv
_ _ _


, , ,


_ _

' ; ' ;

, ,





dimana :
u = koding untuk variabel X
v = koding untuk variabel Y
f
x
= frekuensi kelas interval dari variabel X
f
y
= frekuensi kelas interval dari variabel Y
f = frekuensi dalam tiap sel
n = banyak data.
Sekarang dipergunakan peerumusan di atas.
Gaji tentara
x 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Y
u -3 -2 -1 0 1 2 3 fy fyv fyv
2
Fuv
16
0,495
-3 1 1 -3 9 9
1,495
-2 2 3 1 6 -12 24 26
2,495
-1 1 2 10 2 15 -15 15 17
3,495
0 5 6 5 1 1 1 19 0 0 8
4,495
1 2 4 3 2 1 12 12 12 8
5,495
2 1 10 6 2 19 38 76 56
6,495
3 2 5 2 2 11 33 99 45
7,495
4 1 1 2 8 32 20
fx
4 10 19 14 19 12 7 85 61 267 181
fxu
-12 -20 -19 0 19 24 24 21
fxu
2
36 40 19 0 19 48 63 63
fuv
24 16 10 0 38 48 45 45
Untuk variabel x, telah diambil koding u = 0 yang sesuai dengn tanda
kelas 64,5 dan untuk variabel Y diambil koding v = 0 sesuai dengan
tanda kelas 3,495. Koding-koding lainnya diambil seperti biasa, yakni
untuk tanda kelas yang makin kecil berturut-turut -1, -2, -3, ..
sedangkan untuk tanda kelas yang makin besar +1, +2, +3, Harga-
harga f
x
u didapat dengan mengalikan f
x
= 4 kali u = -3, f
x
u = -20 dari f
x
=
10 kali u = -2 dan seterusnya. Demikian pula f
y
v = 3 didapat dari f
y
= 1
kali v = -3, f
y
v = -12 didapat dari f
y
= 6 kali v = -2 dan seterusnya.
Nilai f
x
u
2
diperoleh dengan mengalikan f
x
u dengan u, nilai f
y
v
2
adalah
hasil kali f
y
v dengan v dan seterusnya.
Dengan demikian, nilai r adalah :
85. 181 - 13. 61
r =
{85.225 - 13
2
} {85.267 - 61
2
}

r = 0,77
Angka ini menyatakan kuatnya hubungan antara gaji bulanan tentara dan
pengeluaran untuk pariwisata.
c. Korelasi Rank
Ada kalanya ingin diketahui korelasi antara dua variabel tidak
berdasarkan pada pasangan data dimana nilai sebenarnya diketahui.
sama
17
Umpamanya saja, kita telah melakukan penelitian mengenai tingkatan
menyenangi merk sepatu olahraga bagi prajurit A dan prajurit B anggota
TNI AL. Hasilnya dinyatakan dalam tabel di bawah ini. Untuk sepatu
yang paling disukai, diberi nilai 1 dan yang paling tidak disukai diberi
nilai 10. Urut-urutan nilai tersebut dinamakan RANK. Berdasarkan
rank tersebut, dapatlah ditentukan hubungan / korelasi antara keddua
variabel. Ukuran yang diperoleh biasa dinamakan koefisien korelasi
rank atau biasa juga dikenal dengan koefisien korelasi spearman dan
disimbulkan dengan r' (baca : er - aksen) untuk membedakan dengan
koefisien korelasi yang sudah dikenal.

Merk sepatu Prajurit A Prajurit B
1 2 3
Adidas 1 2
Lotto 2 3
Speck 3 1
Spotex 5 4
New Era 4 5
Jet 6 6
Niel 8 9
Pioneer 9 7
Crown 7 8
Best 10 10
Rumus untuk menghitung koefisien korelasi spearman adalah:

( )
2
1
2
6
1
1
n
i
i
d
r
n n

dengan di = selisih tiap pasang rank


n = banyaknya pasangan data
Sehingga dengan menggunakan rumus di atas, persoalan kesukaan
terhadap sepatu merk tertentu dapat dicari koefisien korelasinya, sebagai
berikut :
18
Rank A 1 2 3 5 4 6 8 9 7 10
Rank B 2 3 1 4 5 6 9 7 8 10
d
i
-1 -1 2 1 -1 0 -1 2 -1 0 Jml
d
i
2
1 1 4 1 1 0 1 4 1 0 14
6. 14
1
10(100 1)
r

r' = 0,015
d. Korelasi Berganda
Korelasi berganda merupakan korelasi dari beberapa variabel
bebas secara serentak dengan variabel terikat
Misalkan ada k variabel bebas,
1 2
, ,. . . ,
k
X X X
dan satu variabel terikat
Y dalam suatu persamaan regresi linear

0 1 1
. . .
k k
Y a a X a X + + +
maka besarnya korelasi bergandanya adalah :
1
1 1 2 2
, ,. .. ,
2
. . .
k
k k
y x x
a x y a x y a x y
r
y
+ + +

dengan
( )
1
1 1
2
2 2
k
k k
X Y
x y X Y
n
X Y
x y X Y
n
Y
y Y
n







e. Korelasi Parsial
Korelasi parsial adalah korelasi antara sebuah variabel tak bebas
dengan sebuah variabel bebas tertentu dengan variabel-variabel bebas
lain dianggap tetap / konstan.
Koefisien korelasi parsial dinyatakan dengan perumusan :
Untuk dua variabel bebas :
19
Korelasi parsial Y dengan X
1
dengan X
2
dianggap konstan adalah :
( )
( )
1 2 1 2
1 2
1 2
2
.
2 2
1 1
YX
YX YX X X
YX X
X X
r r r
r
r r


Korelasi parsial Y dengan X
2
dengan X
1
dianggap konstan adalah :
( ) ( )
2 1 1 2
2 1
1 1 2
.
2 2
1 1
YX
YX YX X X
YX X
X X
r r r
r
r r


5.6 SOAL-SOAL
a. Berikan contoh dimana ramalan akan diperlukan !
b. Apakah yang dimaksud dengan :
1) regresi linear
2) regresi nonlinear
3) regresi linear X atas Y
4) regresi linear Y atas X
5) metode kuadrat terkecil
6) persamaan normal suatu regresi
7) simpangan baku bersyarat
8) regresi linear berganda
c. Jelaskan mengenai perbedaan antara regresi linear dan non linear
d. Dalam uraian yang mengenai hampir seluruhnya hanya ditinjau
tentang regresi Y atas X. Untuk mendapatkan uraian tentang regresi X
atas Y, tinggallah menukarkan variabel-variabel X dan Y. Sejalan
dengan ini, regresi X atas Y, cobalah tuliskan rumuss yang sesuai.
e. Dalam hal yang berikut, sebutkan apakah taksiran rata-rata atau
taksiran nilai individu yang diperlukan :
20
1) bagaimanakah jualan tahun yang akan datang, apabila
untuk tahun itu diketahui produk nasional kotor yang
diharapkan ?
2) Orang - orang dengan pendapatan Rp 1000.000,00 tiap
bulan berapa dapat menyediakan uangnya untuk keperluan
sosial ?
f. Perhatikanlah regresi linier dalam rumus
x
= + X. Apakah
artinya kalau = 0 ?
g. Jelaskanlah arti dalam hal yang berikut, apabila regresi linier :
X = ongkos untuk keperluan iklan dalam ribuan rupiah
Y = hasil jualan karena iklan tersebut dalam ribuan rupiah
h. Dengan menggunakan data dalam daftar berikut, tentukanlah
regresi linier untuk memperkirakan nilai ujian statistika jika diketahui
NEM matematika SMU nya diketahui.
NO NEM Matematika SMU Nilai statistika
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
40
40
41
42
43
44
45
46
47
47
48
48
49
49
50
65
66
66
67
69
72
72
73
75
76
77
78
76
80
80
i. Garis regresi untuk memperkirakan pengeluaran keluarga tiap
bulan guna keperluan makanan berdasarkan pendapatan keluarga tiap
bulan, dinyatakan dalam ribuan rupiah , ditentukan oleh :
^
Y = 185 + 1,46 X
21
1) Berapakah pukul rata pengeluaran keluarga setiap bulan
guan keperluan makanan apabila pendapatan keluarga setiap
bulannya mencapai 100.000 rupiah ?
2) Berapa ribu rupiahkah pengeluaran setiap bulan akan
bertambah, jika pendapatan naik dengan Rp. 1.000,- ?
3) Apakah keanehannya jika X = 0 rupiah ?
j. Dalam tempo delapan tahun, hubungan antara Produk Nasional
Kotor (Y) dengan hasil jualan tahunan minyak mentah dinyatakan oleh X
di suatu negara, ditentukan oleh : Y = -3,21 + 0,02453 X
Dengan X, Y dalam milyard unit uang di negara itu.
1) Apakah arti 0,02453
2) Jika hasil jualan tahunan minyak mentah mencapai harga
285 milyard unit barang, berapakah Produk Nasional Kotor di
negara itu diperkirakan untuk tahun tersebut ?
3) Jika selanjutnya diketahui s
y.x.
= 0,241 dan X
2
i
=
1.089,413 sedangkan X
i
= 2.927, maka dengan koefisien
kepercayaan 0,95 tentukan batas-batas pertambahan Produk
Nasional Kotor untuk setiap milyard bertambahnya hasil jualan
minyak mentah.
k. Apakah yang dimaksud dengan :
1) Korelasi
2) Koefisien korelasi
3) Korelasi parsial
4) Korelasi positif
5) Korelasi negatif
6) Korelasi Rank
l. Berikan contoh masing-masing sebuah, dimana diperkirakan
akan didapat korelasi :
22
1) Positif
2) Negatif
m. Hasil penelitian sesuatu hal menghasilkan r = 0. Apakah ini
berarti bahwa antara variabel-variabel yang diteliti itu tidak terdapat
hubungan ?
n. Tafsiran apakah yang dapat diperoleh jika dikatakan bahwa
koefisien korelasi antara banyak kecelakaan di pabrik tiap tahun dan
umur pegawai di pabrik itu sebesar r = -0,65
o. Untuk soal h di atas, carilah korelasi antara NEM matematika
SMU dengan nilai ujian statistika.
p. Dua orang ahli disuruh mencoba kecap yang dihasilkan oleh 12
perusahaan kecap. Untuk kecap yang paling enak, oleh setiap ahli diberi
nomor satu, yang kurang enak diberi nomor dua dan seterusnya.
Hasilnya diberikan dalam daftar berikut :
Ahli A 10 3 5 4 1 8 7 6 2 9 11 12
Ahli B 8 6 1 12 3 11 2 5 7 4 10 9
1) Carilah koefisien korelasi ranknya.
2) Selidikilah, apakah ada kesesuaian rasa kedua ahli itu ?

You might also like