HUBUNGAN ANTAR 2 (DUA) VARIABEL (BIVARIATE

)

Pembahasan sampling theory pada dasarnya hanya menyangkut 1 (satu) variabel random atau sering disebut univariate. Dalam pembahasan tersebut, focus utama menyangkut hubungan antara sample dan populasi, atau pengambilan kesimpulan tentang hypothesa yang menyangkut parameter populasi berdasarkan data statistics empirik yang dihitung sampel. Pembahasan tersebut tidak menyangkut hubungan antar variabel ataupun model sebab akibat antar variabel. Dalam bagian berikut akan dibahas hubungan antar 2 variabel ( bivariate ) dan teknik statistik yang digunakan tergantung tingkat pengukuran variabel.

1.Pengukuran Nominal (Chapter 10.15, Walpole))
Pengukuran nominal adalah tingkat pengukuran yang paling sederhana sehingga unit analisis tidak dapat diukur individual tetapi hanya dapat diklasifikasikan dalam kategorinya masing2. Pengujian yang dilakukan sering juga disebut Test for Independence atau Tabel Contingency dengan menghitung besaran jumlah total selisih kuadrat frekuensi empirik (observasi = oi ) terhadap frekuensi teoritis (expected = ei ) relative terhadap expected ei atau :


dengan degree of freedom = ( r-1 )( c-1 ) dimana : oi = frekuensi observasi (empirik) ei = frekuensi expected r = row, banyaknya baris c = column, banyaknya kolom

(

)

Bila jatuh pada area penolakan yaitu maka Ho : ”tidak ada hubungan antara variabel 1 ( X1) dengan variabel 2 ( X2 ) ”, harus ditolak. Atau artinya ada hubungan atau pengaruh antara variabel 1 dan variabel 2. Contoh : Sampel sebanyak 1000 orang diambil untuk mengetahui apakah ada hubungan antara tingkat pendapatan ( income level, X1 ) dengan opini setuju-tidak setuju atas usulan perubahan pajak ( tax reform, X2 ). Atau dengan perkataan lain, apakah opini seseorang atas Tax Reform

.02 yang masih lebih kecil dari 0. Persoalan diatas menyangkut hubungan antara 2 variabel pada tingkat pengukuran nominal kareana unit analysis hanya dapat dikelompokan (”diukur”) dalam kategori tingkat pendapatan rendah.000 ) Dari tabel Observasi dan Expected .1) adalah probability dari kelompok setuju dan kelompok pendapatan rendah atau P(rendah ) = P ( Rendah) P(Setuju) = 1000 = 200. memang ada perbedaan opini antar kelompok tingkat pendapatan.. Dengan cara yang sama akan didapatkan expected frequency untuk tiap sel sebagai berikut : Expected Frequency ( ei ) Income Level Rendah Menengah 200.09% atau expected frequency untuk sel (1.. atau Hypothesa Ho ditolak..9 209. ( ) ( ) = = 7. Dengan perkataan lain.9 135. Distribusi frekuensi dari setiap kelompok pendapatan dan opini adalah sebagai berikut : Observed Frequency ( oi ) Rendah 182 154 336 Income Level Menengah 213 138 351 Tinggi 203 110 313 Total 598 402 1. menengah..dipengaruhi oleh tingkat kemakmurannya.000 Opini Setuju Tidak setuju Total Berdasarkan jumlah dari setiap kelompok (baris dan kolom). menengah dan tinggi. sedangkan ( X2 ) hanya dapat dikelompokan dalam kategori setuju-tidak setuju. dengan teori probability kita dapat menghitung peluang teoritis (expected probability) setiap orang dari sel (1.05.1 141. dapat dihitung nilai .85 dengan degree of freedom= (r-1)(c-1)= (2-1)(3-1) = 2 Atau P ( )dof=2 = 0.1 336 351 Tinggi 187.. tinggi (X1 )..9 orang..1) adalah : 20.2 125.8 313 ( ) ( 20.09% Opini Setuju Tidak setuju Total Total 598 402 1. Hypothesa dari persoalan diatas adalah Ho :Tidak ada perbedaan opini antara kelompok pendapatan rendah.

6 1.1956) yang didefinisikan : C=√ Atau untuk contoh diatas C = √ 0. Spearman rs atau ρ (rho. atau generalisasi dari kesimpulan sampel sebenarnya terbatas. indeks korelasi yang digunakan adalah contingency coefficient C (Siegel.9 1.09.5 3 1 Rank X2 2 4 9 6 3 1 di = X1-X2 0 0.5 0 -1.5 0 0 0 0.25 0 0 .5 9 4.Pengukuran Ordinal Kedua teknik korelasi ordinal berikut ini masuk dalam kategori statistic non parametric.0 0. 2. Dapat dilihat bahwa dengan N yang semakin besar nilai numeric yang kecil cukup memberikan signifikasi. yaitu teknik yang tidak menggunakan asumsi tentang distribusi populasi sehingga hubungan antara distribusi populasi dengan distribusi sampel sebenarnya tidak diketahui.3 1. untuk notasi parameter)) rs = 1- ∑ dimana : di = selisih rank X1 – X2 Contoh : 10 merk rokok diukur kandungan Tar ( X1 ) dan Nicotine ( X2 ) sebagaimana dalam tabel berikut : Brand Viceroy Marlboro Chesterfield Kool Kent Raleigh Tar X1 14 17 28 17 16 13 Nicotine X2 0.25 0 2. Untuk variabel dengan tingkat pengukuran ordinal. indeks korelasi yang dapat digunakan adalah Spearman Rank Correlation rs atau Kendall Rank Correlation τ a.Tingkat atau intensitas hubungan antara 2 variabel seringkali disebut sebagai indeks korelasi dan untuk 2 variabel nominal walaupun pengujian dapat menunjukan signifikasi hubungan.1 1.8 Rank X1 2 4.

Walpole).2 2. nilai kritis untuk n = 10 dan hubungan antara X1 dan X2. artinya memang ada z= ⁄ √ √ ………….745.( Hypothesa nol adalah tidak ada korelasi atau H0 : ρ = 0 Pengujian significant dari nilai rs yang didapat.0 7 8 6 10 ( )( ) ) 8 7 5 10 -1 1 1 0 1 1 1 0 Atau Spearman Rank Correlation rs = 1.4 1. Pengujian juga dapat dilakukan dengan pendekatan normal.Old Gold Phil Morris Oasis Players 24 25 18 31 1. atau nilai korelasi significant.9 yang akan berada didaerah rejection Atau untuk contoh diatas z = 0.33 b. karena distribusi dari rs akan mengikuti distribusi normal.01 adalah rs = 0. sebagai berikut : 0.22. sehingga nilai rs yang dihitung dapat di konversikan kepada nilai z normal. sedangkan nilai rs hitung adalah = 0.967. Catatan : ρ = 0 = 2. bisa mgnggunakan Tabel Spearman ( A. Kendall Rank Correlation τ Kendall τ didefinisikan sebagai ratio antara total pasangan dengan urutan natural berdasarkan data empiris ( S ) dibandingkan dengan total kombinasi pasangan yang seharusnya berurutan dengan benar (teoritis) τ= Contoh : ( ⁄ ) ( ) ( ) Karya essay 4 orang mahasiswa dinilai oleh 2 orang penilai dan diurutkan dalam ranking mulai dari terbaik sbb : .967 √ untuk 2.5 1. Dari nilai rs diatas. atau Ho ditolak.

2 dan komparasi A terhadap B akan menghasilkan skor = -1 6. : Mahasiswa Penilai X Y D 1 2 C 2 4 A 3 3 B 4 1 Dari tabel yang kedua. Berikutnya adalah urutan D terhadap B. banyaknya score untuk pasangan yang terurut dengan benar dihitung sbb : 1. Bila penilaian judge X digunakan sebagai reference.Mahasiswa Penilai X Y A 3 3 B 4 1 C 2 4 D 1 2 Bila penilaian salah satu penilai (judge) diurutkan sesuai ranking dari terbaik dstm. Proses tersebut dilakukan berikutnya untuk komparasi antara C terhadap A dan B yang akan menghasilkan skor = . Untuk urutan pasangan selanjutnya (D terhadap A)dari rank 2 ke rank 3. dari rank 2 ke rank 1. Bila kedua penilai sepakat. maka urutan mahasiswa adalah sbb. Maka nilai korelasi Kendall τ = ⁄ .0. Jadi komparasi D terhadap ke 3 mahasiswa lain akan menghasilkan skor total = (+1) + (+1) + (-1) = + 1 5. Maksimum skor yang bisa dicapai adalah kombinasi 2 dari 4 atau ( ) 6 8. 4. Untuk itu mendapat score (+1) 2. Dari tabel dapat dilihat bahwa ternyata penilaian kedua judge tersebut tidak 100% sama atau korelasi kedua penilaian tersebut tidak sempurna. maka seharusnya penilaian dari judge Y akan berurutan sama seperti judge X.33 . atau menurun dari besar ke kecil atau tidak memenuhi standard yang seharusnya. maka untuk judge Y. maka skor (+1) 3. Dimulai dari mahasiswa D paling kiri (ranking 1 pada penilaian judge X) terhadap C. Total skor keseluruhan adalah = +1 – 2 – 1 = -2 7. (kecil ke besar) atau sesuai dengan standard normative. penilaian judge X sudah berurutan dan dianggap sebagai reference. penilaian judge Y urutannya dari rank 2 ke rank 4 (kecil ke besar) atau secara normative benar.

Pengukuran metric Untuk variabel dengan tingkat pengukuran interval atau ratio indeks hubungan antar variabel dinyatakan dalam Pearson Correlation yang didefinisikan : rxy = ( X  X )(Y  Y )  ( X  X )  (Y  Y ) 2 2   xy  x2  y2 . 3. besarnya nilai τ bervariasi dari -1 sd +1 dan membentuk distribusi frekuensi.̅ ) Pengujian significance dapat dilakukan dengan distribusi t melalui konversi : t= √( √( ) ) Atau dengan distribusi normal melalui konversi : z= √( ) [ ( ( ) ) ] . untuk N = 4 maka ada 4 ! = 24 kombinasi urutan ranking dan setiap kombinasi berkaitan dengan nilai τ tertentu dengan probability of occurrence tertentu.̅ ) dan y=( Y .Significance Test Untuk setiap N ! ranking yang mungkin terjadi. Sebagai contoh. sampling distribution dari τ akan mengikuti distribusi normal dengan : dan √ ( ( ) ) dan pengujian significant dari nilai τhitung dapat dilakukan seperti biasa. Untuk N 0 10. untuk nilai N sd 10 dapat digunakan tabel Kendall (tabel Q. Siegel). Tentu saja proses tersebut tidak praktis bila menyangkut N cukup besar. selalu berasosiasi dengan nilai τ. dimana : x =( X .