Professional Documents
Culture Documents
ANALISIS DATA
SUTANTO PRIYO HASTONO FAKULTAS KESEHATAN MASYARAKAT UNIVERSITAS INDONESIA, 2006
1. Statistik dan Penelitian Statistik dalam arti sempit berarti angka/data. Sedangkan dalam arti luas statistik sebagi suatu prosedur atau metode pengumpulan data, pengolahan data, analisis data dan penyajian data. Sedangkan penelitian adalah cara ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu. Data yang diperoleh melalui penelitian harus akurat, artinya data yang dihasilkan harus memenuhi kriteria: valid, reliabel artinya dan obyektif. Valid data artinya yang ketepatan/kecermatan pengukuran, ketepatan antara
sesungguhnya terjadi pada obyek dengan data yang dapat dikumpulkan oleh peneliti. Misalkan data dalam obyek berwarna merah, maka data yang terkumpul oleh peneliti juga berwarna merah. Contoh lain, kita akan mengukur waktu lomba lari cepat, kalau mengukurnya dengan jam tangan tentunya hasilnya tidak valid, untuk lomba lari cepat akan valid bila menggunakan alat Stop watch. Contoh lain, bila survei melakukan wawancara dengan orang pedesaan Cianjur tidak valid kalau wawancaranya menggunakan bahasa batak, akan valid bila menggunakan bahasa sunda. Reliabel menunjukkan kekonsistensian pengukuran, artinya pengukuran diulangulang akan mendapatkan hasil yang sama. Misalkan data yang terkumpul dari obyek kemarin berwarna hijau, maka sekarang atau besuk juga masih tetap berwarna hijau. 2
SUTANTO PRIYO HASTONO: Analisis Data Objektif menunjukkan derajat persamaan persepsi antar orang. Jadi misalkan orang tertentu melihat bahwa obyek itu bewarna putih, maka orang lainpun akan menyatakan sama, yaitu putih. 2. Peran Statistik dalam Penelitian Peran statistik dalam suatu penelitian dimulai dari tahap awal sampai dengan akhir penelitian. Adapun perannya: a. Alat untuk menghitung besarnya sampel yang akan diteliti b. Alat untuk menguji validitas dan reliabilitas instrumen c. Alat untuk pengolahan data d. Alat untuk analisis data e. Alat untuk penyajian data 3. Kegunaan statistik/penelitian di Bidang Kesehatan a. Mengukur status kesehatan masyarakat dan mengetahui permaslahan kesehatan b. Membandingkan status kesehatan di satu tempat dengan tempat lain, atau membandingkan status kesehatan waktu lampau dengan saat sekarang c. Evaluasi dan monitoring kegagalan dan keberhasilan program kesehatan yang sedang dilaksanakan d. Keperluan estimasi tentang kebutuhan pelayanan kesehatan e. Perencanaa program kesehatan d. keperluan Research dan publikasi masalah-maslash kesehatan 4. Jenis Data Dalam menggunakan statistik perlu dipahami benar mengenai definisi data dan jenis-jenis data. Data merupakan kumpulan angka/huruf hasil dari penelitian terhadap sfat/karakteristik yang kita teliti. Isi data pada umumnya bervariasi (misalnya data berat badan dalam suatu kelompok orang ada yang beratnya 60 kg, 50 kg, 75 kg dst) sehingga muncul istilah variabel. Jadi variabel merupakan 3
SUTANTO PRIYO HASTONO: Analisis Data karakteristik yang nilai datanya bervariasi dari suatu pengukuran ke pengukuran berikutnya. Menurut skala pengukurannya, variabel dibagi empat jenis, yaitu nominal, ordinal, interval dan rasio. a. Nominal, variabel yang hanya dapat membedakan nilai datanya dan tidak tahu nilai data mana yang lebih tinggi atau rendah. Contoh; jenis kelamin, suku dll. Jenis kelamin laki-laki tidak lebih tinggi dibandingkan perempuan . Suku Jawa tidak dapat dikatakan lebih baik/lebih buruk dari suku sunda. Dengan ilustrasi ini dapat dijelaskan bahwa variabel nominal, nilai datanya sederajat. b. Ordinal, variabel yang dapat membedakan nilai datanya dan juga sudah diketahui tingkatan lebih tinggi atau lebih rendah, tapi belum diketahui besar beda antar nilai datanya. Contoh pendidikan, pangkat, stadium penyakit dll. Pendidikan SD pengetahuannya lebih rendah dibandingkan SMP. Namun demikian, kita tidak dapat tahu besar perbedaan pengetahuan orang SD dengan SMP. c. Interval, variabel yang dapat dibedakan, diketahui tingkatannya dan diketahui juga besar beda antar nilainya, namun pada variabel interval belum diketahui kelipatan suatu nilai terhadap nilai yang lain dan pada skala interval tidak mempunyai titik nol mutlak. Contohnya variabel suhu, misalnya benda A suhunya 40 derajat dan benda B 10 derajat. Benda A lebih panas dari benda B dan beda panas anta benda A dan B 30 derajat, namun kita tidak bisa mengatakan bahwa benda A panasnya 4 kali dari benda B (ini berarti tidak ada kelipatannya!). Selanjutnya, kalau suatu benda suhunya 0 derajat, ini tidak berart bahwa benda tersebut tidak punya panas (tidak mempunyai nilai nol mutlak), d. Rasio, variabel yang paling tinggi skalanya, yaitu bisa dibedakan, ada tingkatan, ada besar beda dan ada kelipatannya serta ada nol mutlak. Contoh berat badan, tinggi badan dll. Misal A beratnya 30 kg dan B beratnya 60 kg. Dalam hal ini dapat dikatakan bahwa A lebih ringan dari B, selisih berat 4
SUTANTO PRIYO HASTONO: Analisis Data antara A dan B adalah 30 kg, berat b dua kali lebih tinggi dari berat A. berat 0 kg, ini berarti tidak ada berat (tidak ada bendanya) sehingga ada nol mutlak. Dalam analisis seringkali digunakan pembagian data/variabel menjadi dua kelompok yaitu; data katagorik dan data numerik. a. Katagorik (kualitatif), merupakan data hasil pengklasifikasian/penggolongan suatu data. Cirinya: isisnya berupa kata-kata. Contoh; sex, jenis pekerjaan, pendidikan b. Numerik (kuantitatif), merupakan variabel hasil dari penghitungan dan pengukuran. Cirinya: isi variabel berbentuk angka-angka. Variabel numerik dibagi menjadi dua macam: Diskrit dan Kontinyu. Diskrit merupakan variabel hasil dari penghitungan. Misalnya jumlah anak, jumlah pasien tiap ruang, kontinyu merupakan hasol dari pengukuran, misalkan tekanan darah, Hb dll. Variabel katagorik pada umumnya berisi variabel yang berskala nominal dan ordinal. Sedangkan variabel numerik berisi variabel yang berskala interval dan rasio. Dalam analisis statistik, seringkali data numerik diubah ke dalam data katagorik dengan cara dilakukan pengelompokan/pengklasifikasian. Misalnya variabel berat badan data riilnya merupakan data numeric, namun bila dikelompokkan menjadi kurus (<50 kg), sedang (50-60 kg) dan gemuk (>60 kg) maka jenis variabelnya sudah berubah menjadi katagorik.
PENGOLAHAN DATA
1. Editing
Merupakan kegiatan untuk melakukan pengecekan isian formulir atau kuesioner apakah jawaban yang ada di kuesioner sudah: a. Lengkap: semua pertanyaan sudah terisi jawabannya b. Jelas: jawaban pertanyaan apakah tulisannya cukup jelas terbaca. c. Relevan: jawaban yang tertulis apakah relevan dengan pertanyaan d. Konsisten: apakah antara beberapa pertanyaan yang berkaitan isi jawabannya konsisiten, misalnya antara pertanyaan usia dengan pertanyaan jumlah anak. Bila dipertanyaan usia terisi 15 tahun dan di pertanyaan jumlah anak 9, ini berarti tidak konsisten.
2. Coding Coding merupakan kegiatan merubah data berbentuk huruf menjadi data
berbentuk angka/bilangan. Misalnya untuk variabel pendidikan dilakukan koding 1 = SD, 2 = SMP, 3 = SMU dan 4 = PT. Jenis kelamin: 1 = laki-laki
SUTANTO PRIYO HASTONO: Analisis Data dan 2 = perempuan, dsb. Kegunaan dari coding adalah untuk mempermudah pada saat analisis data dan juga mempercepat pada saat entry data.
3. Processing
Setelah semua kuesioner terisi penuh dan benar, serta sudah melewati pengkodean, maka langkah selanjutnya adalah memproses data agar data yang sudah di-entry dapat dianalisis. Pemrosesan data dilakukan dengan cara meng-entry data dari kuesioner ke paket program komputer. Ada bermacammacam paket program yang dapat digunakan untuk pemrosesan data dengan masing-masing mempunyai kelebihan dan kekurangan. Salah satu paket program yang sudah umum digunakan untuk entry program SPSS for Window. data adalah paket
SUTANTO PRIYO HASTONO: Analisis Data Tabel 1 Jenis kelamin pasien Jenis Kelamin Laki-laki Perempuan Total Jumlah 40 60 100
Tabel 2 Jenis pendidikan pasien Pendidikan SD SMP SMU PT Total Jumlah 40 10 30 15 100
Dari kedua tabel di atas memperlihatkan bahwa tabel jenis kelamin tidak ada nilai yang hilang (missing), sedangkan pada tabel pendidikan ada 5 pasien yang missing, karena total jumlahnya hanya 95 (seharusnya 100). b. Mengetahui variasi data Dengan mengetahui variasi data akan diketahui apakah data yang di-entry benar atau salah. Cara mendeteksi dengan mengeluarkan distribusi frekuensi masing-masing variabel. Dalam entry data biasanya data dimasukkan dalam bentuk kode/coding, misalnya untuk variabel pendidikan SD kode 1, SMP kode 2, SMU kode 3, dan PT kode 4. Untuk mengetahui kesalahan data berikut ilustrasi keluaran dari variabel pendidikan:
SUTANTO PRIYO HASTONO: Analisis Data Tabel 3 Jenis pendidikan pasien Pendidikan 1 2 3 4 7 Total Jumlah 40 30 20 6 4 100
Dari tampilan di atas kendati jumlah total sudah benar 100, namun terlihat ada data yang salah, yaitu munculnya kode pendidikan angka 7 yang berjumlah 4 pasien. Seharusnya variabel pendidikan variasi angkanya hanya dari angka 1 s.d. 4. c. Mengetahui konsistensi data Cara mendeteksi adanya ketidakkonsistensi data dengan menghubungkan dua variabel. Contoh: 1). membandingkan dua tabel Tabel 4 Keikutsertaan KB KB Ya Tidak Total Jumlah 20 80 100
SUTANTO PRIYO HASTONO: Analisis Data Tabel 5 Jenis Alat Kontrasepsi Yang Dipakai Pendidikan Suntik Pil Kondom IUD Total Jumlah 5 5 4 10 24
Dari kedua tabel tersebut terlihat bahwa ada ketidak konsistenan antara jumlah peserta KB (20 orang) dengan total jenis alat kontrasepsi yang dipakai (24 orang). Seharusnya pada baris total jenis alat kontrasepsi jumlahnya 20 orang. 2). Membuat tabel silang Contoh menghubungkan variabel umur dan jumlah anak Umur Jumlah Anak 0 15 16 19 20 24 25 35 40 1 1 2 3 1 2 2 4 2 2 3 4 5 6 7 8 9 10 2*
Keterangan: * = ada 2 responden dengan umur 15 tahun dan anaknya ada 10 orang (ada kesalahan entry data!!!)
10
2. ENTRY DATA
Setelah kita mengetahui langkah-langkah pengolahan data, selanjutnya akan dibahas entry data menggunakan SPSS. Kepanjangan dari SPSS yaitu
Statistical Program For Social Science. SPSS merupakan paket program ststistik
yang berguna untuk mengolah dan menganalisis data penelitian. Dengan SPSS semua kebutuhan pengolahan dan analisis data dapat diselesaikan dengan mudah dan cepat. Kemampuan yang dapat diperoleh dari SPSS meliputi pemrosesan segala bentuk file data, modifikasi data, membuat tabulasi berbentuk distribusi frekuensi, analisis statistik deskriptif, analisis lanjut yang sederhana maupun komplek, pembuatan grafik, dsb. Perkembangan program SPSS sangat cepat dimulai dari program SPSS/PC+(masih under DOS) kemudian berkembang menjadi SPSS for Windows dari versi 6 dan berkembang terus sampai sekarang sudah memasuki versi 11. Dan untuk latihan digunakan SPSS for Windows versi 10. a. MEMANGGIL SPSS Pertama kali anda harus pastikan bahwa komputer sudah ter-install program SPSS for Windows. Untuk memanggil program SPSS dapat dilakukan dua cara : Pertama : Bila tampilan pertama komputer sudah muncul Icon SPSS, maka klik dengan mouse icon tersebut dua kali. Kedua : Bila di layar belum ada icon SPSS, maka klik Start, pilih File Program dan sorot SPSS dan klik dua kali. Di dalam operasionalnya, SPSS mengenal 2 jenis jendela (Window) yang utama yaitu: a. SPSS Data Editor
11
SUTANTO PRIYO HASTONO: Analisis Data Jendela ini berisis tampilan data yang kita olah dan analisis dengan tampilan sejenis Spreadsheet (seperti tampilan Program Excel). b. SPSS Output Hasil olahan (hasil analisis) yang anda lakukan akan ditampilkan pada Output window. Window ini merupakan teks editor, artinya dapat mengedit hasil analisis yang ditampilkan.
Dari contoh di atas menunjukkan ada 3 variabel (nama, umur dan berat badan) dan 2 kasus/responden.
TAMPILAN UTAMA SPSS FOR WINDOWS Setelah program SPSS dipanggil di layar akan muncul logo SPSS for Windows, tunggulah sesaat hingga logo tersebut menghilang, maka pada layar monitor akan didapati tampilan utama SPSS sebagai berikut: a. tampilan data
12
b. tampilan variabel
Sistem kerja SPSS for Windows dikendalikan oleh menu (bar menu)./ Bar menu terletak di sebelah atas dengan urutan dari kiri ke kanan sbb: File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help. File: digunakan untuk membuat file data baru, membuka file data yang telah tersimpan (ekstensi SAV), atau membaca file data dari program lain, seperti dbase, excell dll. Edit: digunakan untuk memodifikasi, mengcopy, menghapus, mencari, dan mengganti data. View: digunakan untuk mengatur tampilan font, tampilan kode/label Data: digunakan untuk membuat/mendefinisikan nama variabel, mengambil/ menganalisis sebagian data, menggabungkan data. Transform: digunakan untuk transformasi/modifikasi pembuatan variabel data baru seperti dari pengelompokan variabel,
13
SUTANTO PRIYO HASTONO: Analisis Data Analyze: digunakan untuk memilih berbagai prosedur statistik, dari statistik sederhana (deskriptif) sampai dengan analisis statistik komplek (multivariat). Graphs: digunakan untuk membuat grafik meliputi grafik Bar, Pie, garis, Histogram, scatter plot dsb. Utilities: digunakan untuk menampilkan berbagai informasi tentang isi file. Window: digunakan untuk berpindah-pindah antar jendela, misalnya dari jendela data ke jendela output. Help: memuat informasi bantuan bagaimana menggunakan berbagai fasilitas pada SPSS.
I. MEMASUKKAN DATA
Entry data dapat langsung dilakukan pada data editor. Data editor
memiliki bentuk tampilan sejenis spreadsheet (seperti Excel) yang digunakan sebagai fasilitas untuk memasukkan/engisikan data. Ada tiga hal yang harus diperhatikan: Baris menunjukkan kasus/responden Kolom menunjukkan variabel Sel merupakan perpotongan antara kolom dan baris menunjukkan nilai/data Dalam memasukan data ke SPSS, ada 4 hal yang harus dieperhatikan: a. Memberi Nama Variabel Pertama kali yang harus dilakukan pada saat entry data adalah memberi nama variabel. Satu variabel mewakili/melambangkan satu pertanyaan. Agar tidak menemui kesulitan dalam membuat nama variabel, berikut akan diuraikan ketentuan / persyaratan nama variabel: * Nama variabel maksimum berisi 8 huruf/karakter, untuk SPSS versi 13 jumalh karakter dapat lebih dari 8 huruf
14
SUTANTO PRIYO HASTONO: Analisis Data * Nama variabel tidak boleh ada spasi * Nama variabel tidak ada yang sama ( tidak boleh ada 2 atau lebih variabel yang memiliki nama sama) b. Mendefinisikan Tipe Variabel Tipe data harus ditentukan kalau kita akan memasukan data di SPSS, adapun jenis tipenya antara laian: 1. Numerik ------ > untuk data berbentuk angka/nomer 2. String -------4. dll. Note: yang sering digunakan adalah tipe Numerik, karena data yang akan kita olah biasanya berbentuk angka. c. Mendefinisakan Adanya Desimal Bila data yang akan dimasukkan berbentuk dsimal, seperti kadar HB, maka perlu ditentukan berapa desimal yang kita inginkan. SPSS secara default/standar memberikan dua angka desimal untuk setiap data yang akan di entry. Kebanyakan data penelitian berbentuk tidak ada desimal, oleh karena itu untuk data yang tidak ada desimal kita harus seting di SPSS isian jumlah desimal diberi angka 0 atau dikosongkan. d. Memberi Label Variabel Nama variabel biasanya tertulis dengan kata/huruf yang singkat, pada bagian ini kita dapat menuliskan keterangan nama variabel sehingga dapat memperjelas arti dari masing-masing variabel. Misalnya nama variabel BWT diberi label Berat badan bayi pada saat lahir dalam satuan gram untuk data berbentuk huruf 3. Date --------- > untuk data berbentuk date/tanggal
15
SUTANTO PRIYO HASTONO: Analisis Data e. Memberi Value Label Untuk variabel yang berbentuk koding kita harus memberi keterangan untuk setiap kode yang ada dalam kode tsb, misalnya untuk variabel Sex, 0 = pria dan 1 = wanita. Sekarang kita coba lakukan entry untuk data: Penelitian Faktor-faktor yang berhubungan dengan perilaku menyusui eksklusif di Daerah X tahun 2001 . Berikut ini instrumen yang digunakan dalam penelitian: POLA MENYUSUI Nomor Responden 1. Berapa umur ibu? . Tahun 2. pendidikan ibu yang telah ditamatkan? 1. SD 2. SMP 3. SMU 4. PT 3. Apakah ibu bekerja? 0. bekerja 1. Tidak bekerja 4. Berapa berat badan ibu ? kg 5. Apakah ibu menyusui secara Eksklusif (menyusui sampai usia bayi 4 bulan)? 0. tidak 1. ya 6. a.Kadar Hb ibu pengukuran pertama : . gr% b.Kadar Hb ibu pengukuran kedua : . gr% 7. Berat badan bayi ibu? .gram PERTANYAAN SIKAP 1. Bayi yang baru lahir sesegera mungkin diberi ASI? 1. STS 2. TS 3.KS 4. S 5.SS 2. Bayi yang baru lahir diberi kolostrum 1. STS 2. TS 3.KS 4. S 5.SS 3. Bayi sejak lahir sampai usia 4 bulan hanya diberi ASI saja? 1. STS 2. TS 3.KS 4. S 5.SS 4. ASI diberikan sampai bayi berusia 2 tahun? 1. STS 2. TS 3.KS 4. S 5.SS
16
17
A. Langkah pertama : Memberi/membuat nama variabel: Layar pada tampilan Workshet di menu data SPSS ada 2 jenis, yaitu jendela Data View dan Variabel View.
Untuk membuat nama variabel, layar/jendela posisikan pada Variable View. Sekarang lakukan : klik Variable View di bagian kiri bawah, sehingga muncul tampilan layar Variable View
Pada tampilan Variable View diatas terlihat kolom: Name, Type, Width, Decimals, dst.. Selanjutnya kita dapat membuat nama variabelnya dimulai dari No, umur, didik, dst..sbb: a. Membuat Variabel No Adapun tahapannya sbb: 18
SUTANTO PRIYO HASTONO: Analisis Data 1. Sekarang pada kolom name ketik nama variabel No, kemudian 2. Pindahkan kursor ke kolom Type. Jenis variabel yang tersedia ada beberapa jenis meliputi numeric untuk tipe angka, string untuk tipe karakter/huruf dll. Untuk varibel No karena datanya yang akan masuk berbentuk angka berarti anda pilih numeric (secara otomatis SPSS memberikan default Numeric) 3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara standar lebar kolom sudah diatur SPSS lebar kolom (Width) 8 karakter, jadi abaikan saja untuk width nya 4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis memberi ruang untuk 2 desimal, untuk variabel No tentunya berbentuk bilangan bulat(tidak ada desimal) jadi kolom Decimal diberi angka 0 atau dikosongkan. 5. Geser korsor kekanan ke kolom Label, ketik/isikan keterangan untuk memperjelas variabel No, misalnya diketik Nomor Responden 6. Langkah selanjutnya harusnya kursor kita geser kekanan mengisi kolom Values, namun kolom Values ini diisi kalau variabel yang kita buat berbentuk variabel koding (atau variabel katagorik) misalnya variabel sex yang isinya ada koding 1=pria dan 2=wanita. Untuk variabel No bukan merupakan variabel koding, maka kolom Value tidak diisi/diabaikan saja, sehingga proses pembuatan variabel No sudah selesai, dan tampilan lengkapnya menjadi sebagai berikut
19
SUTANTO PRIYO HASTONO: Analisis Data b.Membuat Variabel Umur Proses pembuatannya sama dengan ketika membuat variabel No sbb: 1. Sekarang pada kolom name ketik nama variabel Umur, kemudian 2. Pindahkan kursor ke kolom Type.. Untuk variabel Umur karena datanya yang akan masuk berbentuk angka berarti anda pilih numeric (secara otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi kolom Type jangan diubah) 3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara standar lebar kolom sudah diatur SPSS, lebar kolom (Width) 8 karakter, jadi abaikan/biarkan saja untuk width nya 4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis memberi ruang untuk 2 desimal, untuk variabl Umur tentunya berbentuk bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan. 5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk memperjelas variabel Umur, isikan: Umur ibu menyusui 6. Karena variabel umur berjenis numerik (bukan variabel yg isinya koding) maka kolom Values diabaikan saja, dan dengan demikian proses pembuatan variabel umur telah selessai c. Variabel Pendidikan Proses pembuatannya sama dengan ketika membuat variabel No sbb: 1. Sekarang pada kolom name ketik nama variabel Didik, kemudian 2. Pindahkan kursor ke kolom Type.. Untuk variabel Didik karena datanya yang akan masuk berbentuk angka berarti anda pilih numeric (secara otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi kolom Type jangan diubah) 3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
20
SUTANTO PRIYO HASTONO: Analisis Data standar lebar kolom sudah diatur SPSS, lebar kolom (Width) 8 karakter, jadi abaikan/biarkan saja untuk width nya 4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis memberi ruang untuk 2 desimal, untuk variabl Didik tentunya berbentuk bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan. 5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk memperjelas variabel Didik, isikan: Pendidikan formal ibu menyusui 6. Langkah selanjutnya geser kekanan ke kolom Values, untuk variabel Didik kolom Values ada isinya oleh karena variabel Didik merupakan variabel yang berbentuk koding, yaitu kode 1 = SD, 2=SMP, 3=SMU, 4=PT. Klik kolom Value akan muncul menu:
Klik disini
Pada kotak Value isikan angka 1, lalu klik kotak Value Label isikan: SD,hasilnya nampak sbb:
21
Kemudian klik tombol Add sehinga di kotak bagian bawah akan muncul:
Seterusnya klik kotak Value, isikan angka 2, klik kotak Value Label dan isikan: SMP, kemudian klik tombol Add Seterusnya klik kotak Value, isikan angka 3, klik kotak Value Label dan isikan: SMU, kemudian klik tombol Add Seterusnya klik kotak Value, isikan angka 4, klik kotak Value Label dan isikan: PT, kemudian klik tombol Add sehingga kotak menu akan tertampil sbb:
22
Kemudian, klik tombol OK sehingga selesailah pembuatan variabel Didik. d. Variabel Kerja 1. Pada kolom Name isikan Kerja 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Status pekerjaan ibu 4. Geser kekanan ke kolom Value, isikan koding 0=bekerja 1=tdk kerja Proses pembuatan variabel kerja selesai e. Variabel BBibu 1. Pada kolom Name isikan Bbibu 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Berat badan ibu 4. Kolom Value, abaikan/biarkan aja karena variabel Bbibu berbentuk numerik Proses pembuatan variabel Bbibu selesai f. Variabel Eksklu 1. Pada kolom Name isikan Eksklu 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Status menyusui eksklusive 23
SUTANTO PRIYO HASTONO: Analisis Data 4. Geser kekanan ke kolom Value, isikan koding 0=tdk eksklusive 1=eksklusive Proses pembuatan variabel Eksklu selesai g. Variabel Hb1 1. Pada kolom Name isikan Hb1 2. Geser kekanan ke kolom Decimal, untuk variabel HB1 sesuai dengan datanya, ada satu desimal, maka isikan angka 1 3. Geser ke kolom Label isikan: Hb pengukuran pertama 4. Abaikan kolom Values, karena variabel HB1 berbentuk numerik h. Variabel Hb2 1. Pada kolom Name isikan Hb2 2. Geser kekanan ke kolom Decimal, untuk variabel HB2 sesuai dengan datanya, ada satu desimal, maka isikan angka 1 3. Geser ke kolom Label isikan: Hb pengukuran kedua 4. Abaikan kolom Values, karena variabel HB2 berbentuk numerik i. Variabel BBbayi 1. Pada kolom Name isikan BBbayi 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Berat badan bayi 4. Abaikan kolom Value, Proses pembuatan variabel bbbayi selesai Dengan cara sama kemudian dapat dibuat untuk variabel: Segera, Kolos, Lahir, Sampai Akhirnya tampilan kseluruhannya sbb:
24
B. Memasukkan/entry Data Setelah semua variabel sudah dibuat, maka langkah selanjutnya adalah memasukkan data hasil survei kedalam format yang telah dibuat diatas. Untuk memasukkan data anda harus berpindah ke layar/jendela Data View, yaitu dengan Klik tombol Data View, nampak tampilannya sbb:
Memasukkan data bisa menyamping satu persatu responden di entry datanya, atau bisa juga perkolom kearah bawah. Coba sekarang masukan data diatas sebanyak 10 responden , dan hasil tampilannya sbb: 25
c. Mengedit Data 1. Menghapus isi sel a. Klik sel yang akan dihapus isinya b. Tekan tombol Delete (pada Keyboard)/clear pada edit. Bila kita nggak jadi menghapus, klik Undo Untuk menghapus isi sejumlah sel sekaligus, pilihlah sejumlah sel tersebut dengan drag (menyorot/memblok) dengan mouse.
Dari tampilan di atas berarti kita membuat blok untuk variabel Kerja pada responden no 3 s/d 5 Tekan delete untuk menghapusnya.
26
SUTANTO PRIYO HASTONO: Analisis Data 2. Menghapus isi sel satu kolom (menghapus variabel) a. Klik heading kolom (nama variabel) yang akan dihapus isi-isi selnya, misalkan akan dihapus variabel BBibu: klik heading BBibu seperi tampilan sbb:
Klik disini
b. Tekan tombol delete Untuk menghapus isi sel sejumlah kolom sekaligus, pilihlah sejumlah kolom tersebut dengan drag (menyorot dan memblok) dengan mouse pada bagian heading. 3. Menghapus baris (menghapus case/responden) a. klik baris yang akan dihapus, contoh nomer responden 5 akan dihapus
27
SUTANTO PRIYO HASTONO: Analisis Data Nomor responden akan terhapus Untuk menghapus beberapa case sekaligus, pilihlah sejumlah case tersebut dengan drag (menyorot dan memblok) pada bagian nomor case. 4. Mengcopy isi sel a. Pilih sel (sejumlah sel dengan mnyorot) yang akan dicopy isinya. b. Tekan Ctrl+C c. Pindahkan penunjuk sel ke sel yang akan dituju d. Tekan Ctrl+V Hal yang perlu diperhatikan dalam mengcopy isi sel atau sejumlah sel adalah, bahwa format hasil copy akan selalu menyesuaikan dengan format variabel dimana isi sel atau sejumlah sel itu dicopykan. 5. Mengcopy isi satu kolom (mengcopy variabel) a. Klik heading kolom (nama variabel) yang akan dicopy isinya b. Tekan Ctrl+C c. Klik Heading kolom yang dituju d. Tekan Ctrl+V Hasil dari instruksi di atas adalah mengcopy kolom sekaligus format variabelnya (type variabel, lebar kolom, value label dsb), dan sudah pasti tetap tidak merubah nama variabel. Bila dikehendaki tidak ada perubahan format variabel kolom yang dituju, yang dilakukan adalah: a. Klik heading kolom (nama variabel) yang akan dicopy isinya b. Tekan Ctrl+C c. Pindahkan penunjuk sel ke baris pertama kolom yang dituju d. Tekan Ctrl+V Untuk mengcopy isi sel sejumlah kolom sekaligus, pilihlah sejumlah kolom tsb dengan drag pada bagian heading
28
SUTANTO PRIYO HASTONO: Analisis Data 6. Mengcopy isi satu baris (case/responden) a. Tekan Ctrl+C b. Klik nomor case yang akan dituju atau pindahkan penunjuk sel ke kolom Klik nomer Case yang akan dicopy c. pertama baris yang dituju d. Tekan Ctrl+V 7. Menyisipkan Kolom a. Pindahkan penunujuk sel pada kolom yang disisipi b. Klik Data, pilih Insert Variable, terlihat kolom baru muncul. 8. Menyisipkan Baris a. Pindahkan penunjuk sel pada baris yang akan disisipi b. Klik Data, pilih Insert Case, terlihat kasus/ responden baru muncul
29
Pada tampilan di atas terdapat beberapa isian kotak: Save in : Anda dapat memilih direktori (drive A untuk disket) tempat menyimpan file. Bila pada kotak Save in tidak dirubah berarti data disimpan dalam direktori program SPSS. File name : Anda harus mengetikkan nama file di kotak ini. SPSS akan menambahkan ekstension .sav, sehingga anda cukup mengetikkan nama filenya saja dan tidak perlu mengetikkan ekstensionnya. Save as type : data dapat disimpan dalam berbagai format. Untuk data SPSS akan disimpan dengan format sav. 2. Misalkan kita akan menyimpan data di drive C direktori my document dan diberi nama latihan. tampilannya sbb: Klik kotak file name , isikan latihan. Terlihat
30
31
Terlihat ada beberapa kotak isian Look in : Anda dapat memilih/mengganti direktori tempat file disimpan. Secara otomatis tampilan pertama akan muncul direktori SPSS. File Name : tempat untuk mengetikkan nama file, atau dapat juga dilakukan dengan meng-klik nama file yang tertampil pada kotak bagian atas file name. File of type : data dapat disimpan dalam berbagai format yang dapat dipilih dalam kotak ini. Secara otomatis akan muncul file format SPSS (.sav) 2. Misalkan sekarang akan diaktifkan file data: Latihan dari drive c direktori My Documen, maka caranya klik kotak File name: ketik latihan, atau klik latihan yang terlihat/tertampil pada kotak di atasnya.
32
33
dilihat/dicek pada Definisi Operasional Variabel dari penelitian/tesis/skripsi kita. Misalkan dalam penelitian anda definisi variabelnya sbb: No Variabel 1 2 3 Lama tugas Umur Sikap Definisi Operasional Rentang waktu berkeja petugas puskesmas Lama waktu hidup yang diukur dari Muda ulang tahun terakhir Pernyataan terhadap pertanyaan setuju/tidak sistem pencatatan Ordinal setuju Baik dan Buruk/ dan Ordinal dan tua/ Hasil Ukur/Skala sebagai Tahun/Rasio
Dari contoh definisis operasional di atas dapat diketahui bahwa variabel Lama tugas dapat langsung dianalisis, sedangkan variabel umur dan sikap masih perlu dilakukan modifikasi/transformasi dengan SPSS. Variabel umur perlu dilakukan 34
SUTANTO PRIYO HASTONO: Analisis Data pengelompokan menjadi umur muda (misalnya 30 th) dan tua (< 30 th). Variabel sikap perlu dibuat dengan cara menjumlahkan skor 10 pertanyaan sikap, kemudian variabel baru tersebut dilakukan pengelompkkan untuk membuat katagori baik dan buruk (misal menggunakan cut point: mean). Berikut akan diuraikan beberapa jenis modifikasi data yang dapat dilakukan di program SPSS for Window. 1. Mengelompokkan data
#perintah : RECODE
Pengelompokan biasanya digunakan untuk mengubah variabel numerik menjadi variabel katagorik. Pengelompokan dapat dilakukan pada variabel yang sama atau ke variabel baru yang berbeda. Dianjurkan kalau melakukan pengelompokan sebaiknya digunakan variabel baru sehingga masih dimiliki nilai yang asli pada file data. Coba aktifkan file data ASI.SAV (file ini berisi data penelitian menyusui eksklusive, yang telah di entry lengkap 50 rsponden) Sebagai contoh kita akan melakukan pengelompokan umur. Umur akan diklasifikasikan menjadi 3 kelompok yaitu: <20, 20-30 th, >30 th. Langkahnya: 1). Pilih Transform, sorot Recode sorot Into different variables
35
4). Sorot variabel umur, lalu klik tanda panah ke kanan sehingga umur berpindah di kotak Input variable
Output Variable:
5). Pada kotak Output variable, pada bagian Name ketiklah umur1 (nama variabel baru untuk umur yang bentuknya sudah katagorik) 6). Klik change sehingga pada kotak Input Variable umur umur1 36
7). Klik Option Old and New Value, nampak kotak Old and New di monitor. Pada kotak dialog tersebut ada beberapa ada beberapa isian yang harus diisi. Secara garis besar ada 2 isian yang harus diisi, yaitu Old Value (nilai lama yang akan direcode) dan New Value (nilai baru sebagai hasil recode dari nilai lama). Me-recode dapat dilakukan per satu nilai lama atau jangkauan nilai (range). 8). Sekarang kita akan merecode nilai umur < 20 th menjadi kode 1. Umur dibawah 20 th, artinya umur terendah/paling muda sampai dengan umur 19 th. Pindahkan kursor ke kotak Range: lowest through bawa kursor ke bagian kotak hasilnya sbb
, ketiklah 19 dan
37
Langkah 3
Langkah 1 Langkah 4
Langkah 2
through
, kita akan
merecode umur 20 s.d 30 th menjadi 2. Pada 2 kotak tersebut isilah 20 dan 30. lalu pindahkan kursor ke kotak New Value, ketiklah 2, klik Add.
10). Kita akan melakukan pengkodean berat > 30 th menjadi kode 3. Pada kotak Range:
kotak New Value, ketiklah 3, klik Add. Langkahnya seperti diatas, dan akhirnya setelah selesai hasilnya sbb:
38
11). Klik Continoue 12). Klik OK, terlihat variabel baru umur1 sudah terbentuk berada dikolom paling kanan
nampak variabel baru umur1 masih menampilkan angka dengan 2 desimal, anda dapat masuk ke Variable View, pada kolom decimal ketik 0, kemudian anda dapat juga memberi value label untuk kode 1= 20 th, 2 = 21 30 th dan 3= 31 th.
39
SUTANTO PRIYO HASTONO: Analisis Data 2. Membuat variabel baru hasil perhitungan matematik
# perintah : COMPUTE
Selain fasilitas me-recode yang sudahkita coba untuk mengelompokkan data, fasilitas SPSS yang lain yaitu membuat variabel baru hasil dari operasi matematik dari beberapa variabel yang sudah dientry, misal melakukan penjumlahan, pengurangan, pembagian dan perkalian dll. Sebagai contoh pada data ASI.SAV ada data berat badan bayi dalam bentuk satuan gram, sekarang anda diminta untuk membuat variabel baru, berat badan bayi dalam satuan kilogram. Adapun caranya: 1). Pastikan anda di posisi tampilan data editor 2). Pilih Transform 3). Pilih Compute, kemudian muncul kotak dialog Compute Variable.
Pada kotak tersebut terdapat kotak: Target Variable : diisi nama variabel yang akan dibuat, dapat merupakan variabel yang lama atau yang baru, sebaiknya nama baru
40
SUTANTO PRIYO HASTONO: Analisis Data numeric Expression : diisi rumus yang akan digunakan untuk menghitung nilai baru pada Target Variable. Rumus yang tertulis dapat mengandung nama variabel yang sudah ada, operasi matematik dan fungsi. Adapun operasi matematik yang dapat dilakukan: + = penjumlahan / = pengurangan = pembagian * = perkalian ** = pangkat (.) = kurung 4). Misalkan akan membuat variabel baru berat bayi, dengan nama bayikilo, maka pada kotak Target Variable, ketiklah bayikilo 5). Kemudian klik kotak Numeric Expression, sorot dan pindahkan variabel Bwt setelah itu bagilah 1000, tampilannya : bbbayi/1000, sehingga terlihat di layar:
6). Klik OK, sesaat kemudian variabel bayikilo akan muncul dibagian paling kanan.
41
# perintah : IF
Dalam pembuatan variabel baru seringkali dihasilkan dari kondisi beberapa variabel yang ada. Misalnya dalam file ASI.SAV terdapat variabel umur dan variabel berat ibu. Kemudian kita ingin membuat variabel baru yang berisi dua kelompok yaitu: risiko tinggi dan ririko rendah. Misalkan variabel tersebut diberi nama Risk dan untuk kelompok risiko rendah (kode 0) dan risiko tinggi (kode 1). Adapun kriteria risiko tinggi adalah bila responden berumur di atas 30 tahun dan berat badan dibawah 50 kg. Selain kondisi tersebut dikelompokkan ke dalam risiko rendah. Dari kasus ini berarti kita diharapkan membuat variabel baru dengan kondisi variabel umur dan hipertensi. Bagaimana cara membuat variabel Risk tersebut? Ada dua langkah untuk menyelesaikan kasus ini: Langkah pertama: = membuat variabel RISK yang isinya semuanya 0 (risiko rendah)= 1). Pilih Transform 2). Pilih Compute 3). Pada kotak Target Variable, ketiklah risk 4). Pada kotak Numeric Expression, ketiklah 0
42
Langkah kedua: =membuat kondisi risiko tinggi (kode 1) untuk umur >30 dan bb<50 6). Pilih kembali menu Transform 7). Pilih kembali Compute 8). Pada kotak Target Variable biarkan tetap berisi RISK. 43
SUTANTO PRIYO HASTONO: Analisis Data 9). Pada kotak Numeric Expression, hapus angka 0 dan gantilah dengan angka 1.
Cases
11). Klik tombol berbentuk lingkaran kecil: Include if case satisfies condition. 12). Pada kotak di bawah option include . : ketiklah: umur > 30 & bbibu < 50
44
15). Klik OK, maka terbentuklah variabel RISK pada kolom paling kanan dengan isi 0 dan 1 (0=risiko rendah dan 1= risiko tinggi), kalau menemui data yang berisi umur diatas 30 tahun dan berat ibu dibawah 50 th, maka isi variabel RISK akan berubah dari 0 menjadi 1, coba dicek !!!! Note : setiap kita melakukan perintah : Compute, Recode, atau IF sebaiknya di croscek, apakah hasilnya betul sesuai yang kita kehendaki
45
# perintah : SELECT
Dalam kondisi tertentu seringkali kita hanya menginginkan mengolah dan menganalisis hanya data dari kelompok tertentu saja. Misalkan kita punya data seluruh DKI, tapi kita hanya ingin mengetahui distribusi aktifitas pada ibu hamil yang tinggal di Jakarta Selatan. Di dalam data tentunya ada variabel yang menunjukkan wilayah tempat tinggal ibu hamil. Sebagai contoh kita ingin menganalisis data, hanya untuk ibu yang menyusui saja,(dalam contoh ini kita masih menggunakan file data ASI.SAV). caranya: 1). Pilih menu Data 2). Pih Select Cases 3). Klik pada tombol : If Conditin is satisfied
4). Klik If 5). Ketiklh/sorot dan pindah pada kotak dan tuliskan kondisinya yaitu: Eksklu=0 Ket: ibu yang menyusui eksklusive kodenya=0
46
6). Klik Continue 7). Perhatikan di bagian bawah pada kotak: Unselected cases are: filtered atau
deleted. Pilihlah filtered artinya data yang tidak dianalisis hanya ditandai
dengan pencoretan nomor kasus. Sedangkan untuk Deleted, artinya kasus yang tidak terpilih akan dihapus secara permanen. Biasanya digunakan option: filtered. 8). Klik OK sehingga anda kembali ke data editor. Perhatikan pada data editor ada beberapa kasus yang tidak terpilih (dimatikan), yang ditandai dengan pencoretan nomor kasusnya. Nomor batang yang dicoret artinya dikeluarkan dari data, sedangkan yang tidak dicoret merupakan data yang aktif (ibu yang menyusui eksklusive)
47
# perintah : MERGE
Dalam pengolahan data seringkali kita mempunyai tidak satu file data, melainkan beberapa file data yang tentunya harus digabung kalau kita akan melakukan analisis data. Teknik penggabungan data ada dua jenis yaitu penggabungan responden dan penggabungan variabel. a. Penggabungan responden/case Misal: data file pertama, berisi: nomor responden 1 s/d 3 No 1 2 3 Data file kedua, berisi: No 4 5 6 7 Umur 20 23 19 nomor responden 4 s/d 7 Umur 21 23 20 24 Didik 1 4 2 3 Didik 1 3 2
Aplikasi di SPSS: Pastikan anda sudah memasukkan data kedua file, misalnya data pertama dengan nama Data1.sav dan data kedua dengan nama Data2.sav. Langkahnya: 1. File data1.sav dalam kondisi aktif 2. klik data, sorot Merge Files, sorot Add Cases
49
5. klik Open 6. Klik OK, dan akhirnya tergabunglah kedua file data 7. Untuk menyimpan file gabungan, klik Save As isikan nama file baru, misalnya data12 b. Penggabungan variabel Data pertama : berisi variabel : no, umur dan didik no 1 2 3 4 5 6 7 umur 20 23 19 21 23 20 24 Didik 1 3 2 1 4 2 3
Data kedua, berisi variabel : no, sex, kerja dan berat badan 50
Data gabungan, berisi : no, umur, didik, sex, kerja dan bb no 1 2 3 4 5 6 7 umur 20 23 19 21 23 20 24 Didik 1 3 2 1 4 2 3 sex 2 2 1 2 2 1 24 kerja 1 3 2 1 3 2 3 bb 60 45 56 76 56 60 55
Langkahnya: Aplikasi di SPSS: Pastikan anda sudah memasukkan data kedua file, misalnya data pertama dengan nama Data3.sav dan data kedua dengan nama Data4.sav. Langkahnya: 1. File data3.sav dalam kondisi aktif 2. klik data, sorot Merge Files, sorot Add Variables
51
3. klik Add Variables 4. klik Open, Klik OK 5. Tampilan sudah tergabung variabelnya, anda tinggal melakukan penyimpanan klik Save As beri nama file misal namanya Data34 6. Menyimpan hasil olahan/hasil analisis Hasil analisis akan ditampung pada jendela output (output windows) seperti tampak pada gambar di bawah ini. Anda dapat mengedit teks langsung pada windows tersebut. Prosedur yang sering digunakan untuk edit teks, seperti Cut,
Copy dan Paste juga dapat digunakan di jendela output ini. Bila anda akan
menyimpan hasil analisis: 1). Pilih File 2). Pilih Save SPSS Output 3). Ketik/isikan nama file-nya 4). Klik OK
52
Frequencies
Statistics RISK N Valid Missing
5 0
Valid
1 2 Total
Frequency 2 3 5
53
UJI INSTRUMEN
SUTANTO PRIYO HASTONO: Analisis Data dengan meteran logam akan mendapatkan hasil yang sama kalau
pengukurannya diulang dua kali atau lebih. Sebaliknya pengukuran yang dilakukan dengan kaki, besar kemungkinan akan didapatkan hasil yang berbeda kalau pengukurannya diulang dua kali atau lebih. Dari ilustrasi ini berarti meteran logam lebih reliable dibandingkan langkah kaki untuk mengukur jarak. CARA MENGUKUR VALIDITAS Untuk mengetahui validitas suatu instrumen (dalam hal ini kuesioner) dilakukan dengan cara melakukan korelasi antar skor masing-masing variabel dengan skor totalnya. Suatu variabel (pertanyaan) dikatakan valid bila skor variabel tersebut berkorelasi secara signifikan dengan skor totalnya. Teknik korelasi yang digunakan korelasi Pearson Product Moment: r= N (XY)- (XY) V[NX2 (X)2][NY2 (Y)2]
Keputusan uji: Bila r hitung lebih besar dari r tabel Bila r hitung lebih kecil dari r tabel valid CARA MENGUKUR RELIABILITAS Pertanyaan responden dikatakan tidak reliabel setuju jika jawaban seseorang terhadap dapat pertanyaan adalah konsisten atau stabil dari waktu ke waktu. Jadi jika misalnya menjawab terhadap perilaku merokok mempertinggi kepercayaan diri, maka jika beberapa waktu kemudian ia ditanya lagi untuk hal yang sama, maka seharusnya tetap konsisten pada jawabab semula yaitu tidak setuju. Pengukuran reliabilitas pada dasarnya dapat dilakukan dengan dua cara : Ho ditolak, artinya variabel valid Ho gagal ditolak, artinya variabel tidak
55
SUTANTO PRIYO HASTONO: Analisis Data a. Repeated Measure atau ukur ulang. Pertanyaan ditanyakan pada reponden berulang pada waktu yang berbeda (misal sebulan kemudian), dan kemudian dilihat apakah ia tetap konsistendengan jawabannya b. One Shot atau diukur sekali saja. Disini pengukurannya hanya sekali dan kemudian hasilnya dibandingkan dengan pertanyaan lain. Pada umumnya pengukuran dilakukan dengan One Shot dengan beberapa pertanyaan Pengujian reliabilitas dimulai dengan menguji validitas terlebih dahulu. Jadi jika pertanyaan tidak valid, maka pertanyaan tersebut dibuang. Pertanyaanpertanyaan yang sudah valid kemudian baru secara bersama-sama diukur reliabilitasnya.
56
57
SUTANTO PRIYO HASTONO: Analisis Data Ujilah kelima pertanyaan diatas apakah sudah valid dan reliabel Penyelesaian: Langkahnya: 1. 2. 3. 4. Masukkan data tersebut ke SPSS Klik Analyze Pilih Scale Pilih Reliability Analysis
5.
Masukkan semua variabel ke dalam kotak Items (ingat variabel yang masuk hanya variabel yang akan diuji saja, yaitu P1, P2, P3, P4 dan P5) bentuknya sbb:
58
6. 7.
8. 9. 10.
Pada bagian Descriptives for klik pilihan tem, Scale if Item deleted. Klik Continue
N of Items 5
Item Statistics sering terpaksa lembur Bersaing dlm hidup Mudah marah konflik keluarga konflik dgn teman Mean 2.47 2.27 2.40 2.40 2.47 Std. Deviation 1.187 1.100 1.121 1.121 1.187 N 15 15 15 15 15
59
Item-Total Statistics Scale Mean if Item Deleted 9.53 9.73 9.60 9.60 9.53 Scale Variance if Item Deleted 15.124 20.924 15.971 15.686 15.124 Corrected Item-Total Correlation .963 .328 .915 .955 .963 Cronbach's Alpha if Item Deleted .881 .993 .892 .884 .881
sering terpaksa lembur Bersaing dlm hidup Mudah marah konflik keluarga konflik dgn teman
Interpretasi: Hasil analisis reliability memperlihatkan dua bagian. Bagian utama menunjukkan hasil statistik deskriptif masing-masing variabel dalam bentuk mean, varian dll. Pada bagian kedua memperlihatkan hasil dari proses validitas dan reliabilitas. Kaidah yang berlaku bahwa pengujian dimulai dengan menguji validitas kuesioner baru dilanjutkan uji reliabilitas. a. Uji Validitas Untuk mengetahui validitas kuesioner dilakukan dengan membandingkan nilai r tabel dengan nilai r hitung. *) Menentukan nilai r tabel Nilai r tabel dilihat dengan tabel r (pada lampiran) dengan menggunakan df = n2 15-2=13. Pada tingkat kemaknaan 5%, didapat angka r tabel = 0,514 **) Menentukan nilai r hasil perhitungan Nilai r hasil dapat dilihat pada kolom Corrected item-Total Correlation ***) Keputusan Masing-masing pertanyaan/variabel dibandingkan nilai r hasil dengan nilai r tabel, ketentuan: bila r hasil > r tabel, maka pertanyaan tersebut valid. Kesimpulan: Terlihat dari 5 pertanyaan, ada satu pertanyaan yaitu P2 (r=0,3275) yang nilainya lebih rendah dari r tabel (r=0,514). Sehingga pertanyaan P2 tidak valid, sedangkan untuk pertanyaan P1, P3, P4 dan P5 dinyatakan valid. 60
SUTANTO PRIYO HASTONO: Analisis Data Langkah selanjutnya melakukan analisis lagi dengan mengeluarkan pertanyaan yang tidak valid. Lakukan prosedur/langkah seperti di atas yaitu: 1. Klik Analyze 2. Pilih Scale 3. Pilih Reliability Analysis 4. Masukkan keempat variabel ke dalam kotak Items (variabel P2 tidak ikut dianalisis) 5. Klik OK Kemudian muncul tampilan Output sbb:
Item Statistics sering terpaksa lembur Mudah marah konflik keluarga konflik dgn teman Mean 2.47 2.40 2.40 2.47 Std. Deviation 1.187 1.121 1.121 1.187 N 15 15 15 15
Item-Total Statistics Scale Mean if Item Deleted 7.27 7.33 7.33 7.27 Scale Variance if Item Deleted 11.495 12.095 12.095 11.495 Corrected Item-Total Correlation .996 .971 .971 .996 Cronbach's Alpha if Item Deleted .988 .994 .994 .988
sering terpaksa lembur Mudah marah konflik keluarga konflik dgn teman
Interpretasi: Sekarang terlihat bahwa dari keempat pertanyaan, semua mempunyai nilai r hasil (Corrected item-Total Correlation) berada di atas dari niali r tabel (r=0,514), sehingga dapat disimpulkan keempat pertanyaan tersebut valid. 61
b. Uji Reliabilitas setelah semua pertanyaan valid semua, amnalisis dilanjutkan dengan uji reliabilitas. Untuk mengetahui reliabilitas caranya adalah; membandingkan nialia r hasil dengan r tabel.dalam uji reliabilitas sebagai nilai r hasil adalah nilai Alpha (terletak di akhir output). Ketentuannya: bila r Alpha > r tabel, maka pertanyaan tersebut reliabel Dari hasil uji di atas ternyata, nilai r Alpha (0,9935) lebih besar dibandingkan dengan nilai r tabel, maka keempat pertanyaan di atas dinyatakan reliabel.
62
Kemudian dilakukan uji coba dengan pengamatan sebanyak 10 pasien, adapun hasilnya sbb: No pasien 1 2 3 4 5 6 7 8 9 10 peneliti 1 2 1 2 1 2 1 2 2 2 numerator 2 2 1 1 1 2 1 2 2 2
Ujilah apakah ada kesepakatan antara peneliti dengan numerator: Langkah: 1. data di entry di SPSS 2. Klik analysis, sorot Descriptif, sorot dan klik Crostab 3. Masukkan variabel peneliti ke bagian Row dan masukkan variabel numerator ke bagian colom. 4. Klik tombol Statistic, klik Kappa 5. Klik Continue 6. Klik OK, dan hasilnya
63
Symmetric Measures Value .583 10 Asymp. a Std. Error .262 Approx. T 1.845
b
Kappa
a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.
Hasil uji didapatkan nilai koefisien kapaa sebesar 0,583 dan p valuenya sebesar 0,065. Dengan hasil ini berarti p value > alpha berarti hasil uji kappa tidak signifikan/bermakna, sehingga kesimpulannya: ada perbedaan persepsi mengenai aspek yang diamati antara peneliti dengan numerator.
64
4
1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya adalah menganalisis data. Data mentah (raw data) yang sudah susah payah kita kumpulkan tidak akan ada artinya jika tidak dianalisis. Analisis data merupakan kegiatan yang sangat penting dalam suatu penelitian, karena dengan analisislah data dapat mempunyai arti/makna yang dapat berguna untuk memecahkan masalah penelitian. Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat langsung memberi jawaban penelitian, untuk itu perlu diketahui bagaimana menginterpretasi hasil penelitian tersebut. Menginterpretasi berarti kita menjelaskan hasil analisis guna memperoleh makna/arti. Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas. Interpretasi dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya sebatas pada masalah penelitian yang diteliti berdasarkan data yang dikumpulkan dan diolah untuk keperluan penelitian tersebut. Sedangkan interpretasi dalam arti luas (analitik) yaitu interpretasi guna mencari makna data hasil penelitian dengan jalan tidak hanya menjelaskan/menganalisis data hasil penelitian tersebut, tetapi juga melakukan inferensi (generalisasi) dari data yang diperoleh dengan teori-teori yang relevan dengan hasil-hasil penelitian tersebut.
Pada umumnya analisis data bertujuan untuk: a. Memperoleh gambaran/deskripsi masing-masing variabel 65
SUTANTO PRIYO HASTONO: Analisis Data b. Membandingkan dan menguji teori atau konsep dengan informasi yang ditemukan c. Menemukan adanya konsepbaru dari data yang dikumpulkan d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau hanya berlaku pada kondisi tertentu Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari: a. Jenis penelitian b. Jenis sampel c. Jenis data/variabel d. Asumsi kenormalan distribusi data
a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan survei. Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan kuantitatif. Namun bila kita menginginkan untuk mendapatkan pendapat/gambaran yang mendalam tentang suatu fenomena, maka data dapat dikumpulkan dengan fokus grup diskusi atau observasi, maka analisisnya menggunakan pendekatan analisis kualitatif.
c. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua sampel independen atau dependen. Misalnya pada penelitian survei yang tidak menggunakan sampel yang sama, dapat digunakan uji statistik yang mengasumsikan sampel yang independen. Misalkan survei untuk mengetahui apakah ada perbedaan berat badan bayi antara bayi-bayi yang dilahirkan dari ibu perokok dengan bayi-bayi dari ibu yang tidak merokok. Disini berarti kelompok ibu perokok dan kelompok ibu bukan perokok bersifat independen.
66
SUTANTO PRIYO HASTONO: Analisis Data Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang digunakanadalah uji statistik utnuk data yang dependen. Misalnya, suatu penelitian ingin mengetahui pengaruh penelitian manajemen terhadap kinerja petugas kesehatan. Pertanyaan penelitiannya Apakah ada perbedaan kinerja petugas kesehatan antara sebelum dan sesudah mendapatkan pelatihan manajemen?. Dalam penelitian ini sampel kelompok petugas kesehatan bersifat dependen, karena pada kelompok (orang) yang sama diukur dua kali yaitu pada saat sebelum pelatihan (pre test) dan sesudah dilakukan pelatihan (Post Test).
c. Jenis Data/Variabel
Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik. Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai contoh, nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk menjelaskan data berjenis katagorik, sedangkan untuk data jenis numerik biasanya dapat menggunakan nilai rata-rata untuk menjelaskan karakteristiknya. Untuk analisis hubungan dua variabel (analsis bivariat), uji kai kuadrat hanya dapat dipakai untuk mengetahui hubungan data katagori dengan data katagori. Sebaliknya untuk mengetahui hubungan numerik dengan numerik digunakan uji korelasi/regresi.
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan prosedur uji statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat dipenuhi maka dapat digunakan uji statistik parametrik. Berikut kuantitatif): 1. Analisis Deskriptif (Univariat). 67 ini akan dijelaskan langkah-langkah analisis (pendekatan
SUTANTO PRIYO HASTONO: Analisis Data Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan
karakteristik masing-masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik digunakan nilai mean (rata-rata), median, standard deviasi dan inter kuartil range, minimal maksimal. 2. Analisis Analitik (Bivariat) Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis lebih lanjut. Apabila diinginkan analisis hubungan antar dua variabel, maka analisis dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui hubungan antara berat badan dengan tekanan darah. Untuk mengetahui hubungan dua variabel tersebut biasanya digunakan pengujian statistik. Jenis uji statistik yang digunakan sangat tergantung jenis data/variabel yang dihubungkan. 3. Analisis Multivariat Merupakan analisis yang menghubungkan antara beberapa variabel independen dengan satu variabel dependen. Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan dipelajari pada bab tersendiri yaitu bab 5, 6 dan 7
68
ANALISIS UNIVARIAT
( DESKTIPTIF)
Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan karakteristik masing-masing variabel yang diteliti. Dalam analisis data kuantitatif kita dihadapkan pada kumpulan data yang besar/banyak yang belum jelas maknanya. Fungsi analisis sebetulnya adalah menyederhanakan atau meringkas kumpulan data hasil pengukuran sedemikian rupa sehingga kumpulan data tersebut berubah menjadi informasi yang berguna. Peringkasan tersebut berupa ukuran-ukuran statistik, tabel dan juga grafik. Secara teknis pada dasarnya analisis merupakan kegiatan meringkas kumpulan data menjadi ukuran tengah dan ukuran variasi. Selanjutnya membandingkan gambaran-gambaran tersebut antara satu kelompok subyek dan kelompok subyek lain, sesuai dengan tujuan yang ingin dicapai dalam analisis. Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran variasi) jenis data (apakah numerik atau katagorik) akan sangat menentukan bentuk peringkasan datanya. Berikut akan diuraikan bentuk/cara peringkasan data untuk data numerik dan data katagorik. 1. Peringkasan Data Untuk Data Jenis Numerik a. Ukuran Tengah Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil pengukuran. Berbagai ukuran dikembangkan utnuk mencerminkan ukuran tengah tersebut, dan yang paling sering dipakai adalah mean, median dan mode/modus. 1). Mean
69
SUTANTO PRIYO HASTONO: Analisis Data Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua nilai pengukuran dibagioleh banyaknya pengukuran. Secara sederhana perhitungan nilai mean dapat dituliskan dengan rumus : X = Xi / n Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan seluruh data dalam penghitungannya. Namun kelemahan dari nilai mean adalah sangat dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi maupun rendah. Oleh karena itu pada kelompok data yang ada nilai ekstrimnya (sering dikenal dengan distribusi data yang menceng/miring), Mean tidak dapat mewakili rata-rata kumpulan nilai pengamatan. Sebagai contoh data yang ada nilai ekstrimnya adalah data penghasilan. Apabila mean perndapatan perbulan adalah Rp 10.000.000,- , sebenarnya sebagian besar orang pendapatannya di bawah Rp 10.000.000,- . Mean sebesar Rp 10.000.000,- diperoleh karena tarikan sekelompok kecil orang (misalnya konglomerat) yang pendapatannya sangat tinggi. Dengan demikian penggunaan mean untuk data yang ada nilai ekstrimnya (data yang distribusinya menceng) kurang tepat. Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr. Mean = (1+3+4+2+90)/5 = 20 hr. Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini tendtunya tidak dapat mewakili karena secara visual datanya sebagian besar kurang dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada nilai ekstrimnya. 2). Median Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nialai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda dengan nilai mean, penghitungan median hanya mempertimbangkan urutan nilai dasil pengukuran, besar beda antar nilai di abaikan. Karena 70
SUTANTO PRIYO HASTONO: Analisis Data mengabaikan besar beda, maka median tidak dipengaruhi oleh nilai ekstrim. Prosedur penghitungan median melalui langkah a). Data diurutkan/di-array dari nilai kecil ke besar b). Hitung posisi median dengan rumus (n+1)/2 c). Hitung nilai mediannya Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th Data diurutkan: 20, 24, 26, 30, 36, 40 Posisi = (6+1)/2 = 3,5 Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28 Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa berumur di atas 28 tahun 3). Mode/Modus Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak. Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th. Dari data tersebut berarti mode-nya adalah 20 tahun
71
SUTANTO PRIYO HASTONO: Analisis Data b. Ukuran Variasi Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau dengan kata lain hasil pengamatan akan bervariasi. Untuk menegtahui seberapa jauh data bervariasi digunakan ukuran variasi antara lain range, jarak linier kuartil dan standard deviasi. 1). Range Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai ekstrim. Keuntungan penghitungan dapat dilakukan dengan cepat. 2). Jarak Inter Quartil Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian ditentukan kuartil bawah dan atas. Kuartil merupakan pembagiandata menjadi 4 bagian yang dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil II dan kuartil III. Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di atasnya. Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data berada di atasnya. Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya. Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi sangat menyebar. 3). Standard Deviasi Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi terhadap mean disebut varian, yang rumusnya; Varian = (Xi X)2 n
72
SUTANTO PRIYO HASTONO: Analisis Data Semakin besar nilai varian akan semakin bervariasi, karena satuan varian (kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka dikembangkan suatu ukuran variasi yang mempunyai satuan yang sama dengan satuan pengamatan, yaitu Standard Deviasi. Standard Deviasi merupakan akar dari varian: Standard deviasi (S atau SD = (Xi X)2 n
Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila tidak ada variasi, maka SD=0 Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan niali mean (rata-rata), median, standard deviasi dan inter quartil range, miinimal dan maksimal. Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal), maka perhituungan nilai mean dan standard deviasi merupakan cara analisis univariat yang tepat. Seddangkan bila dijumpai nilai ekstrim 9distribusi data tidak normal), maka nilai nedian dan inter quartil range (IQR) yang lebih tepat dibandingkan nilai mean. 2. Peringkasan Data Katagorik Berbeda dengan data numerik, peringkasan, (baik ukuran tengah maupun ukuran variasi) tidak beragam jenisnya. Pada data katagorik peringkasan data hanya menggunakan distribusi frekuensi dengan ukuran persentase atau proporsi. Bila data berjenis katagorik, tentunya informasi/peringkasan yang penting disampaikan tidak mungkin/tidak lazim menggunakan ukuran mean atau median. melainkan informasi jumlah dan persentase katagori sama. yang disajikan. Untuk ukuran variasi, pada data katagorik variasi maksimal apabila jumlah antar
73
SUTANTO PRIYO HASTONO: Analisis Data Contoh: Kelas A: mahasiswa 50 dan mahasiswi 50 Kelas B: mahasiswa 90 dan mahasiswi 10 Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria dan 50% wanita. Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria) karena pria 90% dan wanita hanya 10%. 3. Bentuk Penyajian Data Bentuk penyajian analisis univariat dapat berupa tabel atau grafik. Namun perlu diingat bahwa kita dianjurkan hanya memilih salah satu, tidak diperkenankan secara sekaligus menggunakan tabel dan juga grafik dalam m,enyampaikan informasi suatu data/variabel. Contoh penyajian analisis deskriptif: a. Data numerik Tabel 1 Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999 Variabel 1. Umur 2. Lama hari rawat Mean Median 30,3 31,1 10,1 7,0 8,9 2 60 10,1 17 60 SD Minimal- Maksimal
74
b. Data katagorik Tabel 2 Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X tahun 1999
Jumlah 60 30 10 100
Bagaimana menginterpretasi tabel di atas? dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana? Selain untuk mendeskripsikan masing-masing variabel, analisis univariat dapat juga sekaligus untuk mengeksplorasi variabel yang dapat berguna dalam mendiagnosis asumsi statistik lanjut (terutama untuk variabel jenis numerik), misalnya apakah variannya homogen atau heterogen, apakah distribusinya normal atau tidak. Eksplorasi data juga dapat untuk mendeteksi adanya nilai ekstrim/outlier, bila ada nilai ekstrim sangat menentukan analisis selanjutnya (bivariat) apakah nilainya akan berkurang.
75
2. Sorot variabel didik. Klik tanda panah dan masukkan ke kotak Variable (s)
76
Frequencies
Statistics pendidikan formal ibu menyusui N Valid 50 Missing 0 pendidikan formal ibu menyusui Frequency 10 11 16 13 50 Percent 20.0 22.0 32.0 26.0 100.0 Valid Percent 20.0 22.0 32.0 26.0 100.0 Cumulative Percent 20.0 42.0 74.0 100.0
Valid
1 2 3 4 Total
Kolom Frequency menunjukkan jumlah kasus dengan nilai yang sesuai. Pada contoh di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang berpendidikan SD, proporsi dapat dilihat pada kolom Percent, pada contoh di atas ada 20% ibu yang berpendidikan SD. Kolom Valid Percent memberi hasil yang sama karena pada data ini tidak ada missing cases. Cumulative Percent
77
SUTANTO PRIYO HASTONO: Analisis Data menjelaskan tentang persent kumulatif. Pada contoh di atas ada 42,0% ibu yang tingkat pendidikannya SD dan SMP. Dalam menginterpretasikan tabel katagorik dapat dilihat dari variasi dan konsentrasi datanya.
Distribusi tingkat pendidikan responden hampir merata untuk masing-masing tingkat pendidikan. Paling banyak responden berpendidikan SMU yaitu 16 orang (32,0%) sedangkan untuk pendidikan SD, SMP dan PT masing-masing 20,0%, 22,0% dan 26,0%.
b. Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan ukuran tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata, median dan modus. Sedangkan ukuran sebarannya (variasi) yang digunakan adalah range, standard deviasi, minimal dan maksimal. Pada SPSS ada dua cara untuk mengeluarkan atau analisis deskriptif Expolre. yaitu dapat yang melalaui digunakan perintah adalah 78 Frequencies perintah Biasanya
Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada menu
Frequencies sangat lengkap (seperti mean, median, varian dll), selain itu pada perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya. Berikut akan dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan menggunakan perintah frequencies. 1. Aktifkan data susu.sav 2. Pilih Analyze 3. Pilih Descriptive Statistic 4. Pilih Frequencies, terlihat kotak frequencies: 5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda panahsehingga umur masuk ke kotak variable (s).
6. Klik tombol option Statistics, pilih ukuran yang anda minta misalnya mean, median, standard seviasi, minimum, maximum, SE.
79
7. Klik Continue 8. Klik tombol option Charts lalu muncul menu baru dan klik Histogram, lalu klik With Normal Curve
9. Klik Continue 10. Klik OK, dan pada layar terlihat distribusi frekuensi disertai ukuran statistik yang diminta dan dibawahnya tampak grafik histogram beserta curve normalnya.
Frequencies
Statistics Umur ibu menyusui N Valid Missing
50 0
80
Statistics umur ibu menyusui N Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Minimum Maximum
umur ibu menyusui Frequency 7 3 3 5 5 4 2 5 3 3 3 3 2 2 50 Percent 14.0 6.0 6.0 10.0 10.0 8.0 4.0 10.0 6.0 6.0 6.0 6.0 4.0 4.0 100.0 Valid Percent 14.0 6.0 6.0 10.0 10.0 8.0 4.0 10.0 6.0 6.0 6.0 6.0 4.0 4.0 100.0 Cumulative Percent 14.0 20.0 26.0 36.0 46.0 54.0 58.0 68.0 74.0 80.0 86.0 92.0 96.0 100.0
Valid
19 20 21 22 23 24 25 26 27 30 31 32 34 35 Total
81
Histogram
Frequency
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan nilai standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas, rata-rata umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi 4,85 tahun dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi frekuensi ditampilkan menurut umur termuda sampai dengan umur tertua dengan informasi tentang jumlah dan persentasenya. Bentuk distribusi data dapat diketahui dari grafik histogram dan kurve normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi variabel umur berbentuk normal Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi interval lakukan analisis eksplorasi data dengan perintah Explore. Adapun caranya sbb: 1. Dari menu utama SPSS, pilih menu Analyze, kemudian pilih submenu descriptive Statistics, lalu pilih Explore 82
SUTANTO PRIYO HASTONO: Analisis Data 2. Isikan kotak Dependent List dengan variabel umur, kotak Factor List dan
Explore
83
Descriptives umur ibu menyusui Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Tests of Normality Kolmogorov-Smirnov Statistic df Sig. .130 50 .035
a
Statistic 25.10 23.72 26.48 24.90 24.00 23.520 4.850 19 35 16 9 .547 -.812
.337 .662
Sig. .002
10 1 case(s)
84
Expected Normal
-1
-2 15 20 25 30 35
Observed Value
35
30
25
20
15
85
Dari hasil analisis Explore terlihat juga nilai mean, median dan mode. Namun yang paling penting dari tampilan explore munculnya angka estimasi interval. Dari hasil tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita dapat menghitung 95% confidence interval umur yaitu 23,72 s.d. 26,48. jadi kita 95% yakin bahwa rata-rata umur ibu di populasi berada pada selang 23,72 sampai 26,48 tahun. Uji kenormalan data: Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya yaitu: 1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai bel shape, berarti distribusi normal 2. Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi standar errornya menghasilkan angka 2, maka distribusinya normal 3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value < 0,05) maka distribusi normal. Namun uji kolmogorov sangat sensitif dengan jumlah sampel, maksudnya : untuk jumlah sampel yang besar uji kolmogorov cenderung menghasilkan uji yang signifikan (yang artinya bentuk distribusinya tidak normal). Atas dasar kelemahan ini dianjurkan untuk mengetahui kenormalan data lebih baik menggunakan angka skewness atau melihat grafik histogram dan kurve normal
86
SUTANTO PRIYO HASTONO: Analisis Data Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat bentuk yang normal, selain itu hasil dari perbandingan skwness dan standar error didapatkan: 0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti distribusi normal. Dari hasil tersebut diatas dengan demikian variabel umur disimpulkan berdistribusi normal. Penyajian dan Interpretasi di Laporan Penelitian Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah sbb: Tabel 1 Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x Variabel Umur Mean 25,10 SD 4,85 Minimal- Maksimal 19 - 35 95% CI 23,72 26,48
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72 26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur tertua 35 tahun. Dari hasil estimasi interval dapat disimpulkan bahwa 95% diyakini bahwa rata-rata umur ibu adalah diantara 23,72 sampai dengan 26,48 tahun.
87
6
pembayaran berobat
ANALISIS BIVARIAT
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis dan kepuasan pasien, kita hanya melakukan pendeskripsian sendiri-sendiri untuk variabel jenis pembayaran dan kepuasan pasien. Untuk variabel jenis pembayaran akan diketahui berapa persen yang berobat dengan biaya sendiri dan berapa persen yang dibiayai askes. Begitu juga untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan berapa persen yang tidak puas. Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh diatas berarti kita ingin mengetahui hubungan jenis pembayaran dengan kepuasan pasien, maka analisis dilanjutkan pada tingkat bivariat. Pada analisis bivariat kita dapat mengetahui apakah ada perbedaan kepuasan pasien antara pasien dengan membayar sendiri dengan pasien dengan biaya askes. Kegunaan analisis bivariat bisa untuk mengetahui apakah ada hubungan yang siginifikan antara dua variabel, atau bisa juga digunakan untuk mengetahui apakah ada perbedaan yang signifikan antara dua atau lebih kelompok(sampel).
SUTANTO PRIYO HASTONO: Analisis Data berubah menjadi bermakna secara statitik. Oleh karena itu arti kegunaan dari setiap penemuan jangan hanya dilihat dari aspek statistik semata, namun harus juga dinilai/dilihat kegunaannya dari segi klinis/substansi. Sebagai contoh ada studi eksperimen yang akan menguji dua obat (katakanlah obat A dan Obat B) untuk mengathui pengaruhnya terhadap penurunan tekanan darah. Kemudian obat A dan B diujicobakan pada dua kelompok relawan penderita hipertensi. Hasil eksperimen didapatkan bahwa rata-rata penurunan tekanan darah setelah minum obat A adalah 40 mmHg dan pada kelompok yang minum Obat B ratarata penurunannya 39 mmHg. Kemudian dilakukan uji statistik dan hasilnya signifikan/bermakna (p value < alpha), apa yang dapat disimpulkan dari temuan ini? Secara statistik memang terjadi perbedaan bermakna, namun secara substansi tidaklah mempunyai perbedaan yang berarti, oleh karena perbedaan mean penurunan tekanan darah antara obat A dan B hanya 1 mmHg. Dengan hasil ini dapat disimpulkan bahwa sebenarnya antara obat A dan B tidak ada perbedaan (sama saja) kasiatnya.
UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan keputusan tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau hubungan, cukup menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini didasarkan pada besarnya peluang untuk memperoleh hubungan tersebut secara kebetulan (by chance). Semakin kecil peluang tersebut (peluang adanya by
SUTANTO PRIYO HASTONO: Analisis Data Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel (data hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan. Peluang untuk diterima atau ditolaknya suatu hipotesis tergantung besar kecilnyanya perbedaan antara nilai sampel dengan nilai hipotesis. Bila perbedaan tersebut cukup besar, maka peluang untuk menolak hipotesis besar pula, sebaliknya bila perbedaan tersebut kecil, maka peluang untuk menolak hipotesis menjadi kecil. Jadi, makin besar perbedaan antara nilai sampel dengan nilai hipotesis, makin besar peluang untuk menolak hipotesis. Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua kemungkinan yaitu menolak hipotesis dan menerima hipotesis (gagal menolak hipotesis). Perlu dipahami bahwa arti menerima hipotesis sebetulnya kurang tepat, yang tepat adalah gagal menolak hipotesis. Dalam uji hipotesis bila kesimpulannya menerima hipotesis, bukan berarti bahwa kita telah membuktikan hipotesis tersebut benar, karena benar atau tidaknya suatui hipotesis hanya dapat dibuktikan dengan mengadakan observasi pada seluruh populasi, dan hal ini sangat sulit bahkan tidak mungkin untuk dilakukan. Jadi menerima hipotesis sebetulnya artinya adalah kita tidak cukup bukti untuk menolak hipotesis, dengan kata lain dapat diartikan kita gagal menolak hipotesis. Untuk memperjelas pengertian kebenaran bahwa gagal menolak hipotesis berbeda dengan mengakui hipotesis (menerima hipotesis, kita coba analogkan proses
persidangan kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan membuktikan kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau sitertuduh benar. Pengadilan memutuskan bahwa si tertuduh tidak dapat dibuktikan bersalah, bukan memutuskan tidak bersalah. Dari uraian tersebut sangatlah jelas bahwa istilah yang tepat dalam kesimpulan uji hipotesis adalah gagal menolak hiopotesis, dan bukan menerima hipotesis. 1. Hipotesis Hipotesis berasal dari kata
hupo
dan
thesis.
Hupo
artinya
SUTANTO PRIYO HASTONO: Analisis Data demikian hipotesis berarti pernyataan yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah hipotesis digunakan pengujian yang disebut pengujian hipotesis. Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol (Ho) dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang masing-masing hipotesis tersebut. a. Hipotesis Nol (Ho). Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara variabel satu dengan variabel lainnya Contoh: 1). Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok 2). Tidak ada hubungan antara merokok dengan berat badan bayi b. Hipotesis Alternatif (Ha) Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok. Atau hipotesis yang menyatakan ada hubungan antara variabel satu dengan variabel lainnya Contoh: 1). Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok 2). Ada hubungan antara merokok dengan berat badan bayi 2. Arah dan bentuk hipotesis Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah (one tail) atau dua arah (twa tail)
91
SUTANTO PRIYO HASTONO: Analisis Data a. One tail (satu sisi): bila hipotesis alternatifnya menyatakan adanya perbedaan dan ada pernyataan yang mengatakan hal satu lebih tinggi/rendah dari hal lain. Contoh: Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan bayi dari ibu tidak merokok. b. Two tail (dua sisi) merupakan hipotesis alternatif yang hanya menyatakan perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal lain. Contoh: Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi dari ibu tidak merokok. Atau dengan kata lain: ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dibandingkan dari ibu yang tidak merokok. Contoh penulisan hipotesis: Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan tekanan darah, maka hipotesisnya sbb: Ho : A = B Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Tidak ada hubungan antara jenis kelamin dengan tekanan darah. Ho : A B Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Ada hubungan antara jenis kelamin dengan tekanan darah 3. Menentukan Tingkat Kemaknaan (Level of Significance) Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang biasanya diberi notasi . Seperti sudah diketahui bahwa tujuan dari pengujian hipotesis adalah untuk membuat suatu pertimbangan tentang perbedaan antara nilai sampel dengan keadaan populasi sebagai suatu hipotesis. Langkah selanjutnya setelah ktriteria/batasan yang digunakan untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang disebut dengan tingkat kemaknaan (Level of 92
93
SUTANTO PRIYO HASTONO: Analisis Data Penentuan jenis uji juga ditentukan oleh jumlah data yang dianalisis, bila jumlah data kecil (<30) cenderung digunakan uji non parametrik. PROSEDUR/LANGKAH UJI HIPOTESIS Menetapkan Hipotesis Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan hipotesis alternatif (Ha). 1). Hipotesis nol (Ho) Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua kelompok. Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok 2). Hipotesis alternatif (Ha) Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok. Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok. Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah (one tail) atau dua arah (two tail). Penentuan Uji Statistik Yang Sesuai Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji statistik mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena itu harus digunakan uji statistik yang tepat sesuai dengan data yang diuji. Jenis uji statistik sangat tergantung dari: 1). Jenis variabel yang akan dianalisis 2). Jenis data apakah dependen atau independen
94
SUTANTO PRIYO HASTONO: Analisis Data 3). Jenis distribusi data populasinya apakah mengikuti distribusi normal atau tidak. Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean akan berbeda dengan uji statistik untuk mengetahui perbedaan proporsi/persentase. Uji beda mean menggunakan uji t atau inova, sedangkan uji untuk mengetahui perbedaan proporsi digunakan uji Kai kuadrat. Menentukan Batas atau Tingkat Kemaknaan (Level og Significance) Batas/tingkat kemaknaan, sering juga disebut dengan nilai . Penggunaan nilai alpha tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan masyarakat biasanya menggunakan nilai alpha 5%. Penghitungan Uji Statitik Penghitungan uji statistik adalah menghitung data sampel ke dalam uji hipotesis yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara dua kelompok, maka data hasil pengukuran dimasukkan ke rumus uji t. Dari hasil dengan nilai populasi untuk mengetahui apakah ada hipotesis ditolak atau gagal menolak hipotesis. Keputusan Uji Statistik Seperti telah disebutkan pada langkah D, bahwa hasil pengujian statistik akan menghasilkan dua kemungkinan keputusan yaitu menolak hipotesis nol (Ho) dan gagal menolak hipotesisi nol. Seiring dengan kemajuan perkembangan komputer maka uji statistik dengan mudah dan cepat dapat dilakukan dengan program-program statistik yang tersedia di pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita melakukan uji statistik melalui program komputer maka yang akan kita cari adalalah nilai p (p value). Dengan nilai p ini kita dapat menggunakan untuk keputusan uji statistik dengan cara membandingkan nilai p dengan (alpha). Ketentuan yang berlaku adalah: 95
SUTANTO PRIYO HASTONO: Analisis Data a). Bila nilai p , maka keputusannya adalah Ho ditolak b). Bila nilai p > , maka keputusannya adalah Ho gagal ditolak Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang dilakukan adalah two tail maka nilai p dari tabel harus dikalikan 2. dengan demikian dapat disederhanakan dengan rumus : nilai p two tail = 2 x nilai p one
tail.
Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para ahli statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam memutuskan uji statistik menggunakan pendekatan ini. Pengertian Nilai P Nilai p merupakan nilai yang menunjukkan besarnya peluang salah menolak Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai besarnya peluang hasil penelitian (misal adanya perbedaan mean atau proporsi) terjadi karena faktor kebetulan (by chance). Harapan kita nilai p adalah sekecil mungkin, sebab bila nilai p-nya kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian menunjukkan pula adanya perbedaan di populasi. Dengan kata lain kalau nilai p-nya kecil maka perbedaan yang ada pada penelitian terjadi bukan karena faktor kebetulan (by chance). Contoh: Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan berat badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa ratarata berat badan bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat badan bayi yang lahir dari ibu yang tidak hipertensi adalah 3000 gram. Perbedaan berat bayi antara ibu yang hipertensi dengan ibu yang tidak hipertensi sebesar 100 gram. Pertanyaan yang timbul adalah apakah perbedaan berat badan bayi tersebut juga berlaku untuk seluruh populasi yang diteliti atau hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut kemudian dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p = 0,0110 96
SUTANTO PRIYO HASTONO: Analisis Data maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat dari faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena peluangnya sangat kecil (p=0,0110), maka dapat diartikan bahwa adanya perbedaan tersebut bukan karena faktor kebetulan namun karena memang karena adanya riwayat hipetensi. Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat Variabel I Variabel II Jenis uji statistik yang
digunakan Katagorik Katagorik Katagorik Numerik Numerik Numerik Kai kuadrat Fisher Exact Uji T ANOVA Korelasi Regresi
97
7
Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan tekanan darah penduduk dewasa orang kota dengan orang desa. Atau, apakah ada perbedaan berat badan antar sebelum mengikuti program diet dengan sesudahnya. Uji statistik yang membandingkan mean dua kelompok data ini disebut uji beda dua mean. Pendekatan ujinya dapat menggunakan pendekatan distribusi Z dan distribusi t , sehingga pada uji beda dua mean bisa menggunakan uji Z atau uji t, namun lebih sering digunakan uji t. Sebelum kita melakukan uji statistik dua kelompok data, kita perlu mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok yang independen atau berasal dari dua kelompok yang dependen/pasangan. Dikatakan kelompok independen tekanan darah kelompok bila data kelompok
yang satu tidak tergantung dari kelopok kedua, misalnya membandingkan mean sistolik orang desa dengan orang kota. Tekanan darah orang kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua data dikatakan dependen/pasangan bila kelompok data yang dibandingkan datanya saling mempunyai ketergantungan, misalnya data berat badan sebelum dan sesudah mengikuti program diet berasal dari orang yang sama (data sesudah dependen/tergantung dengan data sebelum).
98
SUTANTO PRIYO HASTONO: Analisis Data Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi dalam dua kelompok, yaitu: uji beda mean independen (uji T independen) dan uji beda mean dependen (uji T dependen).
Sp2 =
df = n1 n2 - 2 Ket : n1 atau n2 = jumlah sampel kelompok 1 atau 2 S1 atau S2 = standar deviasi sampel kelompok 1 atau 2 b. Uji untuk varian berbeda X1 X2 T= (S12/n1) + (S22/n2) [(S12/n1) + (S22/n2)]2 df = [(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]
c. Uji homogenitas varian Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data satu apakah sama dengan kelompok data yang kedua. S12 F= S22
df1 = n1-1 dan df2 = n2-1 Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan varian yang lebih kecil sebagai penyebut. 2. Uji beda dua mean dependen (Paired sample) Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang dependen. Contoh kasus:
100
SUTANTO PRIYO HASTONO: Analisis Data Apakah ada perbedaan tingkat pengetahuan antara sebelum dan sesudah dilakukan pelatihan. Apakah ada perbedaan berat badan antara sebelum dan sesudah mengikuti program diet. Syarat : a. Distribusi data normal b. Kedua kelompok data dependen/pair c. Jenis variabel: numerik dan katagorik (dua kelompok) Formula : d T= S_d / n
d = rata-rata deviasi/selisih sampel 1 dengan sampel 2 S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2
101
Grouping Variable. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik. 4. Klik hb1 dan msukkan ke kotak Test variable 5. Klik variabel eksklu dan masukkan ke kotakGrouping Variable.
6. Klik Define Group, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel menyusui ke dalam kedua kotak. Pada contoh ini, kita
102
SUTANTO PRIYO HASTONO: Analisis Data tahu bahwa 0 kode untuk yang tidak eksklusif dan kode 1 untuk Yang eksklusif. Jadi ketiklah 0 pada Group 1 dan 1 pada Group 2
7. Klik Continue 8. Klik OK untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics status menyusui asi tdk EKSKLUSIVE EKSKLUSIVE N 24 26 Mean 10.421 10.277 Std. Deviation 1.4712 1.3228 Std. Error Mean .3003 .2594
t-test for Equality of Means Std. Error Differe nce .3951 95% Confidence Interval of the Difference Lower Upper -.9384 .6505
F kadar hb pengukur an pertama Equal variances assumed Equal variances not assumed .072
Sig. .790
t -.364
df 48
-.363
46.4
.719
-.1439
.3968
-.9425
.6547
Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan standar error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb ibu yang menyusui ekslusif adalah 10,277 gr% dengan standar deviasi 1,322
103
SUTANTO PRIYO HASTONO: Analisis Data gr%, sedangkan untuk ibu yang menyusui non eksklusif, rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua uji T, yaitu uji T dengan asumsi varian kedua kelompok sama (equal variances
assumed) dan uji T dengan asumsi varian kedua kelompok tidak sama (equal variances not assumed). Untuk, memilih uji mana yang kita pakai, dapat dilihat
uji kesamaan varian melalui uji Levene. Lihat nilai p Levene test, nilai p < alpha (0,05) maka varian berbeda dan bila nilai p > alpha (0,05) maka varian sama (equal). Pada uji Levene di atas menghasilkan nilai p = 0,790 sehingga dapat disimpulkan bahwa pada alpha 5%, didapat tidak ada perbedaan varian (varian kedua kelompok sama). Selanjutnya dicari p value uji t pada bagian varian sama (equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717 artinya tidak ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang menyusui non eksklusif. Penyajian dan Interpretasi di laporan penelitian: Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy dan disajikan di laporan penelitian. Pada laporan penelitian kita harus membuat tabel baru untuk menyajikan hasil print out analisis di atas. Adapun bentuk penyajian dan interpretasinya adlah sbb: Tabel Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th.. Menyusui Ya Eksklusif Tdk Eksklusif Mean 10,277 10,421 SD 1,322 1,471 SE 0,259 0,300 P value 0,717 N 26 24
Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan standar deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. 104
SUTANTO PRIYO HASTONO: Analisis Data Hasil uji statistik didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui secara eksklusif dengan non eksklusif. 2. Uji T Dependen Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji T dependen sering digunakan pada analisis data penelitian eksperimen. Seperti sudah dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau kedua kelompok sampel yang dibandingkan mempunyai subyek yang sama. Dengan kata lain disebut dependen bila responden diukur dua kali/diteliti dua kali, sering orang mengatakan penelitian pre dan post. Misalnya kita ingin membandingkan berat badan antara sebelum dan sesudah mengikuti program diet. Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui apakah ada perbedaan kadar Hb antara pengukuran pertama dengan pengukuran kedua. Disini terlihat sampelnya dependen karena orangnya sama diukur dua kali. Adapun langkahnya: 1. Pastikan anda berada di file ASI.SAV, jika belum aktifkan/bukalah file ini. 2. Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu Compare Means, lalu pilih Paired-Samples T Test
105
SUTANTO PRIYO HASTONO: Analisis Data 3. Klik hb1 4. Klik hb2 5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan 6. Klik OK hasilnya tampak sbb
T-Test
Paired Samples Statistics Mean Pair 1 kadar hb pengukuran pertama kadar hb pengukuran kedua 10.346 10.860 N 50 50 Std. Deviation 1.3835 1.0558 Std. Error Mean .1957 .1493
Paired Samples Correlations N Pair 1 kadar hb pengukuran pertama & kadar hb pengukuran kedua 50 Correlation .707 Sig. .000
Paired Differences 95% Confidence Interval of the Std. Std. Difference Deviati Error on Mean Lower Upper
df
Sig. (2-taile d)
-.5140
.9821
.1389
-.7931
-.2349
-3.701
49
.001
Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan standar deviasi kadar Hb antara pengukuran pertama dan pengukuran kedua. Rata-rata kadar Hb pada pengukuran pertama (hb1) adalah 10,346 gr% dengan standar deviasi 1,38 gr%. Pada pengukuran kedua (hb2) didapat rata-rata kadar Hb adalah 10,860 gr% dengan standar deviasi 1,05 gr%.
106
SUTANTO PRIYO HASTONO: Analisis Data Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982. perbedaan ini diuji dengan uji T berpasangan menghasilkan nilai p yang dapat dilihat pada kolom Sig (2-tailed). Pada contoh di atas didapatkan nilai p=0,001, maka dapat disimpulkan ada perbedaan yang signifikan kadar hb antara pengukuran pertama dengan pengukuran kedua. Penyajian dan Interpretasi di laporan penelitian: Dari hasil yang didapat di atas kemudian angka-angka disusun dalam tabel yang disajikan dalam laporan penelitian. Bentuk penyajian dan interpretasinya sbb: Tabel Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan Kedua di . Th Variabel Kadar Hb Pengukuran I Pengukuran II 10,346 10,860 1,38 1,05 0,19 0,14 0,001 50 Mean SD SE P value N
Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan standar deviasi 1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb adalah 10,860 gr% dengan standar deviasi 1,05 gr%. Terlihat nilai mean perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982. hasil uji statistik didapatkan nilai 0,001 maka dapat disimpulkan ada perbedaan yang signifikan antara kadar Hb pengukuran pertama dan kedua.
107
UJI ANOVA
Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data baik yang independen maupun dependen. Namun seringkali kita jumpai jumlah kelompok yang lebih dari dua, misalnya ingin mengetahui perbedaan mean berat badan bayi untuk daerah Bekasi, Bogor dan Tangerang. Dalam menganalisis data seperti ini (> 2 kelompok) sangat tidak dianjurkan menggunakan uji T. kelemahan menggunakan uji T adalah; pertama kita melakukan uji berulang kali sesuai kombinasi yang mungkin, kedua, bila melakukan uji T berulang kali akan meningkatkan (inflasi) nilai , artinya akan meningkatkan peluang hasil yang keliru. Perubahan inflasi sebesar = 1 (1-)n Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang tepat) dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji F. Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar kelompok (between). Bila variasi within dan between sama (nilai perbandingan kedua varian sama dengan 1) maka mean-mean yang dibandingkan tidak ada perbedaan, sebaliknya bila hasil perbandingan tersebut menghasilkan lebih dari 1, maka mean yang dibandingkan menunjuk ada perbedaan.
108
SUTANTO PRIYO HASTONO: Analisis Data Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor (one way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas analisis varian satu faktor (one way). Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah: 1. Varian homogen 2. Sampel/kelompok independen 3. Data berdistribusi normal 4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk katagori yang lebih dari 2 kelompok.
df =
k-1 n-k
Sw = N-k n1(X1-X)2 + n2(X2-X)2 + + nk(Xk-X)2 k-1 n1.X1 + n2.X2 + . + nk.Xk X= N Ket N = jumlah seluruh data (n1 + n2 + .. + nk) Analisis Multi Comparison (POSTHOC TEST) Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana saja yang berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan ada 109
Sb2 =
SUTANTO PRIYO HASTONO: Analisis Data perbedaan yang bermakna (Ho ditolak). Ada berbagaijenis analisis multiple comparasion diantaranya adalah Bonferroni, Honestly Significant different (HSD), Scheffe dan lain-lain. Pada modul ini yang akan dibahas adalah metode Bonferroni. Perhitungan Bonfrroni adalah sbb Xi - Xj tij = Sw2[(1/ni) + (1/nj)]
* =
110
111
6. Klik Continue 7. Klik tombol Post Hoc, tandai dengan pada kotak Bonferroni
Oneway
Descriptives berat badan bayi 95% Confidence Interval for Mean N 10 11 16 13 50 Mean 2470.00 2727.27 3431.25 3761.54 3170.00 Std. Deviation 249.666 241.209 270.108 386.304 584.232 Std. Error 78.951 72.727 67.527 107.141 82.623 Lower Bound 2291.40 2565.23 3287.32 3528.10 3003.96 Upper Bound 2648.60 2889.32 3575.18 3994.98 3336.04 Minim um 2100 2100 3000 3000 2100 Maxim um 2900 3000 4000 4100 4100
112
Test of Homogeneity of Variances berat badan bayi Levene Statistic 2.506 df1 3 df2 46 Sig. .071
ANOVA berat badan bayi Sum of Squares 12697038 4027962 16725000 df 3 46 49 Mean Square 4232345.862 87564.400 F 48.334 Sig. .000
SMP
SMU
PT
Std. Error 129.294 119.286 124.468 129.294 115.902 121.228 119.286 115.902 110.492 124.468 121.228 110.492
Sig. .315 .000 .000 .315 .000 .000 .000 .000 .027 .000 .000 .027
95% Confidence Interval Lower Bound Upper Bound -613.76 99.21 -1290.14 -632.36 -1634.72 -948.36 -99.21 613.76 -1023.54 -384.42 -1368.51 -700.02 632.36 1290.14 384.42 1023.54 -634.93 -25.64 948.36 1634.72 700.02 1368.51 25.64 634.93
Dari print out ini diperoleh rata-rata berat bayi dan stndar deviasi masing-masing kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat bayinya adalah 2727,2 gram dengan standar deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat 113
SUTANTO PRIYO HASTONO: Analisis Data bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan standar deviasi 386,3 gram. Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom F dan Sig, terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005), berarti pada alpha 5%, dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan. Pada Box paling bawah terlihat hasil dari uji Multiple Comparisons Bonferroni yang berguna untuk menelusuri lebih lanjut kelompok mana saja yang berhubungan signifikan. Untuk mengetahui kelompok yang signifikan dapat terlihat dari kolom Sig. Ternyata kelompok signifikan adalah tingkat pendidikan SD dengan SMU, SD dengan PT, SMP dengan SMU, SMP dengan PT dan SMU dengan PT.
Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat bayinya adalah 2727,20 gram dengan standar deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka yang 114
SUTANTO PRIYO HASTONO: Analisis Data berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan standar deviasi 386,3 gram. Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan. Analisis lebih lanjut membuktikan bahwa kelompok yang berbeda signifikan adalah tingkat pendidikan SD dengan SMU, SMU,SMP dengan PT dan SMU dengan PT. SD dengan PT, SMP dengan
115
SUTANTO PRIYO HASTONO: Analisis Data menjadi variabel katagorik bila variabel tersebut sudah mengalami
pengelompokan. Misalkan kita ambil satu contoh variabel berat badan, berat badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih termasuk variabel numerik, namun bila sudah dilakukan pengelompokan menjadi (<50 kg (kurus), 50-60 kg (sedang) dan > 60 (gemuk) maka variabel tersebut sudah berjenis katagorik. 1. Tujuan Uji kai Kuadrat Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji perbedaan proporsi/persentase antara beberapa kelompok data. Dilihat dari segi datanya uji kai kuadrat dapat digunakan untuk mengetahui hubungan antara variabel katagorik dengan variabel katagorik. Contoh pertanyaan penelitian untuk kasus yang dapat dipecahkan oleh uji kai kuadrat misalnya: a. Apakah ada perbedaan kejadian hipertensi antara wanita dan pria. Kasus ii berarti akan menguji hubungan variabel hipertensi (katagori dengan klasifikasi ya dan tidak) dengan variabel jenis kelamin (katagori dengan klasisfikasi wanita dan pria) b. Apakah ada perbedaan kejadian anemia antara ibu yang kondisi soseknya tinggi, sedang dan rendah. Pada kasus ini akan menguji hubungan variabel anemia katagori dengan klasifikasi ya dan tidak) dengan variabel Sosek (katagori dengan klasifikasi rendah, sedang dan tinggi). 2. Prinsip dasar Uji Kai Kuadrat Proses pengujian kai kuadrat adalah membandingkan frekuensi yang terjadi (observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi observasi dengan nilai frekuensi harapan sama, maka dikatakan tidak ada perbedaan yang bermakna (signifikan). Sebaliknya, bila niali frekuensi observasi dan nilai frekuensi harapan berbeda, maka dikatakan ada perbedaan yang bermakna (signifikan). Pembuktian dengan uji kai kuadrat dengan menggunakan formula: (O E)2 X =
2
117
df = (k-1)(n-1) ket : O = nilai observasi E = nilai ekspektasi (harapan) k = jumlah kolom b = jumlah baris Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan dalam bentuk tabel silang:
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan) masing-masing sel dicari dengan rumus: Total barisnya X total kolomnya E= Jumlah keseluruhan data misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah: Ea = (a+b) x (a+c) n Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama. Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan menggunakan rumus: N (ad-bc)2 X2 = (a+c)(b+d)(a+b)(c+d) 118
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang besar. Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya digunakan uji kai kuadrat yang sudah dikoreksi (Yate Corrected atau Yates
3. Keterbatasan Kai Kuadrat Seperti kita ketahui, uji kai kuadrat menuntut frekuensi harapan/ekspektasi (E) dalam masing-masing sel tidak boleh terlampau kecil. Jika frekuensi sangat kecil, penggunaan uji ini mungkin kurang tepat. Oleh karena itu dalam penggunaan kai kuadrat harus memperhatikan keterbatasanketerbatasan uji ini. Adapun keterbatasan uji kai kuadrat adalah sbb: a. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 1. b. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 5, lebih dari 20% dari jumlah sel. Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti harus menggabungkan katagori-katagori yang berdekatan dalam rangka memperbesar frekuensi harapan dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk analisis tabel silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb). Penggabungan ini tentunya diharapkan tidak sampai membuat datanya kehilangan makna.
119
SUTANTO PRIYO HASTONO: Analisis Data Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak bisa menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji Fishers Exact.
Pengkodean Variabel :
Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hatihati jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada konsistensi antara variabel independen dengan variabel dependen. Untuk variabel independen, kelompok yang berisiko/expose diberi kode tinggi (kode 1) dan kode rendah (kode 0)untuk kelompok yang tidak berisiko/non expose. Pada variabel dependennya, kode tinggi (kode 1) untuk kelompok kasus atau kelompok yang menjadi fokus pembahasan penelitian dan kode rendah (kode 0) untuk kelompok non kasus atau yang bukan menjadi fokus penelitian. Sebagai contoh data di atas pengkodeannya adalah sbb: Ibu tidak bekerja diberi kode 1 120
SUTANTO PRIYO HASTONO: Analisis Data dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi kode 1 dan non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0, tdk eksklusive =1. Tabel Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan Pendidikan N SD SMP SMU PT Jumlah 25 16 10 5 56 Rendah % 50,0 40,0 33,3 20,0 38,7 n 25 24 20 20 89 Tinggi % 50,0 60,0 66,7 80,0 61,3 n 50 40 30 25 145
Pembuatan persentase pada analisis tabel silang harus diperhatikan agar tidak salah dalam menginterpretasi. Pada jenis penelitian survei/Cross sectional atau Kohort, pembuatan persentasenya berdasarkan nilai variabel independen. Contoh di atas jenis penelitiannya Cross Sectional, variabel pendidikan sebagai variabel independen dan pengetahuan sebagai variabel dependen. Dapat dilihat di tabel persentasenya berdasarkan masing-masing kelompok tingkat pendidikan (persentase baris). Contoh di atas dapat di interpretasikan sbb: Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%) pasien mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan SMP, ada sebanyak 24 (60,0%) yang berpengetahuan tinggi. Dari 30 pasien yang berpendidikan SMU ada sebanyak 20 (66,7%) yang berpengetahuan tinggi. Dan dari 25 pasien yang berpendidikan PT, ada sebanyak 20 (80,0%) yang 121
SUTANTO PRIYO HASTONO: Analisis Data berpengetahuan tinggi. Dari data ini terlihat ada kecenderungan bahwa semakin tinggi tingkat pendidikan akan semakin tinggi tingkat pengetahuannya. Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan persentasenya berdasarkan variabel dependennya, misalkan terlihat pada tabel berikut: Tabel Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin Jenis Kelamin Laki-laki Perempuan Jumlah n 75 25 100 Kanker Paru Kasus % 75,0 25,0 50,0 N 30 70 100 Kontrol % 30,0 70,0 50,0 n 105 95 200 Total % 52,5 47,5 100,0
Interpretasinya: Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden berjenis kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita kanker paru, ada sebanyak (30%) responden yang berjenis kelamin laki-laki.
122
123
SUTANTO PRIYO HASTONO: Analisis Data 5. Klik option Statistics.., klik pilihan Chi Square dan klik pilihan Risk
6. Klik Continue 7. Klik option Cells, bawa bagian Percentages dan klik Row
124
Crosstabs
status pekerjaan ibu * status menyusui asi Crosstabulation status menyusui asi tdk EKSKLUSIVE EKSKLUSIVE 17 8 68.0% 7 28.0% 24 48.0% 32.0% 18 72.0% 26 52.0%
KERJA
tidak kerja
Total
Count % within status pekerjaan ibu Count % within status pekerjaan ibu Count % within status pekerjaan ibu
Chi-Square Tests Value 8.013b 6.490 8.244 df 1 1 1 Asymp. Sig. (2-sided) .005 .011 .004 Exact Sig. (2-sided) Exact Sig. (1-sided)
Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
.005
a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 12. 00. Risk Estimate 95% Confidence Interval Lower Upper 1.627 18.357
Value Odds Ratio for status pekerjaan ibu (TIDAK KERJA / KERJA) For cohort status menyusui asi = YA EKSKLUSIVE For cohort status menyusui asi = TIDAK EKSKLUS N of Valid Cases 5.464
2.250
1.209
4.189
.412 50
.208
.816
125
SUTANTO PRIYO HASTONO: Analisis Data Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola menyusui, dengan angka di masing-masing selnya. Angka yang paling atas adalah jumlah kasus masing-masing sel, angka kedua adalah persentase menurut baris (data yang kita analisis ASI.SAV, berasal dari penelitian Cross
Sectional sehingga persen yang ditampilkan adalah persentase baris, namun bila
junis penelitiannya Case Control angka persentase yang digunakan adalah persentase kolom) Dari analisis data di atas maka interpretasinya: Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui secara eksklusif. Hasil uji Chi Square dapat dilihat pada kotak Chi Square Test. Dari print out muncul dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan, Angka yang mana yang kita pakai?, apakah Pearson, Continuity Correction,
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan koreksi (Continuity Correction) dengan p value dapat dilihat pada kolom Asymp. Sig dan terlihat p valuenya = 0,011. berarti kesimpulannya ada perbedaan perilaku menyusui eksklusif antara ibu yang bekerja dengan ibu yang tidak bekerja. Dengan kata lain dapat disimpulkan bahwa ada hubungan status pekerjaan dengan perilaku menyusui eksklusif. Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya hubungan dua variabel, sehingga uji ini tidak dapat untuk mengetahui derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan hubungan banyak metodenya tergantung latar belakangdisiplin keilmuannya, misal untuk ilmu sosial dengan melihat koefisien Phi, koefisien Contingency dan cramers V. sedangkan untuk bidang kesehatan terutama kesehatan masyarakat digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis penelitian Cross Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis penelitiannya Kohort. Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464 (95% CI: 1,627 18,357). Sedangkan nilai RR terlihat dari baris For Cohort yaitu bearnya 2,250 (95% CI: 1,209 4,189). Pada data ini berasal dari penelitian Cross Sectional maka kita dapat menginterpretasikan nialai OR=5,464 sbb: Ibu yang tidak bekerja mempunyai peluang 5,46 kali untuk menyusui eksklusif dibandingkan ibu yang bekerja.. Pada perintah Crosstab nilai OR akan keluar bila tabel silang 2 x 2, bila tabel silang lebih dari 2 x 2, misalnya 3 x 2, 4 x 2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi logistik sederhana dengan cara membuat Dummy variable
127
value
Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui eksklusif diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui bayi secara eksklusif. Sedangkan diantara ibu yang tidak bekerja, ada 18 (72,0%) yang menyusui secara eksklusif. Hasil uji statistik diperoleh nilai p=0,011 maka dapat disimpulkan ada perbedaan proporsi kejadian menyusui eksklusif antara ibu tidak bekerja dengan ibu yang bekerja (ada hubungan yang signifikan antara pekerjaan dengan perilaku menyusui). Dari hasil analisis diperoleh pula nilai OR=5,464, artinya ibu tidak bekerja mempunyai peluang 5,46 kali untuk menyusui eksklusif dibanding ibu yang bekerja.
128
10
129
SUTANTO PRIYO HASTONO: Analisis Data variabel diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel tersebut.
Derajat keeratan hubungan (kuat lemahnya hubungan) dapat dilihat dari tebaran datanya, semakin rapat tebarannya semakin kuat hubungannya dan sebaliknya semakin melebar tebarannya menunjukkan hubungannya semakin lemah. Untuk mengetahui lebih tepat besar/ derajat hubungan dua variabel Linier Positif Linier Negatif Tak ada hubungan digunakan Koefisien Korelasi Pearson Product Moment. Koefisien korelasi disimbbolkan dengan r (huruf r kecil). Koefisien korelasi (r) dapat diperoleh dari formula berikut: N ( XY) (X Y) r= [NX2 (X)2] [NY (Y)2
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya antara 1 s.d. +1. r=0 r = -1 r = +1 tidak ada hubungan linier hubungan linier negatif sempurna hubungan linier positif sempurna Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya semakin bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya. Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel diikuti penurunan variabel yang lain, misalnya semakin bertambah umur (semakin tua) semakin rendah kadar Hb-nya.
130
SUTANTO PRIYO HASTONO: Analisis Data Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat dibagi dalam 4 area, yaitu: r = 0,00 0,25 r = 0,00 0,25 r = 0,00 0,25 r = 0,00 0,25 Uji Hipotesis Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk menjelaskan derajat hubungan derajat hubungan linier anatara dua variabel. Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah hubungan antara dua variabelteradi secara signifikan atau hanya karena faktor kebetulan dari random sample (by chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama: membandingkan nilai r hitung dengan r tabel, kedua: menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita gunakan pendekatan distribusi t, dengan formula: n2 t=r 1 r2 df = n 2 n = jumlah sampel 2. Regresi Linier Sederhana Seperti sudah diuraikan di depan bahwa analisis hubungzn dua variabel dapat digunakan untuk mengetahui bentuk hubungan dua variabel, yaitu dengan analisis regresi. Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk mengetahui bentuk hubungan antar dua atau lebih variabel. Tujuan tidak ada hubungan/hubungan lemah hubungan sedang hubungan kuat hubungan sangat kuat / sempurna
131
SUTANTO PRIYO HASTONO: Analisis Data analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu variabel (variabel dependen) melalui variabel yang lain (variabel independen). Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat badan dan tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel independen dan tekanan darah sebagai variabel dependen, sehingga dengan regresi kita dapat memperkirakan besarnya nilai tekanan darah bila diketahui data berat badan. Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh peneliti adalah dengan menggunakan metode kuadrat terkecil (least
square). Metode least square merupakan suatu metode pembuatan garis regresi
dengan cara meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan Y yang diramalkan oleh garis regresi itu. Secara matematis persamaan garis sbb: Y = a + bx Persamaan di atas merupakan model deterministik yang secara sempurna/tepat dapat digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi, yang ditemukan oleh Issac Newton adalah contoh model deterministik. Variabel kecepatan benda jatuh (variabel dependen) pada keadaan yang ideal adalah fungsi matematik sempurna (bebas dari kesalahan) dari variabel independen berat beda dan gaya gravitasi. Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius dapat dibuat persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat dihitung/diprediksi secara sempurna/tepat (bebas kesalahan) bila suhu Celcius (X) diketahui. Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada kemungkinan kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya hubungan berat badan dengan tekanan darah, tidak setiap orang yang berat badannya sama memiliki tekanan darah yang sama. Oleh karena hubungan X 132 Y = a + bx + e
SUTANTO PRIYO HASTONO: Analisis Data dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan garis yang dibentuk menjadi: Y = Variabel Dependen X = Variabel Independen a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0 b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X berubah satu unit pengukuran e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati dengan nilai Y yang sesungguhnya pada titik X tertentu XY (XY)/n b= X2 (X)2/n a = Y - bX
Kesalahan Standar Estimasi (Standard Error of Estimate/Se) Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan estimasi untuk menjelaskan nilai variabel dependen yang sesungguhnya. Semakin kecil nilai Se, makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan niali variabel dependen yang sesungguhnya. Dansebaliknya, semakin besar nilai Se, makin rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel dependen yang sesungguhnya. Untuk mengetahhui besarnya Se dapat dihitung melalui formula sbb: 133
Se =
Y2 - aY - bXY n-2
Koefisien Determinasi (R2) Ukuran yang penting dan sering digunakan dalam analisisregresi adalah koefisien determinasi atau disimbolkan R2 (R Square). Koefisien determinasi dapat dihitung dengan mengkuadratkan nilai r, atau dengan formula R2=r2. Koeifisien determinasi berguna untuk mengetahui seberapa besar variasi variabel dependen (Y) dapat dijelaskan oleh variabel independen (X). atau dengan kata lain R2 menunjukkan seberapa jauh variabel independen dapat memprediksi variabel dependen.Semakin besar nilai R square semakin baik/semakin tepat variabel independen memprediksi variabel dependen. Besarnya nialai R square antara 0 s.d. 1 atau antara 0% s.d. 100%.
134
135
Correlations
Correlations berat badan ibu 1 berat badan bayi .684** .000 50 50 .684** 1 .000 50 50
Tampilan analisis korelasi berupa matrik antar variabel yang di korelasi, informasi yang muncul terdapat tiga baris, baris pertama berisi nilai korelasi (r), baris kedua menapilkan nilai p (P value), dan baris ketiga menampilkan N (jumlah data). Pada hasil di atas diperoleh nilai r = 0,684 dan nilai p = 0,0005. Kesimpulan dari hasil tersebut: hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan yang kuat dan berpola positif artinya semakin bertambah berat badannya semakin tinggi berat bayinya. Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan ibu dengan berat badan bayi (p = 0,0005). B. Regresi Linier Sederhana Berikut akan dilakukan analisis regresi linier dengan menggunakan variabel berat badan ibu dan berat badan bayi dari data ASI.SAV. dalam analisis regresi kita harus menentukan variabel dependen dan variabel independennya. Dalam kasus ini berarti berat badan ibu sebagai variabel independen dan berat badan bayi sebagai variabel dependen. Adapun caranya: 1. Pastikan tampilan berada pada data editor ASI.SAV, jika belum aktifkan data tersebut. 2. Dari menu SPSS, Klik Analysis, pilih Regression, pilih Linear 3. Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam 136
SUTANTO PRIYO HASTONO: Analisis Data contoh ini berarti berat badan bayi) dan pada kotak Independent isikan variabel independennnya (dalam contoh ini berarti berat badan ibu), caranya 4. klik berat badan bayi, masukkan ke kotak Dependent 5. Klik berat badan ibu, masukkan ke kotak Independent
6.
Regression
Model Summary Model 1 R R Square .684a .468 Adjusted R Square .456 Std. Error of the Estimate 430.715
137
ANOVAb Model 1 Sum of Squares 7820262 8904738 16725000 df 1 48 49 Mean Square 7820261.965 185515.376 F 42.154 Sig. .000a
a. Predictors: (Constant), berat badan ibu b. Dependent Variable: berat badan bayi Coefficientsa Unstandardized Coefficients B Std. Error 657.929 391.676 44.383 6.836 Standardized Coefficients Beta .684
Model 1
t 1.680 6.493
Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang penting dalam regresi linier diantaranya: koefisien determinasi, persamaan garis dan p value. Nilai koefisien determinasi dapat dilihat dari nilai R Square (anda dapat lihat pada tabel Model Summary) yaitu besarnya 0,468 artinya, persamaan garis regresi yang kita peroleh dapat menerangkan 46,8% variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Selanjutnya pada tabel ANOVAb , diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada alpha 5% kita dapat menyimpulkan bahwa regresi sederhana cocok (fit) dengan data yang ada persamaan garis regresi dapat dilihat pada tabel Coefficienta yaitu pada kolom B. Dari hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept atau nilai a) sebesar 657,93 dan nilai b = 44,38, sehingga persamaan regresinya:
Y = a + bX
Berat badan bayi = 657,93 + 44,38(berat badan ibu) Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu nilai berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada kolom Sig T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak 138
SUTANTO PRIYO HASTONO: Analisis Data hipotesis nol, berarti ada hubngan linier antara berat badan ibu dengan berat badan bayi. Dari nilai b=44,38 berarti bahwa variabel berat badan bayi akan bertambah sebesar 44,38 gr bila berat badan ibu bertambah setiap satu kilogram.
Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan kuat (r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu semakin besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468 artinya , persamaan garis regresi yang kita peroleh dapat menerangkan 46,8,6% variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan ibu dengan berat badan bayi (p=0,005).
SUTANTO PRIYO HASTONO: Analisis Data Berat badan bayi = 3320,73 Ingat prediksi regresi tidak dapat menghasil;kan angka yang tepat seperti di atas, namun perkiraannya tergantung dari nilai Std, Error of The estimate(SEE) yang besarnya adalah 430,715 (lihat di kotak Model Summary). Dengan demikianvariasi variabel dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan tingkat kepercyaan 95% dan didapat nilai Z = 1,96, sehingga variasinya 1,96 * 430,715 = 844,201 Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg diprediksikan berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr C. Membuat Grafik Prediksi Langkahnya: 1. Klik Graphs, pilih Scatter 2. Klik Sampel klik Define 3. Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel dependennya (masukkan Hb1) 4. Pada kotak X Axis isikan variabel independennya (masukkan veriabel dependennya (masukkan Umur) 5. Klik OK 6. Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?) 7. Untuk mengeluarkan garisnya, klik grafiknya 2 kali 8. klikChart 9. pada kotak Fit Line, Klik Total 10. klik OK maka muncul garis regresi
140
11
ANALISIS MULTIVARIAT
Proses analisis multivariat dengan menghubungkan beberapa variabel independen dengan satu variabel dependen pada waktu yang bersamaan. Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden. Dari analisis multivariat kita dapat mengetahui: a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel dependen? b. Apakah variabel independen berhubungan dengan variabel dependen dipengaruhi variabel lain atau tidak? c. Bentuk hubungan beberapa variabel independen dengan variabel dependen, apakah berhubungan langsung atau pengeruh tidak langsung. Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis statistik yang dapat digunakan untuk analisis multivariat: Variabel Independen Numerik (minimal 1 variabel numerik) Katagori Katagori (dapat dengan numerik) Kontinyu Numerik/Katgori Katagori Numerik waktu Uji Diskriminan Uji Regresi Cox Numerik Katagori ANOVA Uji Regresi Logistik Variabel Dependen Numerik Jenis Uji Uji Regresi Linier
141
SUTANTO PRIYO HASTONO: Analisis Data Dalam melakukan analisis multivariat kita harus mengetahui terlebih dahulu mengenai konsep konfounding dan Interaksi.
a.Konfounding
Konfounding merupakan kondisi bias dalam mengestimasi efek pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari perbandingan yang tidak seimbang antara kelompok expose dengan kelompok non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose. Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun expose dihilangkan pada kedua kelompok tersebut. Satu variabel disebut konfounding bila variabel tersebut merupakan faktor risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan berhubungan dengan variabel independen tapi tidak merupakan hasil dari variabel independen.
b.Interaksi
Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose Pada tingkat expose yang lain. Jadi efek satu expose pada kejadian penyakit berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam analisis karena pada saat analisis kita harus menentukan apakah akan melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah untuk masing-masing strata. Pada analisis multivariat, jika ditemukan adanya interaksi antar variabel expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing strata harus dihitung 142
12
linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel independen (variabel bebas) dihubungkan dengan satu variabel dependen (terikat).. Sedangkan pada Multiple regression Linear merupakan analisis hubugan antara beberapa variabel independen dengan satu variabel dependen. Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat badan, dan jenis kelamin. Dalam regresi linier ganda variabel dependennya harus numerik sedangkan variabel independen boleh semuanya numerik dan boleh juga campuran numerik dan katagorik. Model persamaan regresi linier ganda merupakan perluasan regresi linier sederhana, yaitu: Y = a + b1X1 + b2X2 + . + bkXk + e 1. Asumsi Regresi Linier Seperti pada umumnya pengujian statistik, dari analisis regresi linier ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi) tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil. Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin pada semua orang (populasi), tidak hanya seperti yang teramati di sejumlah orang pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression 143
SUTANTO PRIYO HASTONO: Analisis Data e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas. 2. Kegunaan Analisis Regresi Ganda Tujuan analisis regresi linier ganda adalah untuk menemukan model regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna untuk dua hal: a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi yang ada pada sebuah atau beberapa variabel independen. Disini dapat diketahui secara probabilitas nilai variabel dependen bila seseorang/individu mempunyai suatu set variabel dengan independen tertentu. Misalnya kita melakukan analisis variabel independen umur, BB dan jenis kelamin dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi, seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat badan dan jenis kelamin tertentu. b. Estimasi, menguantifikasihubungan sebuah atau beberapa variabel independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa besar hubungan masing-masing independen terhadap variabel independen lainnya. Dari analisis ini dapat diketahui variabel mana yang paling besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.
145
SUTANTO PRIYO HASTONO: Analisis Data 3. Pemodelan Satu hal yang penting dalam regresi ganda adalah bagaimana memilih variabel independen sehingga terbentuk sebuah model yang paling sesuai menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam (populasi). Dalam pembuatan model seringkali dijumpai pandangan yang kurang tepat yaitu memasukkan semua/sebanyak mungkin variabel independen ke dalam model. Alasannya, dengan memasukkan sebanyak mungkin variabel independen ke dalam model, maka variabel dependen diharapkan diprediksi dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping itu, model dengan banyak variabel seringkali malah menyulitkan dalam interpretasi. Berdasarkanpertimbangan tersebut pemilihan variabel independen hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen. Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk dalam model, salah satu kriteria yang sering digunakan adalah melihat perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena setiap penambahan satu variabel independen akan meningkatkan R2 walaupun variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan adalah model dengan nilai R2 yang besar namun variabel independennya dengan jumlah sedikit. Berikut langkah-langkah dalam pemodelan regresi linier ganda: 1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat model. Masing-masing variabel independen dihubungkan dengan variabel 146
SUTANTO PRIYO HASTONO: Analisis Data dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka variabel tersebut masuk dalam model multivariat. Untuk variabel yang p value-nya > 0,25 namun secara substansi penting, maka variabel tersebut dapat masuk ke multivariat. 2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk dalam model. Ada beberapa metode untuk melakukan pemilihan variabel independen dalam analisis multivariat regresi linier ganda, yaitu: a). ENTER, memasukkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode melakukan pertimbangan aspek substansi. b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke dalam model, sampai semua variabel yang memenuhi kriteria tersebut masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel yang mempunyai korelasi parsial terbesar dengan variabel dependen dan yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi parsial adalah adalah korelasi antara variabel independen dengan dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005 artinya variabel yang dapat masuk model bila variabel tersebut mempunyai nilai P lebih kecil atau sama dengan 0,05. c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi kemudian satu persatu variabel independen dikeluarkan dari model berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah 0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama dengan 0,10 dikeluarkan dari model. d). STEPWISE, model ini merupakan kombinasi antara metode backward dan Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa 147 ini yang tepat/sering digunakan, karena dalam pemodelan kita dapat
SUTANTO PRIYO HASTONO: Analisis Data variabel sama sekali di dalam model. Lalu satu variabel hasil dan
pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu variabel hasil pengkorelasian dimasukkan ke dalam model dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama masuk sama dengan metode forward yakni variabel yang mempunyai korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward. e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemaknaan statistik tertentu.
148
SUTANTO PRIYO HASTONO: Analisis Data kemudian bandingkan antara model 1 dan model 2, bila hasilnya sama/hampir sama maka model regresi reliabel. Bila model reliabel maka seluruh sampel dapat digunakan untuk pembuatan model.
149
150
151
Correlations
Correlations Weight of mother (pounds) .180* .013 189 1 189 .141 .054 189 -.140 .055 189 .186* .010 189 No History of physician prematur visits in first e labor trimester .215** .072 .003 .328 189 189 .141 -.140 .054 .055 189 189 1 -.044 .544 189 -.044 .544 189 .058 .426 189 189 1 189 -.155* .034 189 Birth weight (gram) .090 .219 189 .186* .010 189 .058 .426 189 -.155* .034 189 1 189
Age of mother
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
Age of mother 1 189 .180* .013 189 .215** .003 189 .072 .328 189 .090 .219 189
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
152
SUTANTO PRIYO HASTONO: Analisis Data Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur, berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat. Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena secara substansi frekuensi anc merupakan faktor yang sangat penting mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan dalam analisis multivariat.
1. Merokok
Langkahnya: 1.Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu Compare Means, lalu pilih Independen-Samples T Test 2.Pada layar tampak kotak yang di dalamnya ada kotak Test variable
dan
Grouping Variable. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik. 3.Klik bwt dan msukkan ke kotak Test variable 4.Klik variabel smoke dan masukkan ke kotakGrouping Variable.
153
5.Klik Define Group, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel smoke ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa 0 tidak merokok dan kode 1 untuk Yang merokok. Jadi ketiklah 0 pada
9. Klik Continue 10. Klik OK untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics Smoking status No Yes N 115 74 Mean 3054.96 2773.24 Std. Deviation 752.409 660.075 Std. Error Mean 70.163 76.732
154
t-test for Equality of Means Sig. (2-tail ed) .009 Mean Differen ce 281.713 Std. Error Differenc e 106.969 95% Confidence Interval of the Difference Lower Upper 70.693 492.7
F Birth weight (gram) Equal variances assumed Equal variances not assumed 1.508
Sig. .221
t 2.634
df 187
2.709
170.0
.007
281.713
103.974
76.467
487.0
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value = 0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok dapat lanjut ke multivariat.
2. Riwayat Hipertensi
Langkahnya: 1.Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu Compare Means, lalu pilih Independen-Samples T Test 2.Pada layar tampak kotak yang di dalamnya ada kotak Test variable
dan
Grouping Variable. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik. 3.Klik bwt dan msukkan ke kotak Test variable 4.Klik variabel ht dan masukkan ke kotakGrouping Variable. (variabel yang sebelumnya (variabel smoke) dikeluarkan dahulu baru ht dimasukkan
155
5.Klik Define Group, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel smoke ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa 0 tidak ada hipertensi dan kode 1 ada hipertensi. Jadi ketiklah 0 pada
6.Klik Continue 7.Klik OK untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
Group Statistics History of hypertension No Yes N 177 12 Mean 2972.31 2536.75 Std. Deviation 709.226 917.341 Std. Error Mean 53.309 264.813
156
t-test for Equality of Means Std. Error Differen ce 215.709 95% Confidence Interval of the Difference Lower Upper 10.024 861.1
F Birth weight (gram) Equal variances assumed Equal variances not assumed 1.419
Sig. .235
t 2.019
df 187
1.612
11.908
.133
435.56
270.126
-153.5
1025
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6 variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis multivariat.
5. Pada kotak Method, pilih Enter 6. Abaikan lainnya 7. Klik OK, dan hasilnya
Regression
Model Summary Model 1 R R Square .340a .116 Adjusted R Square .086 Std. Error of the Estimate 696.829
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds)
158
ANOVAb Model 1 Sum of Squares 11543236 88373817 99917053 df 6 182 188 Mean Square 1923872.611 485570.423 F 3.962 Sig. .001a
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa Unstandardized Coefficients B Std. Error 2315.862 299.442 7.162 10.022 4.793 -232.253 -154.002 -574.230 -2.847 1.777 105.928 106.574 215.481 49.705 Standardized Coefficients Beta .052 .201 -.156 -.104 -.193 -.004
Model 1
(Constant) Age of mother Weight of mother (pounds) Smoking status History of premature labor History of hypertension No physician visits in first trimester
Dari kotak Model Sumarry didapatkan nilai R Square sebesar 0,116, artinya keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar 11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik (lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model. Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3 variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur (history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba keluarkan adalah frekuensi anc(No physician..). 159
Langkahnya: 1. Klik Analysis, sorot Regression, sorot dan klik Linier 2. Di layar nampak pada kotak Dependen masih terisi bwt lewati dan biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel, namun sekarang anda harus keluarkan variabel no physician dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb:
Model Summary Model 1 R R Square .340a .116 Adjusted R Square .091 Std. Error of the Estimate 694.929
a. Predictors: (Constant), History of hypertension, Smoking status, Age of mother, History of premature labor, Weight of mother (pounds)
Coefficientsa Unstandardized Coefficients B Std. Error 2317.608 297.074 7.051 9.807 4.781 -232.224 -153.747 -573.011 1.759 105.638 106.191 213.841 Standardized Coefficients Beta .051 .201 -.156 -.104 -.192
Model 1
(Constant) Age of mother Weight of mother (pounds) Smoking status History of premature labor History of hypertension
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
160
SUTANTO PRIYO HASTONO: Analisis Data berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel, ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel frekuensi anc kita keluarkan dari model. Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473). Langkah/proses : 1. Klik Analysis, sorot Regression, sorot dan klik Linier 2. Di layar nampak pada kotak Dependen masih terisi bwt lewati dan biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel, namun sekarang anda harus keluarkan variabel umur (age) dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb:
Model Summary Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016
a. Predictors: (Constant), History of hypertension, Smoking status, History of premature labor, Weight of mother (pounds)
161
Coefficientsa Unstandardized Coefficients B Std. Error 2449.121 233.779 5.035 -236.420 -145.412 -582.566 1.721 105.338 105.417 213.148 Standardized Coefficients Beta .211 -.159 -.098 -.195
Model 1
(Constant) Weight of mother (pounds) Smoking status History of premature labor History of hypertension
Setelah variabel umur perhitungannya sbb: Variabel Age bwt smoke ptl hi ftv
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %, dengan demikian variabel umur kita keluarkan dari model. Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur, Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst. Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:
162
Model Summary Model 1 R R Square .322a .104 Adjusted R Square .089 Std. Error of the Estimate 695.707
a. Predictors: (Constant), History of hypertension, Smoking status, Weight of mother (pounds) Coefficientsa Unstandardized Coefficients B Std. Error 2390.105 230.391 5.352 -263.009 -586.722 1.710 103.812 213.646 Standardized Coefficients Beta .224 -.177 -.197
Model 1
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan perubahan Coef. B dapat dilihat sbb: Variabel Age bwt smoke ptl hi ftv Masih lengkap 7,1 4,7 -232,2 -154,0 -574,2 -2,847 Prematur keluar 5,3 -236,4 582,5 perubahan Coef. 12,3 % 1,7 % 1,3 %
Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p valuenya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model telah selesai dan model yang terakhir adalah sbb: 163
Model Summaryb Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016 DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa Stand ardize d Coeffi cients Beta .211 -.159 -.195 -.098 t 10.476 2.925 -2.244 -2.733 -1.379 Sig. .000 .004 .026 .007 .169
Mo de l 1
Unstandardized Coefficients B 2449.121 5.035 -236.420 -582.566 -145.412 Std. Error 233.779 1.721 105.338 213.148 105.417
Collinearity Statistics Tolera nce VIF .925 .964 .943 .947 1.081 1.037 1.060 1.056
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
164
4.Klik tombol Statistics 5. Klik kotak Collinearity diagnostic dan klik kotak Covariance matrix (perintah ini untuk uji asumsi multicoliniarity) 6. Klik kotak Durbin-Watson (perintah ini untuk uji asumsi Independensi)
SUTANTO PRIYO HASTONO: Analisis Data 8. Klik tombol Plot 9. Masukkan SRESID ke kotak Y, dan masukan ZPRED ke kotak X (perintah ini untuk uji asumsi Homoscedasity) 10. Klik kotak histogram dan kotak Normal probability plot (perintah ini untuk uji asumsi Normality)
11. Klik Continue Hasilnya : a. Asumsi Eksistensi (Variabel Random) Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen) adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini, sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil analisis:
166
Residuals Statisticsa Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value Minimum 2249.77 -2.835 67.193 1955.43 -2082.610 -3.001 -3.015 -2102.316 -3.084 .768 .000 .004 Maximum 3602.03 2.682 292.804 3616.97 1921.631 2.769 2.782 1940.423 2.835 32.469 .209 .173 Mean 2944.66 .000 103.399 2943.73 .000 .000 .001 .923 .000 3.979 .007 .021 Std. Deviation 245.079 1.000 45.407 251.196 686.593 .989 1.005 708.619 1.010 5.320 .019 .028 N 189 189 189 189 189 189 189 189 189 189 189 189
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi b. Asumsi Independensi Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin Watson, bila nilai Durbin 2 s.d. +2 berarti asumsi independensi terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Model Summaryb Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016 DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
167
c. Asumsi Linieritas Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, , Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil uji asumsi :
ANOVAb Model 1 Sum of Squares 11291987 88625066 99917053 df 4 184 188 Mean Square 2822996.778 481657.965 F 5.861 Sig. .000a
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas terpenuhi
d. Asumsi Homoscedascity Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka diduga variannya terjadi heteroscedasticity. 168
Scatterplot
-1
-2
-3
-4 -3 -2 -1 0 1 2 3
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi homoscedasity terpenuhi e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
169
Histogram
40
30
Frequency
20
10
0 -4 -3 -2 -1 0 1 2 3
170
0.8
0.6
0.4
0.2
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk distribusinya normal, berarti asumsi normality terpenuhi. f.Diagostik Multicollinearity Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka mengindikasikan telah terjadi collinearity.
171
Coefficientsa Stand ardize d Coeffi cients Beta .211 -.159 -.195 -.098 t 10.476 2.925 -2.244 -2.733 -1.379 Sig. .000 .004 .026 .007 .169
Mo de l 1
Unstandardized Coefficients B 2449.121 5.035 -236.420 -582.566 -145.412 Std. Error 233.779 1.721 105.338 213.148 105.417
Collinearity Statistics Tolera nce VIF .925 .964 .943 .947 1.081 1.037 1.060 1.056
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian tidak ada Multicollinearity antara sesama variabel indepeden Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi sehingga model dapat digunakan untuk memprediksi berat badan bayi. Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan. Sehingga model yang terakhir adalah sbb:
Model Summaryb Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016 DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
172
Coefficientsa Stand ardize d Coeffi cients Beta .211 -.159 -.195 -.098 t 10.476 2.925 -2.244 -2.733 -1.379 Sig. .000 .004 .026 .007 .169
Mo de l 1
Unstandardized Coefficients B 2449.121 5.035 -236.420 -582.566 -145.412 Std. Error 233.779 1.721 105.338 213.148 105.417
Collinearity Statistics Tolera nce VIF .925 .964 .943 .947 1.081 1.037 1.060 1.056
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Interpretasi model: Setelah dilakuikan analisis ,ternyata variabel independen yang masuk model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan riwayat prematur. Pada tabel Model Summary terlihat koefisien determinasi (R square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel berat bayi sebesar 11,3 %.. Kemudian pada kotak ANOVA, kita lihat hasil uji F yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi variabel berat bayi. Pada kotak Coefficient kita dapat memperoleh persamaaan garisnya, pada kolom B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi yang diperoleh adalah Berat Bayi = 2449,1+5,0 Lwt 236,4 smoke - 582Hi 145,4 Ptl
173
SUTANTO PRIYO HASTONO: Analisis Data Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun arti koef. B untuk masing-masing variabel adalah sbb: Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi dan prematur Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4 gram setelah dikontrol variabel berat badan, hipertensi dan prematur. Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok dan prematur. Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap variabel dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
174
13
puas dll).
REGRESI LOGISTIK
Berbeda dengan regresi linier yang variabel dependennya numerik, regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus, artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak A. REGRESI LOGISTIK SEDERHANA 1. Pendahuluan Analisis regresi logistik adalah salah satu pendekatan model matematis yang digunakan untuk menganalisis hubungan satu atau beberapa variabel independen dengan sebuah variabel dependen katagorik yang bersifat dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal, merokok dan tidak merokok, dan lain-lain Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis variabel dependennya. Regresi linear digunakan apabila variabel dependennya numerik , sedangkan regresi logistik diogunakan pada data yang dependennya berbentuk katagorik yang dikotom. Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh analisis penelitian yang mempelajari hubungan antara variabel umur dengan kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang sampel, didapatkan hasil : No PJK 1 0 2 22 0 3 23 1 4 24 0 5 25 0 6 27 1 7 28 0 8 29 1 9 30 1 10 32 0 11 33 0 100 70 1 Umur 20
175
SUTANTO PRIYO HASTONO: Analisis Data Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan diberi kode 0 bila mereka tiodak menderita PJK. Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier, misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda. Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan kejadian PJK.
Untuk
mempertajam
analisis
kita,
sekarang
dicoba
untuk
mengelompokkan variabel independen (variabel umur) dan menhitung nilai tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK) untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada tabel berikut:
176
SUTANTO PRIYO HASTONO: Analisis Data PJK Tidak 9 13 9 10 7 3 4 2 57 Ya 1 2 3 5 6 5 13 8 43 Proporsi Kejadian 0,10 0,13 0,25 0,33 0,46 0,63 0,76 0,80 0,43
Umur 20 29 30 34 35 39 40 44 45 49 50 54 55 59 60 69 Total
Jumlah 10 15 12 15 13 8 17 10 100
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 20 - 29 30 34 35 39 40 44 45 49 50 54 55 59 60 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut menyerupai huruf S. Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada 177
SUTANTO PRIYO HASTONO: Analisis Data sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata (mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s.d (0 E(Y/x) ). Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh karena pada regresi logistik dependennya adalah dikotom maka variabel dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu berada antara nol dan satu (0 E(Y/x) 1).
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu. Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara - sampai +. Bila nilai Z mendekati maka f( ) = 1 . =0 1 + e-( )
178
SUTANTO PRIYO HASTONO: Analisis Data Bila nilai Z mendekati + maka f(+ ) = Fungsi Logistik dapat digambarkan sbb: 1 . =1
1 + e-(+ )
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada ketinggian tertentu garisnya akan mendatar mendekati nilai 1. Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu probabilitas kejadian pada dependen yang dikotom maka model regresi logistik adalah pilihan yang tepat. 3. Model Logistik Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan penjumlahan linear konstanta () ditambah dengan 1X1, ditambah 2X2 dan seterusnya sampai iXi. Variabel X adalah variabel Independen. 179
SUTANTO PRIYO HASTONO: Analisis Data Z = + 1X1 Z = + 1X1 + 2X2 + + iXi (Regresi logistik sederhana) (Regresi logistik berganda)
f(z) =
SUTANTO PRIYO HASTONO: Analisis Data Nilai f(z) dapat diganti dengan P(X), maka rumusnya: P(X) = 1 . 1 + e-z
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb: = -3,911 dan 1 = 0,652, maka: P(X) = 1 . 1 + e-(-3,911 + 0,652KAT)
Dari model tersebut coba kita jawab pertanyaan di atas: a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi. Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai KAT=1 pada model di atas, hasilnya: P(X) = 1 . = 0,037 atau sekitar 4% 1 + e-(-3,911 + 0,652*1) jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up. b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai KAT=0 pada model di atas, hasilnya: P(X) = 1 . = 0,019 atau sekitar 2% 1 + e-(-3,911 + 0,652*0) jadi mereka/individu yang kadar katekolaminnya rendah dalam darah mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up. c. Besar risiko kedua kelompok tersebut P1(X) = 0,037 = 1,947 = 2,0 P0(X) 0,019 Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh secara direk. Arti dari angka di atas adalah mereka yang kaadar 181
SUTANTO PRIYO HASTONO: Analisis Data katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi dibandingkan mereka yang kadar katekolaminnya rendah. Model regresi logistik dapat digunakan pada data yang dikumpulkan melalui rancangan kohort, case control maupun cross sectional. Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko individual. Sedangkan pada rancangan case control dan cross sectional tidak dapat digunakan untuk menghitung risiko individual karena 0 pada rancangan ini tidak sahih. Nilai 0 dapat dihitung/diestimasi bila sampling fraction populasi yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket: sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit). Namun dengan memperlakukan rancangan case control dan cross sectional sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan perhitungan eksponensial dari persamaan garis regresi logistik. Odds Ratio (OR) = exp() atau dapat ditulis OR = e() Dengan demikian dapat disimpulkan bahwa Individual Risk (ririko
individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan pada rancangan case control, cross sectional tidak dapat melakukan prediskis risiko individual. Pada rancangan case control dan cross sectional dan cohort dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek. Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal) berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat digunakan dengan model: P(X) = 1+e
-( + 1X1 + 2X2 + + iXi
182
SUTANTO PRIYO HASTONO: Analisis Data B. REGRESI LOGISTIK GANDA Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model. Pada regresi logistik, variabel independennya boleh campuran antara variabel katagorik dan numerik. Namun sebaiknya variabel independennya berupa katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah. Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu: a. Model Prediksi Pemodelan dengan tujuan untuk memperoleh model yang tediri dari beberapa variabel independen yang dianggap terbaik untuk memprediksi kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien regresi logistik sekaligus. Bentuk kerangka konsep model regresi : X1 X2 X3 X4 Prosedur pemodelan: Agar diperoleh model regresi yang hemat dan mampu menjelaskan hubungan variabel independen dan independen dalam populasi, diperlukan prosedur pemilihan variabel sbb: 1). Melakukan analisis bivariat antara masing-masing variabel independen dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p < 0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara substansi penting.
183
SUTANTO PRIYO HASTONO: Analisis Data 2). Memilih variabel yang dianggap penting yang masuk dalam model, dengan cara mempertahankan variabel yang mempunyai p value < 0,05 dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara bertahap dimulai dari variabel yang mempunyai p value terbesar. 3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan apakah variabel numerik dijadikan variabel katagorik atau tetap variabel numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4 kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok menunjukkan bentuk garis lurus, maka variabel numerik dapat dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka dapat dipertimbangkan dirubah dalam bentuk katagorik. 4). Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik. Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting dimasukkan dalam model. b. Model Faktor Risiko Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel utama dengan variabel dependen dengan mengontrol beberapa variabel konfonding. Bentuk kerangka konsep model faktor risiko: X1 Y
X2 X3 X4 184
Tahapan pemodelan: 1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama dengan semua variabel konfonding). 2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara berurutan satu per satu dari nilai p Wald yang terbesar. 3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding dan harus tetap berada dalam model.
185
KASUS I :
Adapun langkahnya:
A. SELEKSI BIVARIAT
Masing-masing variabel independen dilakukan analisis bivariat dengan variabel dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel tersebut langsung masuk tahap multivariat. Untuk variabel independen yang hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting, maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi bivariat menggunakan uji regresi logistik sederhana. 1.Analisis bivariat antara umur denganbblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam hal ini berarti masukkan low) dan pada kotak independen isikan variabel independennya (dalam hal ini berarti masukkan age). Sehingga tampilannya sbb: 186
5. Klik tombol Options , klik CI for Exp(B) 6. Klik Continue 7. Klik OK, dan hasilnya sbb:
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .893 1.011
Step a 1
B -.051 .385
df 1 1
187
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25 sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI: 0,89-1,01) 2.Analisis bivariat antara ras dengan bblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates variabel age dikeluarkan dan gantilah dengan mengisikan variabel race. Tampilannya sbb:
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras 188
SUTANTO PRIYO HASTONO: Analisis Data putih, hitam dan lainnya). Klik tombol Categorical, pindahkan race dari kotak covariates ke kotak categorical covariates, klik pilihan first pada bagian Reference category, lalu klik Change, dan tampilannya:
Race
Frequency 96 26 67
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 5.010 5.010 5.010 df 2 2 2 Sig. .082 .082 .082
189
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .939 .955 5.772 3.736
df 2 1 1 1
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy, terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih. 3. Analisis bivariat antara hipertensi dengan bblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan ht. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 4.022 4.022 4.022 df 1 1 1 Sig. .045 .045 .045
190
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.021 11.088
Step a 1
ht Constant
B 1.214 -.877
df 1 1
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam multivariat 4. Analisis bivariat antara kelainan uterus dengan bblr 7. Pilih Analyze 8. Pilih Regression 9. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 10. Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan ui. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 5.076 5.076 5.076 df 1 1 1 Sig. .024 .024 .024
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.139 5.834
Step a 1
ui Constant
B .947 -.947
df 1 1
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat lanjut ke multivariat
191
SUTANTO PRIYO HASTONO: Analisis Data 5.Analisis bivariat antara periksa hamil dengan bblr 1.Pilih Analyze 2.Pilih Regression 3.Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4.Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan ftv. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square .773 .773 .773 df 1 1 1 Sig. .379 .379 .379
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .643 1.188
Step a 1
ftv Constant
B -.135 -.687
df 1 1
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak dapat lanjut ke multivariat, namun karena secara substansi variabel periksa hamil sangat penting, maka variabel ini dapat dianalisis multivariat. 6.Analisis bivariat antara merokok dengan bblr
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 4.867 4.867 4.867 df 1 1 1 Sig. .027 .027 .027
192
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.081 3.783
Step a 1
smoke Constant
B .704 -1.087
df 1 1
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian variabel merokok dapat masuk ke multivariat. 7.Analisis bivariat antara prematur dengan bblr
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 6.779 6.779 6.779 df 1 1 1 Sig. .009 .009 .009
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.197 4.151
Step a 1
ptl Constant
B .802 -.964
df 1 1
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel riwayat adanya prematur dapat masuk ke multivariat Hasil seleksi bivariat : Variabel Umur Ras Hipertensi Kelainan uterus Periksa hamil Merokok Prematur P value 0,097 0,082 0,045 0,024 0,379 0,027 0,009 193
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis multivariat oleh karena secara substansi periksa hamil merupakan variabel yang sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT
Selanjutnya dilakukan analisis multivariat keenam variabel tersebut dengan kejadian bblr. 1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel dependen. 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy. 5. Klik Option, pilih CI for exp(B) 6. Klik Continue
194
7. Kilik OK
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .894 1.031 1.025 1.185 1.219 .964 1.132 .909 .736 7.345 6.280 5.639 3.654 13.451 5.468 1.384
Step a 1
S.E. .036 .502 .426 .391 .340 .631 .458 .161 .919
Wald 1.249 6.783 4.034 5.560 6.090 3.429 4.648 3.066 .003 1.659
df 1 2 1 1 1 1 1 1 1 1
Sig. .264 .034 .045 .018 .014 .064 .031 .080 .954 .198
Exp(B) .960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv dikeluarkan dari model. Dengan langkah yang sama akhirnya diperoleh hasil sbb. 195
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .896 1.030 1.025 1.184 1.219 .963 1.134 .908 7.347 6.262 5.632 3.651 13.341 5.454
Step a 1
Wald 1.275 6.781 4.035 5.562 6.086 3.423 4.663 3.063 1.661
df 1 2 1 1 1 1 1 1 1
Sig. .259 .034 .045 .018 .014 .064 .031 .080 .197
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race, smoke, ptl, ht, dan ui. Variabel Age Race(1) Race(2) Smoke Ptl Ht ui ftv OR ftv ada 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 OR ftv tak ada 0.960 2.744 2.723 2.620 1.875 3.889 2.226 perubahan OR 0% 0% 0% 0% 0,1 % 0.3 % 0,1 %
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah umur, dengan demikian dikelurkan dar model dan hasilnya Hasilnyanya :
196
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970 7.916 6.538 5.747 3.422 13.537 5.692
B Step a 1 race race(1) race(2) smoke ptl ht ui Constant 1.088 1.059 .991 .576 1.364 .855 -2.146
df 2 1 1 1 1 1 1 1
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel yang masih aktif di model. Variabel Age Race(1) Race(2) Smoke Ptl Ht ui ftv OR age ada 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 OR age tak ada 2.968 2.883 2.694 1.779 3.912 2.350 8,2 % 5,7 % 2,7 % 5,2 % 0.3 % 5,4 % perubahan OR
Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan demikian variabel umur dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl dikeluarkan model, hasilnya
197
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.090 1.315 1.419 1.133 1.158 7.704 6.640 6.286 13.379 6.458
B Step a 1 race race(1) race(2) smoke ht ui Constant 1.064 1.083 1.094 1.359 1.006 -2.092
df 2 1 1 1 1 1 1
Setelah ptl dikeluarkan, kita lihat perubahan OR nya: Variabel OR ptl ada OR ptl tak ada Age Race(1) Race(2) Smoke Ptl Ht ui ftv 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 2.897 2.955 2.986 3.894 2.734 -
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam model. Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan hasilnya sbb:
198
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.086 1.321 1.280 .988 1.062 7.712 6.626 5.726 11.640 3.793
B Step a 1 race race(1) race(2) smoke ht ptl Constant 1.062 1.085 .996 1.221 .696 -2.025
df 2 1 1 1 1 1 1
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan : Variabel OR ui ada OR ui tak ada perubahan OR Age Race(1) Race(2) Smoke Ptl Ht ui ftv 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 2.894 2.958 2.707 2.007 3.390 5,5 % 8,4 % 3,2 % 6,9 % 13.1 % -
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %, dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan adalah sbb:
199
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970 7.916 6.538 5.747 3.422 13.537 5.692
B Step a 1 race race(1) race(2) smoke ptl ht ui Constant 1.088 1.059 .991 .576 1.364 .855 -2.146
df 2 1 1 1 1 1 1 1
C. UJI INTERAKSI
Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi, kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi. Langkahnya: 1. klik analysis, klik regression, klik binary ogistik 2. Kotak dependen isikan low 3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui 4. Klik tombol Next 5. isikan : smoke*ht ke kotak kovariat 6. klik OK lihat hasilnya pada bagian Block 2
df 1 1 7
Step 1
200
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.109 1.268 1.236 .921 .765 .970 .082 7.946 6.555 5.865 3.438 19.852 5.693 12.491
B Step a 1 race race(1) race(2) smoke ptl ht ui ht by smoke Constant 1.088 1.059 .990 .576 1.360 .854 .010 -2.146
Wald 7.900 4.692 6.387 6.211 2.937 2.680 3.584 .000 30.875
df 2 1 1 1 1 1 1 1 1
Sig. .019 .030 .011 .013 .087 .102 .058 .994 .000
Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05, berarti : tidak ada interaksi antara merokok dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa ada interaksi:
MODEL TERAKHIR
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970 7.916 6.538 5.747 3.422 13.537 5.692
B Step a 1 race race(1) race(2) smoke ptl ht ui Constant 1.088 1.059 .991 .576 1.364 .855 -2.146
df 2 1 1 1 1 1 1 1
201
SUTANTO PRIYO HASTONO: Analisis Data Interpretasi: Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
202
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .000 . .514 56.109 .760 1.186 .000 . .849 1.583
Stea p1
df 1 1 1 1 1 1
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
203
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di atas variabel interaksi Pekerjaan by umur mempunyai nilai p terbesar (p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model menjadi:
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .022 18.557 .971 86.749 .753 1.178 .878 1.616
Stea p1
df 1 1 1 1 1
Dari
output diatas, variabel interaksi kerja by sikap harus dikeluarkan dari model
Step a 1
df 1 1 1 1
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel interasksi, langkah selanjutnya uji konfounding
204
UJI KONFOUNDING
Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka varaibel tsb dianggap sebagai variabel konfounding. Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model hasiilnya sbb:
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165 99.754
Stea p1
df 1 1 1
Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja sebesar : (4,111 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan konfounding, dan harus dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya:
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.627 18.357
Step a 1
B 1.698 -.754
df 1 1
Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam model sebagai konfounding hubungan kerja dengan menyusui eksklusive.
Model terakhir :
205
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165 99.754
Stea p1
df 1 1 1
Interpretasi: Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb: Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah dikontrol variabel umur.
206
Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Low 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
age 28 29 34 25 25 27 23 24 24 21 32 19 25 16 25 20 21 24 21 20 25 19 19 26 24 17 20 22 27 20
lwt 120 130 187 105 85 150 97 128 132 165 105 91 115 130 92 150 200 155 103 125 89 102 112 117 138 130 120 130 130 80
race 3 1 2 3 3 3 3 2 3 1 1 1 3 3 1 1 2 1 3 3 3 1 1 1 1 3 2 1 2 3
smoke 1 0 1 0 0 0 0 0 0 1 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 1 1 1 0 1
ptl 1 0 0 1 0 0 0 1 0 0 0 2 0 0 0 0 0 1 0 0 2 0 0 1 0 1 0 1 0 0
ht 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
ui 1 1 0 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 1 1 1
ftv 0 2 0 0 0 0 1 1 0 1 0 0 0 1 0 2 2 0 0 0 1 2 0 0 0 0 3 1 0 0
bwt 709 1021 1135 1330 1474 1588 1588 1701 1729 1790 1818 1885 1893 1899 1928 1928 1928 1936 1970 2055 2055 2082 2084 2084 2100 2125 2126 2187 2187 2211
207
208
209
210
211
212