STATISTIK 2

1. Distribusi Normal
Salah satu distribusi frekuensi yang paling penting dalam statistika adalah distribusi normal. Distribusi normal berupa kurva berbentuk lonceng setangkup yang melebar tak berhingga pada kedua arah positif dan negatifnya. Penggunaanya sama dengan penggunaan kurva distribusi lainnya. Frekuensi relatif suatu variabel yang mengambil nilai antara dua titik pada sumbu datar. Tidak semua distribusi berbentuk lonceng setangkup merupakan distribusi normal. Pada tahun 1733 DeMoivre menemukan persamaan matematika kurva normal yang menjadi dasar banyak teori statistika induktif. Distribusi normal sering pula disebut Distribusi Gauss untuk menghormati Gauss (1777 – 1855), yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang berulang-ulang mengenai bahan yang sama. Sifat dari variabel kontinu berbeda dengan variabel diskrit. Variabel kontinu mencakup semua bilangan, baik utuh maupun pecahan. Oleh karenanya tidak bisa dipisahkan satu nilai dengan nilai yang lain. Itulah sebabnya fungsi variabel random kontinu sering disebut fungsi kepadatan, karena tidak ada ruang kosong diantara dua nilai tertentu. Dengan kata lain sesungguhnya keberadaan satu buah angka dalam variabel kontinu jika ditinjau dari seluruh nilai adalah sangat kecil, bahkan mendekati nol. Karena itu tidak bisa dicari probabilitas satu buah nilai dalam variabel kontinu, tetapi yang dapat dilakukan adalah mencari probabilitas diantara dua buah nilai. Distribusi kontinu mempunyai fungsi matematis tertentu. Jika fungsi matematis tersebut digambar, maka akan terbentuk kurva kepadatan dengan sifat sebagai berikut: 1. Probabilitas nilai x dalam variabel tersebut terletak dalam rentang antara 0 dan 1 2. Probabilitas total dari semua nilai x adalah sama dengan satu (sama dengan luas daerah di bawah kurva) Fungsi kepadatan merupakan dasar untuk mencari nilai probabilitas di antara dua nilai variabel. Probabilitas di antara dua nilai adalah luas daerah di bawah kurva di antara dua nilai dibandingkan dengan luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dengan menggunakan integral tertentu (definit integral). Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter μ dan σ yaitu rataan dan simpangan baku. Jadi fungsi padat x akan dinyatakan dengan n (x; μ, σ). Begitu μ dan σ diketahui maka seluruh kurva normal diketahui. Sebagai contoh, bila μ = 50 dan σ = 5, maka ordinat n(x ; 50, 5) dapat dengan mudah dihitung untuk berbagai harga x dan kurvanya dapat digambarkan. Kedua kurva bentuknya persis sama tapi titik tengahnya terletak di tempat yang berbeda di sepanjang sumbu datar. Dengan memeriksa turunan pertama dan kedua dari n(x ; μ, σ) dapat diperoleh lima sifat kurva normal berikut :

dan cekung dari atas untuk harga x lainnya 4.µ σ = 173 – 171. Varian dari variabel respons.8 = 0. . terdapat pada x=μ 2.1. Kurva mempunyai titik belok pada x = μ σ. titik pada sumbu datar yang memberikan maksimum kurva. Seluruh luas di bawah kurva diatas sumbu datar sama dengan 1 Bila x menyatakan peubah acak distribusi maka P(x1 < x < x2) diberikan oleh daerah yang diarsir dengan garis yang turun dari kiri ke kanan.8. ANOVA: PENGUJIAN RATA-RATA POPULASI ESTIMASI VARIAN POPULASI ANTAR SAMPEL  Estimasi 2 antar-sampel (between-samples) disebut mean square between (MSB). Contoh soal : Contoh Soal : Mawar adalah seorang peragawati yang akan diseleksi dengan tinggi badan 173 cm. Kedua ujung kurva normal mendekati asimtot sumbu datar bila harga x bergerak menjauhi μ baik ke kiri maupun ke kanan 5.8 dan standar deviasinya adalah 12. Jelas bahwa kedua daerah yang diarsir berlainan luasnya. Modus. Standar tinggi badan rata-rata peragawati adalah 171. ASUMSI-ASUMSI PADA ANOVA Untuk setiap populasi. peluang yang berpadanan dengan masing-masing distribusi akan berlainan pula. dinotasikan s 2. σ = 12 Dit : Z ? Jawab : Z = x . variabel respons-nya terdistribusi normal. cekung dari bawah bila μ – σ < x < μ + σ. Unit observasi harus saling bebas (independent). adalah sama untuk semua populasi. Jadi. Kurva setangkup terhadap garis tegak yang melalui rataan μ 3.1 12 2. Menggunakan hasil sampel untuk menguji hipotesis berikut: H0: 1 = 2 = … = k Ha: minimal ada i  j Jika H0 ditolak berarti minimal ada 2 rata-rata populasi yang memiliki nilai berbeda. Berapakah standar normalnya (Z) ? Penyelesaian : Dik : x = 173.  Pembilang dari MSB merupakan sum of squares between (SSB). µ = 171. ANALYSIS OF VARIANCE (ANOVA)       ANOVA dapat digunakan untuk menguji kesaman 3 (tiga) atau lebih rata-rata populasi menggunakan data yang diperoleh dari pengamatan maupun percobaan.

Hasilnya seperti pada slide berikut. nilai MSB/MSW akan meningkat karena MSB overestimate.  ANOVA: PENGUJIAN RATA-RATA POPULASI PERBANDINGAN ESTIMASI VARIAN: UJI F  maka distribusi  Jika rata-rata k populasi tidak sama.  ANOVA: PENGUJIAN RATA-RATA POPULASI ESTIMASI VARIAN POPULASI DALAM SAMPEL  Estimasi 2 yang didasarkan pada variasi observasi dalam masing-masing sampel disebut mean square within (MSW). and Detroit). kita akan menolak H0.  Penyebut dari MSW menunjukkan derajat bebas (degrees of freedom) yang bersesuaian dengan SSW. CONTOH SOAL: REED MANUFACTURING  Analysis of Variance (ANOVA) J. . Sampel acak sederhana yang terdiri dari 5 orang manajer pada masingmasing perusahaan diambil dan jumlah jam kerja minggu yang lalu masingmasing manajer tersebut dicatat.  Analysis of Variance (ANOVA) Prshn 1 Prshn 2 Prshn 3 Observasi Buffalo Pittsburgh Detroit 1 48 73 51 2 54 63 63 Jika H0 benar dan asumsi pada ANOVA terpenuhi.1 dan nT 1. Reed ingin mengetahui apakah rata-rata jumlah jam kerja per minggu para manajer sama pada tiga perusahaan yang ada (Buffalo.  Pembilang dari MSW disebut sum of squares within (SSW).  PROSEDUR PENGUJIAN RATA-RATA POPULASI Hipotesis H0: 1 = 2 = … = k Ha: minimal ada i  j  Uji Statistik F = MSB/MSW  Aturan Penolakan Tolak H0 jika F > Fa dimana nilai F didasarkan pada distribusi F dg derajat bebas k . Penyebut dari MSB menyatakan derajat bebas (degrees of freedom) yang terkait dengan SSB. Pittsburgh.  Oleh karena itu. R.

2. i.0 26.5) + 4(24. DISTRIBUSI T .60)2 + 5(57 .5  Analysis of Variance (ANOVA) Hipotesis H0: 1 = 2 = 3 Ha: minimal ada i  j .05. Rata-rata jumlah jam kerja para manajer perminggu pada tiga perusahaan (Buffalo. maka F0.667 F 9.55 Uji Statistik F = MSB/MSW = 245/25.3 dimana: 1 = rata-rata jumlah jam kerja perminggu manajer pada perusahaan 1 2 = rata-rata jumlah jam kerja perminggu manajer pada perusahaan 2 3 = rata-rata jumlah jam kerja perminggu manajer pada perusahaan 3  Analysis of Variance (ANOVA) Mean Square Between (MSB) Karena ukuran sampelnya sama.89 Kesimpulan : Karena F = 9.05. and Detroit) tidak sama.667  Analysis of Variance (ANOVA) Source Variation Treatment Error Total of Degrees Freedom 2 12 14 of Sum of Squares 490 308 798 Mean Squares 245 25.0) + 4(26. 2. Pittsburgh.60)2 = 490 MSB = 490/(3 .1) = 245 Mean Square Within (MSW) SSW = 4(26.2.5) = 308 MSW = 308/(15 .55  Analysis of Variance (ANOVA) Aturan Penolakan Misalkan a = 0.89 Tolak H0 jika F > 3. maka x = (55 + 68 + 57)/3 = 60 SSB = 5(55 .2.12 = 3.3) = 25.60)2 + 5(68 .05. j = 1.3 57 66 61 4 54 64 54 5 62 74 56 Rata-rata Sampel 55 68 57 Varian Sampel 26. maka H0 ditolak.5 24.55 > F0.667 = 9.12 = 3.89.

841 4.571 2.718 2.499 3.771 1.761 1.921 2.101 2.845 2.110 2.714 1.860 1.895 1.898 2.069 2.807 2.306 2.896 2.977 2.143 2. Gosset.925 5.025 12.779 .179 2.Adalah pengujian hipotesis yang menggunakan distribusi T sebagai uji statsistik.539 2.500 2.776 2.707 3. Cirinya : sample yang di uji berukuran kurang dari 30 Tabel Nilai t df 0.729 1.447 2.821 6.479 0.787 2.093 2.821 2.583 2.721 1.604 4.706 4.878 2.782 1.145 2.602 2.943 1.485 2.086 2.080 2.706 α 0.228 2.303 3.064 2.725 1.055 3.831 2.947 2.819 2.711 1.920 2.355 3. Distribusi T pertama kali diterbitkan tahu 1908 dalam suatu makalah oleh W.797 2.160 2.717 1.314 2.624 2.861 2.492 2.567 2.650 2. table pengujiannya disebut table T student.734 1.S.753 1.747 3.032 3.681 2.796 1.012 2.01 31.060 2.518 2.365 2.353 2.182 2.541 3.812 1.833 1.508 2.120 2.965 4.169 3.708 1.05 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 6.998 2.015 1.262 2. Hasil uji statistiknya kemudian dibandingkan dengan nilai yang ada pada tabel kemudian menerima atau menolak hipotesis nol (Ho) yang dikemukakan.131 2.056 0.250 3.657 9.764 2.740 1.074 2.005 63.365 3.106 3.132 2.201 2.552 2.746 1.528 2.

ia menggunakan nama samaran Student. Distribusi student ini berlaku baik untuk sampel kecil maupun sampel besar.021 2. misalnya n=10000.462 2.701 1. Dalam artikel publikasinya.626 2.771 2.684 1.704 2. Uji ini bisa digunakan untuk objek studi yang berpasangan dan juga bisa untuk objek studi yang tidak berpasangan.750 2.403 2.045 2. sehingga kemudian metode pengujiannya dikenal dengan uji t-student.27 28 29 30 40 50 100 10000 1.699 1.042 2.756 2. ia kemudian mengembangkan distribusi lain yang mirip dengan distribusi normal.009 1.984 1.364 2.660 1.763 2.048 2. Oleh karenanya. Hipotesis Ho : 1 = HA : 1 ≠ 2 2 2. Data hasil penelitian dua jenis pupuk nitrogen terhadap hasil padi (t/h) Plot 1 2 3 4 Pupuk A Y1 7 6 5 6 Pupuk B Y2 8 6 7 8 .457 2.697 1.327 2. Uji t tidak berpasangan Contoh kasus : Kita ingin menguji dua jenis pupuk nitrogen terhadap hasil padi 1.645 2.467 2. William Sealy Gosset menganggap bahwa untuk sampel kecil. Hasil penelitian tertera pada Tabel 1. Pada n ≥ 30.703 1. yang dikenal dengan distribusi t-student. distribusi t ini mendekati distribusi normal dan pada n yang sangat besar.960 2. nilai distribusi t sama persis dengan nilai distribusi normal (lihat tabel t pada df 10000 dan bandingkan dengan nilai Z).678 2.052 2. Berikut contoh penggunaan uji t.676 1.576 Uji t Tidak Berpasangan Uji t dikembangkan oleh William Sealy Gosset. Pemakaian uji t ini bervariasi. nilai Z dari distribusi normal tidak begitu cocok. Tabel 1.473 2.423 2.

Kesimpulan Karena nila thit|= 3. Kriteria Pengambilan Kesimpulan Terima H0. jika thit| < t table. Nilai n adalah jumlah ulangan. alias terima HA. karena hipotesis HA kita adalah hipotesis 2 arah (lihat hipotesis).67 Setelah itu.074.05 dibagi 2. sebagai nilai pembanding. Akhirnya. yaitu n1+n2-2.5 6 7 8 9 10 11 12 Hitunglah 1 5 4 4 6 6 7 6 5 6 6 7 7 8 7 6 7 3.7932/12) = -1. UJI CHI KUADRAT (χ²) 1.367522 = -3.074. Dengan demikian.92 = 0. alias kita terima HA. yaitu masing 12 ulangan. Nilai 22 ini adalah nilai df.025(22) = 2. Pendahuluan . Pertama kita lihat kolom α = 0.05/2 (n1+n2-2)=t0.34/0.58 = 6. Dengan demikian.793 thit =( 1 Y2 S1 S2 – =( 5. Lebih lanjut. yaitu hasil padi yang dipupuk dengan pupuk A tidak sama dengan hasil padi yang dipupuk dengan pupuk B.92)/√(0. maka kita tolak H0. Nilai α ini berasal dari α 0.074 4. jika thit| > t table 5. kita lihat nilai t table. Kemudian.025 pada Tabel 2. kita dapat menyimpulkan bahwa pupuk B nyata lebih baik daripada pupuk A untuk meningkatkan hasil pa 2 2)/√(S1 /n1) 2 +(S22/n2) 3.996 = 0.025(12+12-2) = t0. t table = t α/2 (df) = t0. sebaliknya Tolak H0. kita lihat bahwa rata-rata hasil padi yang dipupuk dengan pupuk B lebih tinggi daripada yang dipupuk dengan pupuk A.67 (tanda minus diabaikan) dan nilai t table=2. kita peroleh nilai t table = 2. Cara melihatnya adalah sebagai berikut. Data analisis adalah sebagai berikut = 5.996 /12)+(0.58 – 6. kita lihat baris ke 22. 1 ≠ 2.

Pengertian Frekuensi Observasi dan Frekuensi Harapan frekuensi observasi → nilainya didapat dari hasil percobaan (o) frekuensi harapan → nilainya dapat dihitung secara teoritis (e) 1.. Uji Kecocokan = Uji kebaikan-suai = Goodness of fit test b. k o : frekuensi observasi untuk kategori ke-i i e : frekuensi ekspektasi untuk kategori ke-i i kaitkan dengan frekuensi ekspektasi dengan nilai/perbandingan dalam H0 Derajat Bebas (db) = k . Gunadarma).3.005? (35.0863) Berapa nilai χ² untuk db = 17 dengan α = 0. yaitu luas daerah penolakan H0 atau taraf nyata pengujian Perhatikan gambar berikut : α : luas daerah penolakan H0 = taraf nyata pengujian 0+∞ 1. Perhatikan Tabel hal 178 dan 179 (Buku Statistika-2.2 . Bentuk Distribusi Chi Kuadrat (χ²) Nilai χ² adalah nilai kuadrat karena itu nilai χ² selalu positif. Pengunaan Uji χ² Uji χ² dapat digunakan untuk : a. k : banyaknya kategori/sel. Uji Kebebasan c.. Bentuk distribusi χ² tergantung dari derajat bebas(db)/degree of freedom.1 Penetapan Hipotesis Awal dan Hipotesis Alternatif H0: frekuensi setiap kategori memenuhi suatu nilai/perbandingan.Uji Chi Kuadrat adalah pengujian hipotesis mengenai perbandingan antara : frekuensi observasi/yg benar-benar terjadi/aktual dengan frekuensi harapan/ekspektasi 1. Uji beberapa proporsi Prinsip pengerjaan (b) dan (c) sama saja 2. H1 : Ada kategori yang tidak memenuhi nilai/perbandingan tersebut.7185) Pengertian α pada Uji χ² sama dengan pengujian hipotesis yang lain. 1.1 2.2.010? (15.3 Perhitungan χ² Contoh 3 : Pelemparan dadu sebanyak 120 kali menghasilkan data sebagai berikut : kategori : sisi-1 sisi-2 sisi-3 sisi-4 sisi-5 sisi-6 . Anda bisa membacanya? Contoh : Berapa nilai χ² untuk db = 5 dengan α = 0.1. Uji Kecocokan (Goodness of fit test) 2.

Statistik Uji χ² 3. 4.frekuensi observasi 20 20 20 22 20 17 20 18 20 19 20 24 *) Nilai dalam kotak kecil adalah frekuensi ekspektasi Apakah dadu itu dapat dikatakan setimbang? Lakukan pengujian dengan taraf nyata = 5 % Solusi : 1. Kesimpulan : χ² hitung = 1. Regresi linier Untuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas.45 0.70 7.70 < χ² tabel Nilai χ² hitung ada di daerah penerimaan H0 H0 diterima.70 χ² hitung = 1. Wilayah Kritis = Penolakan H0 jika χ² hitung > χ² tabel (db.1 = 6-1 = 5 4. maka analisis regresi disebut regresi linear berganda. Nilai α = 5 % = 0.0705 (catatan : Gunakan tabel seperti ini agar pengerjaan lebih sistematik) kategori : oi sisi-1 sisi-2 sisi-3 sisi-4 sisi-5 sisi-6 Σ 20 22 17 18 19 24 120 ei 20 20 20 20 20 20 120 (o-e) ii 0 2 -3 -2 -1 4 --------- (o-e)² ii 0 4 9 4 1 16 -------------- (o-e)²/e iii 0 0.05 k = 6 . Nilai Tabel χ² k = 6 . α) χ² hitung > 11.20 0.0705 5. H0 : Dadu setimbang → semua sisi akan muncul = 20 kali. db = k . H1 : Dadu tidak setimbang → ada sisi yang muncul ≠20 kali.80 1.05 → χ² tabel = 11. pernyataan dadu setimbang dapat diterima.20 0. Gujarati (2006) mendefinisikan analisis regresi sebagai kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). db = k .1 = 6-1 = 5 db = 5. Disebut berganda . 2.05 0.α = 0. Jika variabel bebas lebih dari satu.

karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung. .

Sign up to vote on this title
UsefulNot useful