P. 1
Uji hipotesis statistik

Uji hipotesis statistik

|Views: 400|Likes:
Published by -Iman Nalupe-

More info:

Published by: -Iman Nalupe- on Mar 08, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

12/24/2013

pdf

text

original

Uji hipotesis statistik Dua bidang utama inferensi statistik merupakan bidang perkiraan parameter dan uji hipotesis

statistik. Masalah perkiraan parameter, baik perkiraan titik dan interval, telah ditafsirkan. Dalam bagian 6.4 dan 6.5 beberapa aspek hipotesis statistik dan uji hipotesis statistik akan dipertimbangkan. Bagian pokoknya akan diperkenalkan melalui contoh. Contoh 1. Diketahui bahwa hasil percobaan acak X adalah N (θ, 100). Misalnya, X dapat menunjukkan nilai pada pengujian, yang mana nilai kita asumsikan berdistribusi normal dengan mean θ dan variansi 100. Kita katakan pengalaman masa lalu dengan percobaan acak ini menunjukkan bahwa θ = 75. Misalkan, kemungkinan untuk beberapa penelitian pada daerah yang berkaitan dengan penelitian ini, beberapa perubahan yang dibuat dalam metode acak untuk melakukan percobaan ini. Hal ini kemudian diduga bahwa tidak lagi θ = 75 tapi sekarang θ > 75. Belum ada bukti eksperimental yang formal mengatakan bahwa θ > 75; maka laporan θ > 75 adalah dugaan atau hipotesis statistik. Dalam mengasumsikan bahwa hipotesis statistik θ > 75 mungkin salah, kami membolehkan, kemungkinan bahwa θ ≤ 75. Jadi sebenarnya ada dua hipotesis statistik. Pertama, bahwa parameter yang tidak diketahui θ ≤ 75, yaitu belum ada peningkatan θ. Kedua, bahwa parameter yang tidak diketahui θ > 75. Dengan demikian, parameter ruang Ω = {θ: - ∞ <θ <∞}. Kita menyatakan yang pertama dari hipotesis ini disimbolkan dengan H_0 : θ ≤ 75 dan yang kedua disimbolkan H_1:> θ 75. Karena nilai θ > 75 adalah solusi di mana θ ≤ 75, hipotesis H_1: θ> 75 disebut hipotesis alternatif. Tak perlu dikatakan, bahwa H_0 bisa disebut alternatif untuk H_1 Namun, dugaan di sini θ > 75, yang dibuat oleh peneliti biasanya dianggap hipotesis alternatif. Dalam kasus ini adalah untuk menentukan mana yang hipotesis yang akan diterima. Untuk mencapai keputusan, percobaan acak harus diulang beberapa kali, katakanlah n, dan hasilnya akan diamati. Artinya, kita mempertimbangkan sampel acak X_1, X_2, ..., X_n dari distribusi normal N (θ, 100), dan kami merancang pola yang akan memberitahu kita apakah keputusan untuk membuat satu kali nilai eksperimental, mengatakan x_1, x_2, ..., x_n, telah ditentukan. Aturan tersebut disebut suatu uji dari hipotesis H_0: θ ≤ 75 melawan hipotesis alternatif H_1: θ> 75. Tidak ada pola yang terikat pada jumlah aturan atau uji yang bisa dibuat. Kita akan membahas tiga uji tersebut. Pengujian kami akan buat di sekitar gagasan berikut. Kita akan membagi ruang sampel A ke himpunan bagian C dan yang melengkapi C*. Jika nilai-nilai percobaan X_1, X_2, ..., X_n, mengatakan x_1, x_1, ..., x_n, adalah sedemikian rupa sehingga titik 〖(x〗 _1, x_1, ..., x_n) ∈ C, kita akan menolak hipotesis H_0 (menerima hipotesis H_1). Jika kita memiliki (x_1, x_1, ..., x_n) ∈ C*, kita akan menerima hipotesis H_0 (menolak hipotesis H1). Test 1. Misalkan n = 25. Ruang Sampel A adalah membatasi {(X_1, x_2, ..., x_25): - ∞ <x_i <∞, i = 1,2, ..., 25} Biarkan himpunan bagian C dari ruang sampel akan C = {(x_1, x_2, ..., x_25): x_1 + x_2 + ⋯ + x_25> (25) (75)} Kita akan menolak hipotesis H_0 jika dan hanya jika nilai eksperimen kita adalah 25 seperti itu (x_1, x_2, ..., x_25) ∈ C. Jika (x_1, x_2, ..., x_25) bukan merupakan elemen dari C, kita akan menerima hipotesis H_0. Ini adalah himpunan bagian C dari ruang sampel yang mengarah ke penolakan hipotesis H_0: θ ≤ 75 disebut uji daerah kritis 1. Sekarang Σ_1 ^ 25 ▒ 〖x_i> (25) (75)〗 jika dan hanya jika x ,> 75 di mana x = Σ_1 ^ 25 ▒ 〖x_i/25.〗 Demikian kita bisa jauh lebih mudah mengatakan bahwa kita harus menolak

hipotesis H_0: θ ≤ 75 dan menerima hipotesis H_1: θ> 75 jika dan hanya jika nilai mean eksperimen ditentukan mean dari sampel x lebih besar dari 75. Jika x ≤ 75, kita menerima hipotesis H_0: θ ≤ 75 jika mean dari distribusi ketika hipotesis H_0 benar. Ini akan membantu kita untuk mengevaluasi uji hipotesis statistik jika kita tahu kemungkinan menolak bahwa hipotesis (dan karenanya untuk menerima hipotesis alternatif). Dalam pengujian kami 1, ini berarti bahwa kita ingin menghitung probabilitas Pr [(X_1, ..., X_25.) ∈ C] = Pr (X > 75). Jelas, probabilitas ini adalah fungsi dari parameter θ dan kami akan menunjukkan itu dengan K_1 (θ). Fungsi K_1 (θ) = Pr ⁡ (X > 75) disebut fungsi kekuatan uji 1, dan nilai fungsi daya pada titik parameter disebut kekuatan uji 1 pada saat itu. Karena X adalah N (θ, 4), kita memiliki K_1 (θ) = Pr ⁡ 〖((X -θ) / 2> (75-θ) / 2) = 1-Φ ((75-θ) / 2)〗 Jadi, untuk ilustrasi, kita miliki, dengan Tabel III lampiran B, bahwa kekuasaan pada θ = 75 adalah K_1 (75) = 0,500. daya lainnya adalah K_1 (73) = 0.159, K_1 (77) = 0,841, dan K_1 (79) = 0,977. Grafik K_1 (θ) uji 1 digambarkan pada Gambar 6.1. Antara lain, ini berarti bahwa, jika θ = 75, sehingga H_0 benar, probabilitas menolak hipotesis H_0: θ ≤ 75 adalah 1 / 2. Artinya, jika θ = 75 sehingga H_0 itu benar, GAMBAR 6.1 Kemungkinan menolak ini H_0 hipotesis yang benar adalah 1 / 2. Banyak statistik penelitian dan pekerja merasa sangat tidak diinginkan untuk memiliki probabilitas tinggi sebagai 1 / 2 ditugaskan untuk jenis kesalahan: yaitu penolakan H_0 ketika H_0 adalah hipotesis benar. Jadi Test 1 tidak tampaknya tes sangat memuaskan. Mari kita coba untuk merancang tes lain yang tidak memiliki fitur ini pantas. Kita akan melakukan hal ini dengan membuatnya lebih sulit untuk menolak H_0 hipotesis dengan harapan bahwa ini akan memberikan probabilitas yang lebih kecil menolak H_0 ketika hipotesis itu benar. Uji 2. Misalkan n = 25. Kita akan menolak H_0 hipotesis: θ ≤ 75 dan menerima hipotesis H_1: θ> 75 jika dan hanya jika x > 78. Oleh karena itu daerah kritis adalah C = {(x_1, ..., x_25): x_1 + ⋯ + x_25> (25) (78)}. Fungsi daya Uji 2 adalah, karena X adalah N (θ, 4), K_2 (θ) = Pr ⁡ 〖(X > 78) =〗 1-Φ ((78-θ) / 2). Beberapa nilai fungsi kekuatan Ujian 2 adalah K_2 (73) = 0,006, K_2 (75) = 0,067, K_2 (77) = 0,309, dan K_1 (79) = 0,691. Artinya, jika θ = 75, probabilitas H_0 menolak: θ ≤ 75 adalah 0,067, ini jauh lebih diinginkan maka probabilitas yang sesuai 1 / 2 yang dihasilkan dari Ujian 1. Namun, jika H_0 adalah palsu dan, pada kenyataannya, θ = 77, probabilitas H_0 menolak: θ ≤ 75 (dan karenanya penerima H_1: θ> 75) hanya 0,309. Dalam kasus tertentu, ini probabilitas rendah 0,309 dari sebuah keputusan yang tepat (penerimaan H_1 ketika H_1is benar) adalah menyenangkan. Artinya, Uji 2 tidak sepenuhnya memuaskan. Mungkin kita bisa mengatasi fitur yang tidak diinginkan Uji 1 dan 2 jika kita lanjutkan seperti dalam Test 3. Test 3. Mari kita memilih K_3 daya fungsi (θ) yang memiliki fitur nilai kecil pada θ = 75 dan nilai besar di θ = 77. Sebagai contoh, ambil K_3 (75) = 0.159 dan K_3 (77) = 0,841. Untuk menentukan tes dengan seperti fungsi kekuasaan, mari kita menolak H_0: θ ≤ 75 jika dan hanya jika nilai eksperimental x dari mean sampel acak n ukuran lebih besar dari beberapa konstan c. sehingga daerah kritis adalah C = {(x_1, x_2, ..., x_n): x_1 + x_2 + ⋯ + x_n> nc}. Perlu dicatat bahwa ukuran sampel n dan konstanta c belum ditentukan belum. Namun, karena X adalah N (θ, 100 / n), fungsi daya

K_3 (θ) = Pr ⁡ 〖(X > c) = 1-Φ ((c-θ) / (10 / √ n))〗. The K_3 kondisi (75) = 0.159 dan K_3 (77) = 0,841 mengharuskan 1-Φ ((c-75) / (10 / √ n)) = 0.159, 1-Φ ((c-77) / (10 / √ n)) = 0.841. Setara, dari Tabel III dari lampiran B, kami telah ((C-75) / (10 / √ n)) = 1, ((c-77) / (10 / √ n)) =- 1. Solusi bagi kedua persamaan dalam n dan c adalah n = 100, c = 76. Dengan nilai n dan c, kekuatan lain dari Test 3 adalah K_3 (3) = 0,001 dan K_3 (79) = 0,999. adalah penting untuk mengamati bahwa walaupun Test 3 memiliki fungsi daya lebih diinginkan daripada Tes 1 dan 2, sebuah "harga" tertentu telah dibayar-ukuran sampel n = 100 dibutuhkan dalam Ujian 3, sedangkan kita telah n = 25 di tes sebelumnya. Keterangan. Seluruh teks kita sering mengatakan bahwa kita menerima hipotesis H_0 jika kita tidak menolak H_0 mendukung H_1. Jika keputusan ini dibuat, tentu tidak berarti H_0 itu benar atau bahwa kita bahkan percaya bahwa itu benar. Semua itu berarti, berdasarkan data di tangan, bahwa kita tidak yakin bahwa H_0 hipotesis yang salah. Oleh karena itu, pernyataan "Kami menerima H_0" mungkin akan lebih baik dibaca sebagai "Kami tidak menolak H_0". Namun, karena sedang dipakai cukup umum, kita menggunakan pernyataan "Kami menerima H_0", namun membacanya dengan komentar dalam pikiran. Kita sekarang telah menggambarkan konsep berikut. Sebuah hipotesis statistik Sebuah uji hipotesis terhadap suatu hipotesis alternatif dan konsep terkait daerah kritis pengujian. Kekuatan tes. Konsep-konsep ini sekarang akan ditetapkan secara formal. Definisi 3. Sebuah hipotesis statistik adalah pernyataan tentang distribusi dari satu atau lebih variabel acak. Jika hipotesis statistik yang benar-benar menentukan distribusi, hal itu disebut hipotesis statistik sederhana, jika tidak, itu disebut hipotesis statistik komposit. Jika kita lihat Contoh 1, kita melihat bahwa kedua H_0: θ ≤ 75 dan H_1:> θ 75 adalah hipotesis statistik komposit, karena baik dari mereka benar-benar menentukan distribusi. Jika ada, bukan H_0: θ ≤ 75, kami telah H_0: θ = 75, maka H_0 akan menjadi hipotesis statistik sederhana. Definisi 4. Sebuah uji suatu hipotesis statistik adalah aturan yang, ketika nilai-nilai sampel eksperimental telah diperoleh, mengarah ke keputusan untuk menerima atau menolak hipotesis yang sedang dipertimbangkan, Definisi 5. Biarlah C jadi bahwa himpunan bagian dari ruang sampel yang sesuai dengan tes ditentukan, mengarah pada penolakan hipotesis dalam pertimbangan. Maka C disebut daerah kritis uji. Definisi 6. Fungsi kekuatan tes dari H_0 hipotesis statistik melawan hipotesis alternatif H_1 adalah bahwa fungsi, pasti untuk seluruh distribusi yang dipertimbangkan, yang menghasilkan kemungkinan bahwa titik sampel jatuh di C daerah kritis uji, yaitu, fungsi bahwa hasil probabilitas menolak hipotesis yang sedang dipertimbangkan. Nilai fungsi daya pada titik parameter disebut kekuatan uji pada titik tersebut. Definisi 7. Biarkan H_0 menunjukkan hipotesis yang akan diuji melawan hipotesis alternatif H_1 sesuai dengan tes yang ditentukan. Tingkat signifikansi uji (atau ukuran daerah kritis C) adalah nilai maksimum (sebenarnya supremum) dari fungsi kuasa uji ketika H_0 adalah benar. Jika kita lihat lagi untuk Contoh 1, kita melihat bahwa tingkat signifikansi dari Tes 1, 2, dan 3 contoh yang

0,500, 0,067, dan 0.159, masing-masing. Contoh tambahan dapat membantu memperjelas definisi ini. Contoh 2. Hal ini diketahui bahwa variabel acak X memiliki pdf dalam bentuk f (x: θ) ^ e = 1 / θ ((-x) / θ), 0 <x <∞, = 0 di tempat lain Hal ini diinginkan untuk menguji hipotesis H_0 sederhana: θ = 2 terhadap hipotesis alternatif sederhana H_1: θ = 4. Jadi Ω = {θ: θ = 2,4}. Sebuah sampel acak X_1, X_2 ukuran n = 2 akan digunakan. Tes yang digunakan adalah didefinisikan dengan mengambil daerah kritis untuk menjadi C = {(x_1, x_2): 9,5 ≤ x_1 + x_2 <∞}. Fungsi daya uji dan tingkat signifikansi pengujian akan ditentukan. Ada tapi dua probabilitas fungsi kepadatan dalam pertimbangan, yaitu, f (x; 2) ditetapkan oleh H_0 dan f (x; 4) ditetapkan oleh H_1. Dengan demikian fungsi daya didefinisikan di tapi dua titik θ 2 = dan θ = 4. Fungsi daya dari tes ini adalah diberikan oleh Pr [(, X_1 X_2) ∈ C]. Jika H_0 benar, yaitu θ = 2, sendi p.d.f. X1 dan X2 f (x_1; 2) f (x_2, 2) = 1 / 4 e ^((-( x_1 + x_2)) / 2), 0 <x_1 <∞, 0 <x_2 <∞, = 0 di tempat lain Dan Pr [(X_1, X_2) ∈ C] = 1-Pr [(X_1, X_2) ∈ C ^ *] = 1 - ∫ _0 ^ 9,5 ▒ ∫ _0 ^ (9,5-x_2) ▒ 〖1 / 4 e ^((-( x_1 + x_2)) / 2) dx〗〗 〖〖_1 dx〗 _2 = 0,05, kira-kira Jika H_1 benar, yaitu, θ = 4, sendi p.d.f. dari X_1 dan X_2 adalah f (x_1; 4) f (x_2, 4) = 1 / 16 e ^((-( x_1 + x_2)) / 4), 0 <x_1 <∞, 0 <x_2 <∞, = 0 di tempat lain Dan Pr [(X_1, X_2) ∈ C] = 1 - ∫ _0 ^ 9,5 ▒ ∫ _0 ^ (9,5-x_2) ▒ 〖1 / 16 e ^ (- (x_1 + x_2) / 4) d〗 x_1 dx_2 = 0,31, kira-kira Jadi kekuatan dari tes ini adalah diberikan oleh 0,05 untuk θ = 2 dan 0,31 untuk θ = 4. Artinya, probabilitas menolak H_0 ketika H_0 benar adalah 0,05 dan probabilitas menolak H_0 ketika H_0 palsu adalah 0,31. karena tingkat signifikansi uji ini (atau ukuran wilayah kritis) adalah kekuatan uji ketika H_0 benar, tingkat signifikansi dari tes ini adalah 0,05. Kenyataan bahwa kekuatan tes ini, ketika θ = 4, hanya 0.31immediately menunjukkan bahwa pencarian dilakukan untuk tes lain yang, dengan kekuatan yang sama saat θ = 2, akan memiliki kekuatan yang lebih besar dari 0,31 saat θ = 4. Namun kemudian, maka akan jelas bahwa seperti pencarian akan sia-sia. Artinya, tidak ada tes dengan tingkat signifikansi 0,05 dan berdasarkan sampel acak berukuran n = 2 yang memiliki kekuatan yang lebih besar pada θ = 4. Satu-satunya cara di mana situasi dapat diperbaiki adalah untuk meminta bantuan kepada sebuah sampel acak n ukuran lebih besar dari 2. perhitungan kami kekuasaan tes ini di dua titik θ 2 dan θ = 4 = sengaja dilakukan dengan cara yang sulit untuk fokus perhatian pada konsep dasar. Sebuah prosedur yang komputasi sederhana adalah sebagai berikut. Ketika H_0 hipotesis benar, variabel acak X adalah χ ^ 2 (2). Dengan demikian variabel acak X_1 + X_2 = Y, katakan adalah χ ^ 2 (4). Dengan demikian, kekuatan uji ketika H_0 benar diberikan oleh Pr ⁡ (Y ≥ 9,5) = ⁡ 1-Pr (Y <9,5) = 1-0,95 = 0,05 Dari Tabel II Lampiran B. ketika hipotesis H_1 benar, variabel acak X / 2 adalah χ ^ 2 (2), maka variabel acak ((X_1 + X_2)) / 2 = Z mengatakan, χ ^ 2 (4 ). Dengan demikian, kekuatan uji ketika H_1 benar adalah

Pr ⁡ (X_1 + X_2 ≥ 9,5 = Pr ⁡ 〖(Z ≥ 4.75)〗 = ∫ _4.75 ^ α ▒ 1 / 4 ze ^ ((-z) / 2) dz, yang sama dengan 0,31, kira-kira. Keterangan. Penolakan dari H_0 hipotesis ketika hipotesis itu benar, tentu saja, sebuah keputusan yang salah atau kesalahan. Keputusan salah sering disebut tipe I kesalahan, dengan demikian, tingkat signifikansi dari tes ini adalah probabilitas melakukan kesalahan tipe I. penerimaan H_0 ketika H_0 adalah palsu (H_1 benar) disebut kesalahan tipe II . Jadi probabilitas kesalahan tipe II adalah 1 minus kekuatan uji ketika H_1 adalah benar. Sering, hal ini membingungkan bagi siswa untuk menemukan bahwa ada begitu banyak nama untuk hal yang sama. Namun, karena semua dari mereka yang digunakan dalam literatur statistik, kita merasa berkewajiban untuk menunjukkan bahwa "tingkat signifikansi," "ukuran dari daerah kritis," "kuasa uji ketika H_0 adalah benar," dan "kemungkinan melakukan kesalahan tipe I "adalah setara semua.

Tambahan komentar tentang uji statistik Semua hipotesis alternatif dipertimbangkan dalam Bagian 6.4 adalah satu-sisi hipotesis. Untuk iilustration, dalam Latihan 6,42 kita diuji H_0: θ = 30.000 terhadap H_1 alternatif satu sisi:> θ 30.000, di mana θ adalah mean dari distribusi normal yang memiliki deviasi standar σ = 5000. Pengujian yang terkait dengan situasi ini, yaitu menolak H_0 jika dan hanya jika mean sampel X c ≥, adalah uji satu sisi. Untuk kenyamanan, kami sering menyebutnya H_0: θ = 30.000 hipotesis nol karena, seperti dalam latihan ini, ini menunjukkan bahwa proses baru tidak berubah mean dari distribusi. Artinya, proses baru telah digunakan tanpa konsekuensi jika ternyata masih sama dengan rata-rata 30.000, maka hipotesis nol terminologi yang tepat. Jadi dalam Latihan 6,42 kita menguji hipotesis nol sederhana terhadap alternatif satu sisi komposit dengan uji satu sisi. Hal ini menunjukkan bahwa mungkin ada hipotesis alternatif dua sisi. Untuk ilustrasi, dalam Latihan 6,42, kira ada kemungkinan bahwa proses baru akan menurun rata-rata. Artinya, mengatakan bahwa kita tidak tahu apakah dengan proses baru θ> 30.000 atau θ <30.000, atau belum ada perubahan dan H_0 hipotesis nol: θ = 30.000 masih benar. Kemudian kita bisa ingin menguji H_0: θ = 30.000 terhadap H_1 alternatif dua sisi: θ ≠ 30.000. Untuk membantu melihat bagaimana membangun uji dua sisi untuk H_0 melawan H_1, mempertimbangkan argumen berikut. Dalam berurusan dengan uji H_0: θ = 30.000 terhadap θ alternatif satu sisi> 30.000, kami menggunakan X c ≥ atau, sama, Z = (X -30, 000) / (σ / √ n) ≥ (c-30, 000) / (σ / √ n) = c_1, mana karena X adalah N (θ = 30.000, σ ^ 2 / n) di bawah H_0, Z adalah N (0,1), dan kita bisa pilih c_1 = 1,645 memiliki uji tingkat signifikansi α = 0,05. Artinya, jika X adalah 1,645 σ / √ n lebih besar dari mean θ = 30.000, kita akan menolak H_0 dan menerima H_1 dan tingkat signifikansi akan sama dengan α = 0,05. Untuk menguji H_0: θ = 30.000 terhadap H_1: ≠ θ 30.000, marilah kita lagi menggunakan X melalui Z dan menolak H_0 jika X atau Z terlalu besar atau terlalu kecil. Yakni, jika kita menolak H_0 dan menerima H_1 ketika | Z | = | (X -30, 000) / (σ / √ n) | ≥ 1,96, tingkat signifikansi α = 0,05 karena ini adalah probabilitas | Z | ≥ 1,96 ketika H_0 adalah benar. Sangat menarik untuk dicatat bahwa uji terakhir ini setara dengan mengatakan bahwa kita menolak H_0 dan menerima H_1 jika 30.000 tidak pada interval kepercayaan (dua sisi) untuk θ mean. Atau dengan kata lain, jika X -1,96 σ / √ n <30.000 <X 1,96 σ / √ n, kemudian kita menerima H_0: θ = 30.000 karena kedua kesenjangan tersebut setara dengan | (X -30, 000) / (σ / √ n) | <1,96, yang mengarah pada penerimaan H_0: θ = 30.000. Begitu kita menyadari hal ini hubungan antara interval kepercayaan dan uji hipotesis, kita dapat menggunakan semua statistik yang digunakan untuk membangun interval kepercayaan untuk menguji hipotesis, tidak hanya terhadap alternatif dua sisi tapi onesas satu sisi baik. Tanpa daftar semua tesis dalam tabel. Kami memberikan cukup dari mereka sehingga yang pada dasarnya dapat dipahami. Contoh 1. Biarkan X dan S ^ 2 adalah mean dan varians dari sampel acak berukuran n yang berasal dari N (μ, σ ^ 2). Untuk menguji, pada tingkat signifikansi α = 0,05 H_0: μ = μ_0 terhadap dua sisi alternatif H_1: μ_0 ≠ μ, menolak jika | T | = | (X -μ_0) / (S / √ (n-1)) | ≥ b,

di mana b adalah persentil 97.5th dari distribusi-¬ t dengan n - 1 derajat kebebasan. Contoh 2. Biarkan sampel acak independen diambil dari N (μ_1, σ ^ 2) dan N (μ_2, σ ^ 2), respectlively. Katakanlah ini memiliki karakteristik masing-masing sampel n, X , S_1 ^ 2 dan m, Y , S_1 ^ 2. Pada α = 0,05, menolak H_0: μ_1 μ_2 = dan menerima alternatif satu sisi H_1:> μ_2 μ_1 jika T = ( X-Y-0) / √ ((NS 〖〗 mS _1 ^ 2 + 〖〗 _2 ^ 2) / (n + m-2) (1 / n +1 / m)) ≥ c. Perhatikan bahwa X-Y memiliki distribusi normal dengan mean nol bawah H_0. Jadi c adalah diambil sebagai persentil ke-95 dari suatu distribusi-t dengan n + m - 2 derajat kebebasan untuk memberikan α = 0,05.

Contoh 3. Katakanlah Y b (n, p). Untuk menguji H_0: p = p_0 terhadap H_1: p <p_0, kami menggunakan baik Z_1 = ((Y / n)-p_0) / √ ((p_0 (1-p_0)) / n) ≤ c atau Z_2 = ((Y / n)-p_0) / √ ((Y / n) ((1 -Y) / n) / n) ≤ c Jika n adalah besar, baik Z_1 dan Z_2 memiliki perkiraan distribusi normal standar yang disediakan bahwa H_0: p = p_0 benar. Oleh karena itu c dianggap -1,645 untuk memberikan tingkat signifikansi perkiraan α = 0,05. Beberapa statisticans menggunakan Z_2 Z_1 dan lainlain. Kami tidak memiliki preferensi yang kuat salah satu cara atau yang lain karena kedua metode memberikan tentang hasil numerik yang sama. Sebagai salah satu duga, menggunakan Z_1 memberikan probabilitas yang lebih baik untuk perhitungan daya jika p benar adalah dekat dengan p_0 sementara Z_2 lebih baik jika H_0 jelas palsu. Namun, dengan hipotesis alternatif dua sisi, Z_2 tidak memberikan hubungan yang lebih baik dengan interval kepercayaan untuk p. Artinya, | Z_2 | <2 setara dengan p_0 berada di interval dari Y/n-2 √ ((Y / n) ((1-Y) / n) / n) ke Y / n + 2 √ ((Y / n) ((1-Y) / n) / n) yang merupakan interval yang memberikan 95,4 persen interval kepercayaan untuk p sebagaimana dipertimbangkan dalam Bagian 6.2. Pada penutupan bagian ini, kami memperkenalkan konsep tes acak dan-p nilai melalui contoh dan komentar yang mengikuti contoh. Contoh 4. Biarkan X_1, X_2, ⋯ 〖, X〗 _10 menjadi sampel acak berukuran n = 10 dari distribusi Poisson dengan mean θ. Sebuah daerah kritis untuk H_0 pengujian: θ = 0,1 terhadap H_1: θ> 0,1 diberikan oleh Y = Σ_ (i = 1) ^ 10 ▒ 〖X_i ≥ 3〗. Statistik Y memiliki distribusi Poisson dengan 10θ berarti. Jadi, dengan θ-0,1 sehingga rata-rata Y adalah 1, tingkat signifikansi dari tes ini adalah Pr ⁡ (Y ≥ 3) = ⁡ 1-Pr (Y ≤ 2) = 1-0,920 = 0,080. Jika daerah kritis didefinisikan oleh Σ_1 ^ 10 ▒ 〖x_i ≥ 4〗 digunakan, tingkat signifikansi α = Pr ⁡ (Y ≥ 4) = 1-Pr ⁡ (Y ≤ 3) = 1-0,981 = 0,019. Jika tingkat signifikansi sekitar α = 0,05, mengatakan, yang diinginkan, statistik sebagian besar akan menggunakan salah satu tes, yaitu, mereka akan menyesuaikan tingkat signifikansi dengan salah satu tes ini nyaman. Namun, tingkat signifikansi α = 0,05 dapat dicapai tepat dengan menolak H_0 jika Σ_1 ^ 10 ▒ 〖x_i ≥ 4〗 atau jika Y = Σ_ (i = 1) ^ 10 ▒ 〖x_i = 3〗 dan bantu independen percobaan acak menghasilkan "sukses," di mana kemungkinan keberhasilan dipilih harus sama dengan

(0.050-0.019) / (0.080-0.019) = 31/61. Hal ini disebabkan oleh fakta bahwa, ketika θ = 0,1 sehingga rata-rata Y adalah 1. Pr ⁡ (Y ≥ 4) + Pr ⁡ (Y = 3 dan sukses) = 0,019 + Pr ⁡ (Y = 3) Pr ⁡ (sukses) = 0.019 + (0,061) 31/61 = 0,05. Proses melakukan percobaan tambahan untuk memutuskan apakah akan menolak atau tidak saat Y = 3 kadang-kadang disebut sebagai tes secara acak. Keterangan. Tidak banyak statisticans seperti tes acak dalam prakteknya, karena penggunaan mereka berarti bahwa dua statisticans bisa membuat assumpstions sama. Perhatikan data yang sama. Menerapkan pengujian yang sama, dan belum membuat keputusan yang berbeda. Oleh karena itu mereka biasanya menyesuaikan tingkat signifikansi mereka agar tidak mengacak. Sebagai soal fakta, banyak statisticans melaporkan apa yang umumnya disebut nilai p 0,080. Artinya, nilai p adalah yang diamati "ekor" probabilitas statistik yang setidaknya ekstrim sebagai nilai yang diamati khususnya ketika H_0 adalah benar. Oleh karena itu, lebih umum, jika Y = u (X_1, X_2, ⋯, X_n) adalah statistik yang akan digunakan dalam uji H_0 dan jika daerah kritis adalah dalam bentuk u (x_1, x_2, ⋯, x_n) ≤ c. sebuah u nilai yang diamati (x_n x_1, x_2, ⋯,) = d akan berarti bahwa p-values = Pr ⁡ (Y ≤ d; H_0). Artinya, jika G (y) adalah fungsi distribusi u = Y (X_1, X_2, ⋯, X_n), asalkan H_0 benar, nilai p sama dengan G (d) dalam hal ini. Namun, G (Y), dalam kasus kontinu, terdistribusi secara seragam pada interval unit, sehingga nilai sebuah G diamati (d) ≤ 0,05 akan setara dengan memilih c, sehingga Pr ⁡ [u (X_n X_1, X_2, ⋯,) ≤ c; H_0] = 0,05 dan mengamati bahwa d ≤ c. Kebanyakan program komputer secara otomatis mencetak p-nilai ujian. Contoh 5. Biarkan X_1, X_2, ⋯ 〖, X〗 _25 menjadi sampel acak dari N (μ, σ ^ 2 = 4). Untuk menguji H_0: μ = 77 melawan hipotesis alternatif satu sisi H_1: μ <77, katakanlah kita mengamati 25 nilai-nilai dan menentukan bahwa x = 7,61. Varians dari X adalah σ ^ 2 / n = 4 / 25 = 0,16, sehingga kita tahu bahwa Z = ((X -77)) / 0.4 adalah N (0,1) dengan ketentuan bahwa μ = 77. Karena nilai yang diamati dari statistik uji z = ((76,1-77)) / 0.4 =- -2,25, P-value dari uji adalah Φ (-2,25) = 1-0,988 = 0,012. Oleh karena itu, jika kita menggunakan tingkat signifikansi α = 0,05, kita akan menolak H_0 dan menerima H_1: μ <77 karena 0,012 <0,05.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->