P. 1
Upload_Dasar Konsep Dalam Statistik

Upload_Dasar Konsep Dalam Statistik

|Views: 69|Likes:
Published by widisulistiono

More info:

Published by: widisulistiono on Aug 10, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

12/17/2012

pdf

text

original

Dasar Konsep dalam Statistik Ikhtisar Apa Variabel?

Variabel adalah hal-hal yang kita mengukur, mengendalikan, atau memanipulasi dalam penelitian. Mereka berbeda dalam banyak hal, terutama dalam peran mereka diberikan dalam penelitian kami dan jenis tindakan yang dapat diterapkan kepada mereka. Korelasional vs Eksperimental Penelitian Sebagian besar penelitian empiris jelas milik salah satu dari dua kategori umum. Dalam penelitian korelasional, kita tidak (atau setidaknya mencoba untuk tidak) mempengaruhi setiap variabel tetapi hanya mengukur mereka dan mencari hubungan (korelasi) antara beberapa set variabel, seperti tekanan darah dan tingkat kolesterol. Dalam penelitian eksperimental, kita memanipulasi beberapa variabel dan kemudian mengukur efek dari manipulasi ini pada variabel lainnya. Sebagai contoh, seorang peneliti artifisial dapat meningkatkan tekanan darah dan tingkat kolesterol kemudian merekam. Analisis data dalam penelitian eksperimental juga turun untuk menghitung "korelasi" antara variabel, khususnya, mereka dimanipulasi dan mereka yang terkena manipulasi. Namun, data eksperimen berpotensi dapat memberikan informasi kualitatif yang lebih baik: hanya data eksperimen secara meyakinkan dapat menunjukkan hubungan kausal antara variabel. Sebagai contoh, jika kita menemukan bahwa setiap kali kita mengubah variabel A berubah B maka variabel, maka kita dapat menyimpulkan bahwa "Sebuah mempengaruhi B." Data dari penelitian korelasional hanya dapat "ditafsirkan" dalam hal kausal didasarkan pada beberapa teori yang kita miliki, tetapi data korelasional tidak bisa meyakinkan membuktikan kausalitas. Dependent Variabel Independen vs Variabel independen adalah mereka yang dimanipulasi sedangkan variabel dependen hanya diukur atau terdaftar. Perbedaan ini muncul terminologically membingungkan banyak, karena, karena beberapa siswa mengatakan, "semua variabel tergantung pada sesuatu." Namun, setelah Anda terbiasa dengan perbedaan ini, menjadi sangat diperlukan. Istilah variabel dependen dan independen berlaku terutama untuk penelitian eksperimental di mana beberapa variabel yang dimanipulasi, dan dalam pengertian ini mereka adalah "independen" dari pola reaksi awal, fitur, niat, dll dari mata pelajaran. Beberapa variabel lain yang diharapkan akan "bergantung" pada manipulasi atau kondisi eksperimental. Artinya, mereka bergantung pada "apa subjek yang akan dilakukan" di respon. Agak bertentangan dengan sifat perbedaan ini, istilah ini juga digunakan dalam studi di mana kita tidak benar-benar memanipulasi variabel independen, tetapi hanya menetapkan subjek untuk "kelompok eksperimental" berdasarkan beberapa pra-ada sifat dari subyek. Sebagai contoh, jika dalam sebuah eksperimen, laki-laki dibandingkan dengan perempuan tentang sel putih mereka count (WCC), gender bisa disebut variabel independen dan variabel dependen WCC. Pengukuran Timbangan Variabel berbeda dalam seberapa baik mereka dapat diukur, yaitu, dalam berapa banyak informasi terukur skala pengukuran mereka dapat menyediakan. Ada jelas beberapa kesalahan pengukuran yang terlibat dalam setiap pengukuran, yang menentukan jumlah informasi yang kita dapat memperoleh. Faktor lain yang menentukan jumlah informasi yang dapat diberikan oleh sebuah variabel jenisnya skala pengukuran. Secara khusus, variabel diklasifikasikan sebagai (a) nominal, (b) rasio ordinal, (c) Interval, atau (d). Variabel nominal memungkinkan hanya klasifikasi kualitatif. Artinya, mereka dapat

yang diukur dalam derajat Fahrenheit atau Celcius. suhu. ordinal.diukur hanya dari segi apakah setiap item milik beberapa kategori khas yang berbeda. sebagai skala temperatur Kelvin adalah skala rasio. mereka adalah ras yang berbeda). cara baik melibatkan hubungan antara variabel. Kebanyakan prosedur analisis data statistik tidak membedakan antara interval dan rasio sifat dari skala pengukuran. Sebagai contoh. kita dapat mengatakan bahwa pengukuran nominal menyediakan informasi pengukuran kurang dari ordinal. ras. namun kami tidak dapat mengatakan "betapa kurang" atau bagaimana perbedaan ini sebanding dengan perbedaan antara skala ordinal dan interval. Penelitian korelasional melibatkan pengukuran hubungan tersebut dalam cara yang paling . Contoh umum variabel-variabel nominal adalah gender. Misalnya. tetapi juga untuk mengukur dan membandingkan ukuran perbedaan antara mereka. kemajuan ilmu pengetahuan harus selalu melibatkan menemukan hubungan baru antara variabel. Tinggi terkait dengan Berat karena. Dengan demikian. tetapi tetap saja mereka tidak mengizinkan kita untuk mengatakan "berapa banyak lagi. tapi kita tidak bisa mengukur atau bahkan urutan peringkat kategori tersebut. mereka fitur titik nol diidentifikasi mutlak. Variabel rasio sangat mirip dengan variabel interval. nilai-nilai dari variabel tersebut akan didistribusikan secara konsisten. Skala interval tidak memiliki properti rasio. ini perbedaan yang sangat antara skala nominal. Misalnya. dalam sampel pengamatan. biasanya. Mengapa Hubungan antara Variabel Penting Secara umum. warna. Juga. di samping semua sifat-sifat variabel interval." Sebuah contoh khas dari variabel ordinal adalah status sosial ekonomi keluarga. Dengan kata lain. atau sebaliknya. kita benar dapat menyatakan bahwa itu adalah dua kali lebih tinggi. orang tinggi lebih berat daripada yang pendek. Misalnya. Kita dapat mengatakan bahwa suhu 40 derajat lebih tinggi dari suhu 30 derajat. Filsafat ilmu pengetahuan mengajarkan kita bahwa tidak ada cara lain yang mewakili "makna" kecuali dalam hal hubungan antara beberapa kuantitas atau kualitas. tapi kita tidak bisa mengatakan mana yang "memiliki lebih" dari kualitas diwakili oleh variabel. kota. IQ berhubungan dengan Jumlah Kesalahan dalam tes jika orang dengan IQ yang lebih tinggi kita membuat lebih sedikit kesalahan. dan bahwa peningkatan 20 sampai 40 derajat dua kali lebih banyak sebagai peningkatan dari 30 sampai 40 derajat. dapat kita katakan adalah bahwa dua individu yang berbeda dalam hal variabel A (misalnya. Sebagai contoh. dua atau lebih variabel yang terkait jika. Interval variabel memungkinkan kita tidak hanya untuk peringkat urutan item yang diukur. Hubungan antara Variabel Terlepas dari jenis mereka. 18% lebih tinggi. Gender dan WCC akan dianggap terkait jika laki-laki yang paling memiliki WCC tinggi dan betina yang paling WCC rendah. Contoh umum skala rasio adalah ukuran waktu atau ruang. dan interval itu sendiri merupakan contoh yang baik dari variabel ordinal. misalnya. tidak hanya dapat kita katakan bahwa suhu 200 derajat lebih tinggi dari satu dari 100 derajat. dll Variabel ordinal memungkinkan kita untuk peringkat memesan item kita mengukur dalam hal yang kurang dan yang memiliki lebih dari kualitas diwakili oleh variabel. Sebagai contoh. dengan demikian. kita tahu bahwa menengah-atas lebih tinggi dari tengah tapi kita tidak bisa mengatakan bahwa itu adalah. variabel yang terkait jika nilai-nilai mereka sistematis sesuai dengan satu sama lain untuk pengamatan ini. tujuan akhir dari setiap analisis penelitian atau ilmiah adalah menemukan hubungan antara variabel. mereka mengijinkan untuk laporan seperti x adalah dua kali lebih dari y. merupakan suatu skala interval.

semakin sedikit kita bisa percaya bahwa hubungan yang diamati antara variabel dalam sampel merupakan indikator yang dapat diandalkan hubungan antara variabel masing-masing dalam populasi. yaitu. Namun. Besarnya (atau "ukuran"). Lebih teknis. kita bisa mengatakan bahwa signifikansi statistik dari hasil memberitahu kita sesuatu tentang sejauh mana hasilnya adalah "benar" (dalam arti yang "mewakili populasi").mudah. penelitian eksperimental tidak berbeda dalam hal ini. 1 / 20) menunjukkan bahwa ada kemungkinan 5% bahwa hubungan antara variabel-variabel yang ditemukan dalam sampel kami adalah "kebetulan." Dengan kata lain. kita bisa mengatakan bahwa besarnya hubungan antara dua variabel (Gender dan WCC) yang sangat tinggi dalam sampel kita. kita bisa berharap bahwa sekitar dalam setiap 20 ulangan percobaan akan ada di mana relasi antara . dengan asumsi bahwa dalam populasi itu tidak ada hubungan antara variabel-variabel apapun. kami tertarik dalam sampel hanya sejauh dapat memberikan informasi tentang populasi. tapi masih sangat penting. nilai dari nilai p-merupakan indeks penurunan keandalan hasil (lihat Brownlee. Dengan kata lain. dan bahwa dalam populasi dari mana sampel tersebut diambil.05 (yaitu. lihat berikutnya ayat). percobaan yang disebutkan di atas membandingkan WCC pada laki-laki dan perempuan dapat digambarkan sebagai mencari korelasi antara dua variabel: Gender dan WCC. Menggunakan istilah teknis kurang. Ingatlah bahwa kita hampir tidak pernah "pada akhirnya" hanya tertarik pada apa yang terjadi di sampel kami. Semakin tinggi nilai p. p-nilai 0. sebagai "wakil dari populasi. antara berarti) dalam sampel terjadi secara kebetulan murni ("keberuntungan menarik"). maka keandalan dari hubungan antara variabel yang diamati dalam sampel kami dapat diperkirakan dan mewakili kuantitatif menggunakan ukuran standar (secara teknis disebut nilai p atau tingkat signifikansi statistik. ia mengatakan bagaimana kemungkinan itu adalah bahwa hubungan yang sama akan ditemukan jika percobaan diulang dengan sampel lainnya yang diambil dari populasi yang sama. Jika penelitian kami memenuhi beberapa kriteria tertentu (yang akan disebutkan nanti). antara variabel) atau perbedaan (misalnya. Keandalan dari suatu relasi adalah konsep yang jauh kurang intuitif. Dua Dasar Fitur Setiap Hubungan antara Variabel Dua sifat formal yang paling dasar dari setiap hubungan antara variabel (a) besarnya hubungan (atau "ukuran") dan (b) kehandalan (atau "kebenaran"). Statistik tidak apa-apa lagi tetapi membantu kita mengevaluasi hubungan antara variabel. Misalnya. Sebagai contoh. nilai p merepresentasikan probabilitas kesalahan yang terlibat dalam menerima hasil pengamatan kami sebagai yang valid. Secara khusus." Sebagai contoh. Untuk indeks Apa itu "Signifikansi statistik" (nilai p)? Signifikansi statistik dari hasil adalah probabilitas bahwa hubungan yang diamati (misalnya. Hal ini berkaitan dengan "keterwakilan" dari hasil yang ditemukan dalam sampel tertentu kami untuk seluruh penduduk. Sebenarnya. semua dari ratusan prosedur yang dijelaskan dalam buku online dapat ditafsirkan dalam mengevaluasi berbagai macam hubungan antar-variabel. Besarnya jauh lebih mudah untuk memahami dan mengukur dari keandalan. tidak ada hubungan atau ada perbedaan. Keandalan (atau "kebenaran"). Dengan kata lain. kita bisa memprediksi yang didasarkan pada lain (setidaknya di antara anggota sampel kami). dan kami mengulangi eksperimen seperti kita satu demi satu. jika setiap laki-laki dalam sampel kami adalah ditemukan memiliki WCC lebih tinggi daripada perempuan dalam sampel. 1960).

005 atau p . dalam sampel dari suatu ukuran tertentu. di banyak. Mengapa Hubungan kuat antara Variabel Lebih Signifikan Dengan asumsi bahwa tidak ada hubungan antara variabel-variabel masing- . pemilihan beberapa tingkat signifikansi. jika Anda menghitung korelasi antara variabel sepuluh (yaitu. Lihat juga. satu dari setiap 20) koefisien korelasi yang signifikan pada tingkat 0.05 lazim diperlakukan sebagai "garis batas yang diterima" tingkat kesalahan. Hasil yang signifikan pada tingkat 0.05 p. dengan demikian. terserah kepada peneliti untuk hati-hati mengevaluasi keandalan temuan tak terduga. mereka tidak sepenuhnya independen. bahkan jika nilai dari variabel-variabel yang benar-benar acak dan variabel tersebut tidak berkorelasi dalam populasi. Namun. ketika ada hubungan antara variabel dalam populasi. hasil ilmu yang menghasilkan p . kita dapat berharap untuk meniru hasil 5% dari waktu atau 95% dari waktu. Oleh karena itu. Dalam prakteknya. informasi yang relevan juga dapat ditemukan dalam buku teks penelitian metode yang paling. metode statistik banyak (terutama eksplorasi sederhana analisa data) tidak menawarkan solusi mudah untuk masalah ini. (Catatan bahwa ini tidak sama dengan mengatakan bahwa. Banyak contoh dalam buku teks online menawarkan saran spesifik tentang bagaimana untuk melakukan ini. Namun. Secara umum. probabilitas mereplikasi studi dan menemukan hubungan yang berkaitan dengan kekuatan statistik dari desain. Biasanya." Artinya. Tapi ingat bahwa klasifikasi tidak lain merupakan konvensi yang sewenang-wenang yang hanya informal berdasarkan pengalaman penelitian umum. Analisis Daya). Kekuatan vs Keandalan dari Hubungan antara Variabel Kami mengatakan sebelumnya bahwa kekuatan dan keandalan adalah dua fitur yang berbeda dari hubungan antara variabel. Beberapa metode statistik yang melibatkan banyak perbandingan dan. p-nilai . semakin besar besarnya hubungan antara variabel. dan pada "tradisi" yang ada di daerah tertentu dari penelitian. 001 tingkat sering disebut "sangat" signifikan. mengingat bahwa ada IS hubungan antara variabel. tetapi ingat bahwa ini tingkat signifikansi masih melibatkan probabilitas kesalahan cukup tinggi (5%). Signifikansi statistik dan Jumlah Analisis Dilakukan Tak perlu dikatakan. 45 koefisien korelasi yang berbeda). Bagaimana Menentukan bahwa Hasil adalah "Benar" Signifikan Tidak ada cara untuk menghindari kesewenang-wenangan dalam keputusan akhir untuk apa tingkat signifikansi akan diperlakukan sebagai benar-benar "signifikan. pada jumlah total bukti yang mendukung yang konsisten di set seluruh data. kesempatan baik untuk kesalahan tersebut termasuk beberapa "koreksi" atau penyesuaian untuk jumlah total perbandingan. hasil yang lebih akan bertemu "secara kebetulan" tingkat signifikansi konvensional. Dalam banyak bidang penelitian. analisis yang lebih Anda lakukan pada satu set data.05 dianggap batas statistik signifikan. dan p 0. Misalnya. sampai yang hasilnya akan ditolak sebagai tidak sah. keputusan akhir biasanya tergantung pada apakah hasilnya diperkirakan apriori atau hanya ditemukan post hoc dalam perjalanan banyak analisis dan perbandingan dilakukan pada kumpulan data. hubungan yang lebih dapat diandalkan (lihat paragraf berikutnya).variabel dalam pertanyaan akan sama atau lebih kuat dari pada kita.01 p biasanya dianggap signifikan secara statistik. sewenang-wenang. maka Anda harus berharap untuk menemukan secara kebetulan bahwa sekitar dua (yaitu.

tetapi sebagai penelitian menunjukkan. maka probabilitas bahwa kita akan menemukan. namun. tidak begitu jelas bagi orang awam: itu jauh lebih mungkin terjadi di rumah sakit kecil. atau sebaliknya. Contoh: Bayi Laki Rasio Bayi Cewek Pertimbangkan contoh ini dari penelitian pada penalaran statistik (Nisbett. probabilitas seperti hasil secara kebetulan akan praktis nol. semakin kuat hubungan yang ditemukan dalam sampel. Perhatikan ilustrasi berikut. dkk. dan kita bisa menghitung signifikansi dari besarnya dan sebaliknya. Mengapa Hubungan Kecil Dapat Terbukti Signifikan Hanya dalam Sampel Besar . probabilitas secara kebetulan kombinasi dari nilai-nilai menunjukkan hubungan yang kuat adalah relatif tinggi. Alasan untuk ini adalah bahwa secara teknis. maka ada juga kemungkinan kombinasi masing-masing beberapa nilai-nilai variabel dan. ada kesempatan satu-dalamdelapan bahwa kedua laki-laki akan memiliki WCC yang tinggi dan kedua perempuan dengan WCC rendah. sebagian besar percobaan akan menghasilkan hasil mendekati 0. semakin kecil kemungkinan itu adalah bahwa tidak ada hubungan yang sesuai dalam populasi. Secara khusus. menurun dengan meningkatnya ukuran sampel.. jika kita mulai mereplikasi percobaan sederhana dengan menggambar pasang sampel (laki-laki dan perempuan) dari ukuran tertentu dari populasi ini dan menghitung perbedaan antara WCC rata-rata dalam setiap pasangan sampel. karena hubungan dari kekuatan yang diberikan dapat berupa yang sangat signifikan atau tidak signifikan sama sekali. dua kali lebih banyak bayi perempuan dilahirkan sebagai bayi laki-laki. Ada dua rumah sakit: di pertama. sepasang sampel akan diambil di mana perbedaan antara pria dan wanita akan sangat berbeda dari 0. yang dalam hal ini akan menjadi hasil menunjukkan adanya hubungan antara Gender dan WCC diperoleh dari populasi yang seperti relasi tidak tidak ada. 1987). Sekarang mempertimbangkan probabilitas seperti cocok secara kebetulan jika sampel kita terdiri dari 100 subjek. satu hari. kemungkinan penyimpangan acak dari ukuran tertentu (dari rata-rata populasi). Jadi. ini benar hanya jika ukuran sampel dipertahankan konstan. Namun. murni secara kebetulan. dari waktu ke waktu. di salah satu rumah sakit. Rata-rata. besarnya dan pentingnya relasi tampaknya terkait erat. tergantung pada ukuran sampel (lihat paragraf berikutnya). semakin besar kemungkinan bahwa kita akan memperoleh hasil yang salah tersebut.masing dalam populasi. rasio bayi laki-laki untuk bayi perempuan lahir setiap hari di setiap rumah sakit adalah 50/50. Mengapa Signifikansi dari Hubungan antara Variabel Tergantung pada Ukuran Sampel Jika ada pengamatan sangat sedikit. hanya 12. dengan demikian. hasil yang paling mungkin akan juga menemukan ada hubungan antara variabel-variabel dalam sampel penelitian. Namun. dan hanya ada empat subjek dalam sampel kami (dua laki-laki dan dua perempuan). Tak perlu dikatakan. Seperti yang Anda lihat. Jika kita tertarik pada dua variabel (Jenis Kelamin: laki / perempuan dan WCC: tinggi / rendah). hubungan 100% antara dua variabel dapat setinggi seperdelapan. Mari kita lihat contoh yang lebih umum. Di mana rumah sakit lebih mungkin terjadi? Jawabannya adalah jelas untuk statistik. 120 bayi lahir setiap hari. Bayangkan populasi teoritis di mana nilai rata-rata WCC pada pria dan wanita adalah persis sama. Seberapa sering itu terjadi? Ukuran sampel kecil dalam percobaan masing-masing. di sisi lain.

diikuti dengan satu prinsip umum: mereka berusaha entah bagaimana mengevaluasi hubungan diamati dengan membandingkan ke "hubungan dibayangkan maksimum" antara variabel tertentu. maka dapat ditemukan sangat signifikan bahkan dalam studi berdasarkan sampel yang sangat kecil. cara yang umum untuk melakukan evaluasi tersebut adalah untuk melihat bagaimana membedakan nilai-nilai dari variabel. Analog. Namun. yang dianggap besar tak berhingga. Berbicara kurang teknis. kemudian sepuluh lemparan tidak akan cukup untuk meyakinkan orang bahwa koin tersebut asimetris bahkan jika hasilnya diperoleh (enam kepala dan empat ekor) sempurna mewakili bias dari koin. jika hubungan yang dimaksud adalah "obyektif" yang sangat besar. jika sebuah relasi besar. Bagaimana Mengukur Besaran (Kekuatan) Hubungan antara Variabel Ada langkah-langkah sangat banyak dari besarnya hubungan antara variabelvariabel yang telah dikembangkan oleh ahli statistik. ia begitu bahwa 10 lemparan tidak cukup untuk membuktikan sesuatu? Tidak. dll Hampir semua mereka. pengukuran skala yang digunakan. Jika sebuah koin sedikit asimetris. Misalnya. Jadi. Untuk indeks Dapatkah "Hubungan Tidak" menjadi Hasil Signifikan? Semakin kecil hubungan antara variabel. agak lebih mungkin menghasilkan kepala dari ekor (misalnya.000001%! Jadi. bayangkan berapa banyak lemparan akan diperlukan untuk membuktikan bahwa suatu koin adalah asimetris jika bias hanya 0. bayangkan sekarang bahwa uang logam yang sangat asimetris bahwa tidak peduli bagaimana Anda melemparkan. secara definisi. kebanyakan orang akan mempertimbangkan bukti yang cukup bahwa ada sesuatu yang salah dengan koin. hasilnya akan kepala. maka dapat ditemukan signifikan bahkan dalam sampel kecil.Contoh dalam paragraf sebelumnya menunjukkan bahwa jika sebuah hubungan antara variabel yang dimaksud adalah "obyektif" (yaitu. Ketika besarnya efek mendekati 0. Jika Anda melemparkan seperti koin sepuluh kali dan masing-masing melemparkan kepala diproduksi. Bahkan jika sampel kami sebenarnya adalah "sempurna perwakilan. Sebagai contoh. namun. Artinya. Secara teknis. ukuran sampel minimum yang diperlukan meningkat sebagai besarnya efek yang akan menurun ditunjukkan. kita membandingkan "apa . akan ada kepala lebih dari ekor. maka ukuran sampel harus hampir sama dengan ukuran populasi. maka tidak ada cara untuk mengidentifikasi seperti hubungan dalam penelitian kecuali sampel penelitian adalah Sejalan besar. dalam populasi) kecil. dan kemudian menghitung bagian apa dari ini "pembedaan yang tersedia secara keseluruhan" dicatat oleh contoh ketika diferensiasi yang "umum" dalam dua (atau lebih) variabel dalam pertanyaan. semakin besar ukuran sampel yang diperlukan untuk membuktikannya signifikan. 60% vs 40%). sifat hubungan. Dengan kata lain. Pertimbangkan ini ilustrasi tambahan. itu akan dianggap bukti yang meyakinkan bahwa dalam populasi teoritis jumlah tak terbatas kali pelemparan koin ini. ukuran sampel yang diperlukan untuk meyakinkan membuktikan mendekati tak terhingga. pilihan ukuran tertentu dalam situasi yang diberikan tergantung pada jumlah variabel yang terlibat. Signifikansi statistik mewakili kemungkinan bahwa hasil yang sama akan diperoleh jika kita diuji seluruh penduduk. dan saat melempar. Dengan demikian. jika hampir tidak ada hubungan antara dua variabel. kemudian sepuluh lemparan bisa cukup." efek tidak akan signifikan secara statistik bila sampel kecil. dan ini juga mencakup semua "tidak ada hubungannya" hasil. jika efek tersebut cukup besar. segala sesuatu yang akan ditemukan setelah pengujian seluruh penduduk akan. signifikan pada tingkat setinggi mungkin.

000. Untuk indeks Umum "Format Umum" Pengujian statistik paling Karena tujuan akhir dari uji statistik yang paling adalah untuk mengevaluasi hubungan antara variabel. makna sebagian besar tergantung pada ukuran sampel. atau bahkan membalikkan arah perbedaan. Secara teknis. sedangkan pada . Dalam statistik." Secara khusus. deviasi dari masingmasing skor individu dari mean (101) mengandung komponen karena jenis kelamin subyek. perbedaan yang sama (dari 2) antara WCC rata-rata laki-laki dan perempuan ditemukan di studi ini akan menjelaskan suatu bagian kecil dari diferensiasi keseluruhan nilai yang paling mungkin akan dianggap diabaikan. Namun. Mari kita mengatakan bahwa dalam sampel kami. bagian variasi dalam satu variabel yang "dijelaskan" oleh nilai-nilai tertentu dari variabel lainnya. salah satu subyek yang lebih diperhitungkan bisa berubah. Sebagaimana dijelaskan sebelumnya. mereka mewakili rasio dari beberapa ukuran diferensiasi umum dalam variabel dalam pertanyaan untuk diferensiasi keseluruhan dari variabel tersebut. mereka mewakili rasio dari bagian diferensiasi keseluruhan nilai WCC yang dapat dipertanggungjawabkan oleh gender untuk diferensiasi keseluruhan nilai WCC. Misalnya. tes yang paling statistik mengikuti format umum yang dijelaskan dalam paragraf sebelumnya. yaitu. dan sebaliknya.000-1. Nilai yang. mewakili beberapa ukuran hubungan antara Gender dan WCC. adalah 40% dari varians menjelaskan antara dua variabel cukup untuk mempertimbangkan relasi yang signifikan? Jawabannya adalah "tergantung. variasi menjelaskan panjang tidak selalu berarti bahwa kita "secara konseptual memahami" itu. Gender adalah sempurna berkorelasi dengan WCC. Sebagai contoh. ukuran komponen ini adalah 1. Pertimbangkan dua kemungkinan ekstrim: Jika semua nilai WCC laki-laki setara tepat untuk 100 dan orang-orang perempuan sama dengan 102. yaitu 100% dari perbedaan yang diamati antara subjek tentang WCC mereka dicatat dengan gender mereka. Bagaimana "Tingkat Signifikansi statistik" adalah Dihitung Mari kita asumsikan bahwa kita telah menghitung ukuran hubungan antara dua variabel (seperti yang dijelaskan di atas). Jika skor WCC berada di kisaran 0.yang terjadi pada variabel-variabel" untuk "apa yang berpotensi telah umum jika variabel yang sempurna yang terkait. bahkan hubungan yang sangat kecil antara variabel akan signifikan. setiap tindakan yang baik hubungan antara variabel harus memperhitungkan diferensiasi keseluruhan nilai individu dalam sampel dan mengevaluasi hubungan dalam hal (relatif) berapa banyak diferensiasi ini dicatat oleh hubungan dalam pertanyaan. kita bisa mengatakan bahwa rata-rata. dalam sampel yang sangat besar. Jadi. Oleh karena itu." Mari kita pertimbangkan sebuah ilustrasi sederhana. Rasio ini biasanya disebut rasio variasi menjelaskan kepada variasi total. Kami akan mengatakan bahwa dalam sampel kami. nilai ini adalah ukuran yang sangat miskin karena tidak memberitahu kita bagaimana komponen ini relatif besar diberi "diferensiasi keseluruhan" skor WCC. dalam arti. maka semua penyimpangan dari mean dalam sampel kita akan sepenuhnya diperhitungkan berdasarkan gender. indeks rata-rata WCC adalah 100 pada laki-laki dan 102 perempuan. Pertanyaan berikutnya adalah "seberapa besar hubungan ini?" Sebagai contoh. Hal ini digunakan hanya untuk menunjukkan variasi umum dalam variabel dalam pertanyaan.

Jadi. nilai standar) dari 4." dan statusnya dapat dibandingkan dengan salah satu hukum dasar ilmu alam. Distribusi uji statistik banyak normal atau berikut beberapa bentuk yang dapat diperoleh dari distribusi normal. lebih dari 99. Anda dapat menjelajahi nilai yang tepat probabilitas yang terkait dengan nilai yang berbeda dalam distribusi normal dengan menggunakan Probabilitas alat Kalkulator interaktif. Mengapa "Distribusi Normal" adalah Penting "Distribusi normal" adalah penting karena dalam banyak kasus.0001. tergantung pada ukuran sampel. Meskipun hasil yang paling mungkin dari percobaan tersebut (satu pasang sampel per percobaan) adalah bahwa perbedaan antara rata-rata di WCC laki-laki dan perempuan dalam masingmasing pasangan mendekati nol. baik mendekati fungsi yang diperkenalkan dalam paragraf sebelumnya (untuk ilustrasi rinci. lihat Apakah Semua Statistik Uji Biasanya Terdistribusi?). mana pasang sampel laki-laki dan perempuan yang diambil dari suatu populasi di mana nilai rata-rata WCC pada laki-laki dan perempuan adalah persis sama. dibagi dengan standar deviasi. dari waktu ke waktu. probabilitas dihitung dengan Statistika akan kurang dari . sepasang sampel akan diambil dimana perbedaan antara pria dan wanita sangat berbeda dari 0. (Nilai Standar berarti bahwa sebuah nilai dinyatakan dalam perbedaan dari mean. secara filosofis. fungsi yang lebih kompleks dan tidak selalu persis sama. dan berbagai ± 2 standar deviasi mencakup 95% dari nilai. dalam banyak kasus kita tahu bentuk dan dapat menggunakannya untuk menentukan tingkat signifikansi untuk temuan kami dalam sampel dengan ukuran tertentu. dan itu akan memberitahu kami probabilitas kesalahan yang terlibat dalam menolak gagasan bahwa hubungan tersebut tidak ada dalam populasi. pengamatan yang memiliki nilai standar kurang dari -2 atau lebih dari 2 memiliki frekuensi relatif dari 5% atau kurang.) Jika Anda memiliki akses ke Statistika. Akan ideal jika fungsi probabilitas linier dan. Dengan kata lain.99 %) berada dalam kisaran ± standar deviasi 4. misalnya. misalnya.sampel yang sangat kecil bahkan hubungan yang sangat besar tidak dapat dianggap dapat diandalkan (signifikan). Sebuah properti karakteristik dari distribusi normal adalah bahwa 68% dari semua pengamatan yang berada dalam kisaran ± 1 standar deviasi dari mean. kita membutuhkan sebuah fungsi yang merupakan hubungan antara "besarnya" dan "signifikansi" hubungan antara dua variabel. yang disebut normal. Sebagian besar fungsi-fungsi ini terkait dengan tipe umum dari fungsi. Animasi di bawah ini menunjukkan daerah ekor yang terkait dengan nilai-nilai Z yang lain. hanya memiliki lereng yang berbeda untuk ukuran sampel yang berbeda." Dengan kata lain. namun. hasil ulangan tersebut "terdistribusi normal" (prinsip yang penting dijelaskan dan digambarkan . Ilustrasi Bagaimana Distribusi Normal Digunakan dalam Penalaran statistik (Induksi) Ingat contoh yang dibahas di atas. Dalam pengertian ini. karena dalam distribusi normal hampir semua pengamatan (yaitu. dalam distribusi normal. fungsi yang akan memberi kita signifikansi (p) tingkat. Seberapa sering hal itu terjadi? Jika ukuran sampel cukup besar. Sayangnya. distribusi normal merupakan salah satu dasar empiris diverifikasi "kebenaran tentang sifat umum dari realitas. Ini "alternatif" hipotesis (yang tidak ada hubungan dalam populasi) biasanya disebut hipotesis nol. dengan asumsi bahwa tidak ada hubungan seperti antara variabel-variabel dalam populasi. dalam rangka untuk menentukan tingkat signifikansi statistik. Bentuk yang tepat dari distribusi normal (karakteristik "kurva lonceng") didefinisikan oleh fungsi yang hanya memiliki dua parameter: mean dan deviasi standar. jika Anda memasukkan nilai Z (yaitu. Fungsi kita perlu memberi tahu kami sebenarnya "seberapa besar kemungkinan itu adalah untuk mendapatkan hubungan besarnya diberikan (atau lebih besar) dari sampel ukuran tertentu.

Pilihan yang terakhir ini didasarkan pada prinsip yang sangat penting yang sebagian besar bertanggung jawab untuk popularitas tes yang didasarkan pada fungsi normal. dengan demikian. . maka kita hanya memiliki satu pilihan: menyimpulkan bahwa hasil kami memberikan pendekatan yang lebih baik dari apa yang terjadi di dalam populasi daripada "hipotesis nol" (ingat bahwa hipotesis nol dianggap hanya untuk "alasan teknis" sebagai patokan terhadap yang mengakibatkan empiris kita dievaluasi). bahkan jika distribusi dari variabel yang bersangkutan tidak normal. Namun. karena ukuran sampel (sampel yang digunakan untuk membuat distribusi sampling dari mean) meningkat. Asumsi ini dibahas dalam paragraf berikutnya. tetapi ini sering tidak nyaman karena tes tersebut biasanya kurang kuat dan kurang fleksibel dalam hal jenis kesimpulan bahwa mereka dapat menyediakan. yaitu. istilah ini pertama kali digunakan oleh Fisher. Yakni. Pertama.dalam paragraf berikutnya) dan. 15. tes ini memerlukan bahwa variabel dianalisis itu sendiri biasanya didistribusikan dalam populasi. Biasanya. distribusi statistik dari sampel. bentuk distribusi yang "hampir" normal (lihat pertandingan penutupan sesuai dengan). Apakah Semua Statistik Uji Terdistribusi Biasanya? Tidak semua. Masalahnya mungkin terjadi ketika kita mencoba untuk menggunakan distribusi pengujian berbasis normal untuk menganalisis data dari variabel yang terdistribusi normal sendiri tidak (lihat tes normalitas di Nonparametrics atau ANOVA / MANOVA). 1928a) pendekatan bentuk normal. 5 10. F atau Chi-square." Banyak variabel yang diamati sebenarnya terdistribusi normal. mereka memenuhi apa yang disebut "asumsi normalitas. dalam banyak kasus kita masih bisa menggunakan uji distribusi berbasis normal jika kita hanya memastikan bahwa ukuran sampel kami cukup besar. tapi kebanyakan dari mereka yang baik didasarkan pada distribusi normal secara langsung atau distribusi yang terkait dengan dan dapat diturunkan dari normal. Nonparametrics). kita justru dapat menghitung probabilitas memperoleh "secara kebetulan" hasil yang mewakili berbagai tingkat penyimpangan dari populasi hipotetis ratarata 0. "distribusi sampling") adalah normal. Catatan bahwa ini penalaran seluruh didasarkan pada asumsi bahwa bentuk distribusi dari mereka "ulangan" (teknis. bentuk distribusi sampling (yaitu. yang merupakan alasan lain mengapa distribusi normal merupakan "fitur umum" dari realitas empiris. seperti t. distribusi nilai-nilai jelas miring. dengan meningkatnya ukuran sampel. dan 30) menggunakan variable yang jelas non-normal dalam populasi. Jika seperti probabilitas dihitung begitu rendah sehingga memenuhi kriteria sebelumnya diterima signifikansi statistik. Dalam kasus tersebut. yaitu. kita bisa menggunakan beberapa alternatif "nonparametrik" test (atau disebut "distribusi bebas tes" lihat. mengetahui bentuk kurva normal. bentuk distribusi sampling menjadi normal. kita memiliki dua pilihan umum. Atau. Prinsip ini diilustrasikan dalam animasi berikut ini menunjukkan serangkaian distribusi sampling (dibuat dengan secara bertahap meningkatkan ukuran sampel: 2. Perhatikan bahwa untuk n = 30.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->