You are on page 1of 17

Statistika

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas

Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan,


menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah
ilmu yang berkenaan dengan data.

Istilah 'statistika' (bahasa Inggris: statistics) berbeda dengan 'statistik' (statistic). Statistika
merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi,
atau hasil penerapan algoritma statistika pada suatu data.

Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau


mendeskripsikan data; ini dinamakan statistika deskriptif.

Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah
statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.

Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam (misalnya
astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi),
maupun di bidang bisnis, ekonomi, dan industri). Statistika juga digunakan dalam
pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu
prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah
prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum),
serta jajak cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi,
statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.Daftar
isi [sembunyikan]
1 Sejarah
1.1 Beberapa kontributor statistika
2 Konsep Dasar
3 Metode Statistika
3.1 Dua jenis penelitian: eksperimen dan survai
3.2 Tipe pengukuran
3.3 Teknik-teknik statistika
3.4 Statistika Terapan
4 Piranti lunak
5 Lihat pula
6 Referensi
7 Pranala luar
7.1 Situs umum dan organisasi
7.2 Kumpulan pranala
7.3 Pelajaran dan Buku Teks Online
7.4 Piranti Lunak Statistika
7.5 Sumber lainnya
[sunting]
Sejarah

Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin moderen
statisticum collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau
"politikus").

Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama
kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya
sebagai "ilmu tentang negara (state)". Pada awal abad ke-19 telah terjadi pergeseran arti
menjadi "ilmu mengenai pengumpulan dan klasifikasi data". Sir John Sinclair
memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi,
statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga
administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui
sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang
berubah setiap saat.

Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-
bidang dalam matematika, terutama probabilitas. Cabang statistika yang pada saat ini
sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi,
dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher
(peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William
Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada
masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai
dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-cabang
terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam metodologinya.
Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika, biometrika (atau
biostatistika), dan psikometrika.

Meskipun ada kubu yang menganggap statistika sebagai cabang dari matematika, tetapi
orang lebih banyak menganggap statistika sebagai bidang yang banyak terkait dengan
matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian
besar masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam
departemen tersendiri maupun tergabung dengan matematika.

[sunting]
Beberapa kontributor statistika
Carl Gauss
Blaise Pascal
Sir Francis Galton
William Sealey Gosset (dikenal dengan sebutan "Student")
Karl Pearson
Sir Ronald Fisher
Gertrude Cox
Charles Spearman
Pafnuty Chebyshev
Aleksandr Lyapunov
Isaac Newton
Abraham De Moivre
Adolph Quetelet
Florence Nightingale
John Tukey
George Dantzig
Thomas Bayes
Dr.Andi Hakim Nasution

Lihat juga Daftar ahli statistika.

[sunting]
Konsep Dasar

Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau sosial,


pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam statistika dapat
berarti populasi benda hidup, benda mati, ataupun benda abstrak. Populasi juga dapat
berupa pengukuran sebuah proses dalam waktu yang berbeda-beda, yakni dikenal dengan
istilah deret waktu.

Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan sensus. Sebuah


sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu, dalam statistika
seringkali dilakukan pengambilan sampel (sampling), yakni sebagian kecil dari populasi,
yang dapat mewakili seluruh populasi. Analisis data dari sampel nantinya digunakan
untuk menggeneralisasikan seluruh populasi.

Jika sampel yang diambil cukup representatif, inferensial (pengambilan keputusan) dan
simpulan yang dibuat dari sampel dapat digunakan untuk menggambarkan populasi
secara keseluruhan. Metode statistika tentang bagaimana cara mengambil sampel yang
tepat dinamakan teknik sampling.

Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya. Sedangkan


matematika statistika merupakan cabang dari matematika terapan yang menggunakan
teori probabilitas dan analisis matematis untuk mendapatkan dasar-dasar teori statistika.

Ada dua macam statistika, yaitu statistika deskriptif dan statistika inferensial. Statistika
deskriptif berkenaan dengan deskripsi data, misalnya dari menghitung rata-rata dan
varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau grafik sehingga
data mentah lebih mudah “dibaca” dan lebih bermakna. Sedangkan statistika inferensial
lebih dari itu, misalnya melakukan pengujian hipotesis, melakukan prediksi observasi
masa depan, atau membuat model regresi.
Statistika deskriptif berkenaan dengan bagaimana data dapat digambarkan
dideskripsikan) atau disimpulkan, baik secara numerik (misalnya menghitung rata-rata
dan deviasi standar) atau secara grafis (dalam bentuk tabel atau grafik), untuk
mendapatkan gambaran sekilas mengenai data tersebut, sehingga lebih mudah dibaca dan
bermakna.
Statistika inferensial berkenaan dengan permodelan data dan melakukan pengambilan
keputusan berdasarkan analisis data, misalnya melakukan pengujian hipotesis, melakukan
estimasi pengamatan masa mendatang (estimasi atau prediksi), membuat permodelan
hubungan (korelasi, regresi, ANOVA, deret waktu), dan sebagainya.

[sunting]
Metode Statistika

[sunting]
Dua jenis penelitian: eksperimen dan survai

Tujuan umum bagi suatu penelitian berbasis statistika adalah menyelidiki hubungan
sebab-akibat, dan lebih khusus menarik suatu simpulan akan perubahan yang timbul pada
peubah (atau variabel) respon (peubah dependen) akibat berubahnya peubah penjelas
(explanatory variables) (peubah independen).

Terdapat dua jenis utama penelitian: eksperimen dan survei. Keduanya sama-sama
mendalami pengaruh perubahan pada peubah penjelas dan perilaku peubah respon akibat
perubahan itu. Beda keduanya terletak pada bagaimana kajiannya dilakukan.

Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji, memberi


perlakuan terhadap sistem, dan kemudian melakukan pengukuran (lagi) dengan cara yang
sama terhadap sistem yang telah diperlakukan untuk mengetahui apakah perlakuan
mengubah nilai pengukuran. Bisa juga perlakuan diberikan secara simultan dan
pengaruhnya diukur dalam waktu yang bersamaan pula. Metode statistika yang berkaitan
dengan pelaksanaan suatu eksperimen dipelajari dalam rancangan percobaan (desain
eksperimen).

Dalam survai, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang dikaji. Data
dikumpulkan dan hubungan (korelasi) antara berbagai peubah diselidiki untuk memberi
gambaran terhadap objek penelitian. Teknik-teknik survai dipelajari dalam metode survei.

Penelitian tipe eksperimen banyak dilakukan pada ilmu-ilmu rekayasa, misalnya teknik,
ilmu pangan, agronomi, farmasi, pemasaran (marketing), dan psikologi eksperimen.

Penelitian tipe observasi paling sering dilakukan di bidang ilmu-ilmu sosial atau
berkaitan dengan perilaku sehari-hari, misalnya ekonomi, psikologi dan pedagogi,
kedokteran masyarakat, dan industri.

[sunting]
Tipe pengukuran

Ada empat tipe pengukuran atau skala pengukuran yang digunakan d dalam statistika,
yakni: nominal, ordinal, interval, dan rasio. Keempat skala pengukuran tersebut memiliki
tingkat penggunaan yang berbeda dalam riset statistik. Skala nominal hanya bisa
membedakan sesuatu yang bersifat kualitatif (misalnya: jenis kelamin, agama, warna
kulit). Skala ordinal selain membedakan juga menunjukkan tingkatan (misalnya:
pendidikan, tingkat kepuasan). Skala interval berupa angka kuantitatif namun tidak
memiliki nilai nol mutlak (misalnya: tahun, suhu dalam Celcius). Sedangkan skala rasio
berupa angka kuantitatif yang memiliki nilai nol mutlak.

[sunting]
Teknik-teknik statistika

Beberapa pengujian dan prosedur yang banyak digunakan dalam penelitian antara lain:
Analisis regresi dan korelasi
Analisis varians (ANOVA)
khi-kuadrat
Uji t-Student

[sunting]
Statistika Terapan

Bebebarapa ilmu pengetahuan menggunakan statistika terapan sehingga mereka memiliki


terminologi yang khusus. Disiplin ilmu tersebut antara lain:
Aktuaria (penerapan statistika dalam bidang asuransi)
Biostatistika atau biometrika (penerapan statistika dalam ilmu biologi)
Statistika bisnis
Ekonometrika
Psikometrika
Statistika sosial
Statistika teknik atau teknometrika
Fisika statistik
Demografi
Eksplorasi data (pengenalan pola)
Literasi statistik
Analisis proses dan kemometrika (untuk analisis data kimia analis dan teknik kimia)

Statistika memberikan alat analisis data bagi berbagai bidang ilmu. Kegunaannya
bermacam-macam: mempelajari keragaman akibat pengukuran, mengendalikan proses,
merumuskan informasi dari data, dan membantu pengambilan keputusan berdasarkan
data. Statistika, karena sifatnya yang objektif, sering kali merupakan satu-satunya alat
yang bisa diandalkan untuk keperluan-keperluan di atas.

[sunting]
Piranti lunak
Perhitungan statistika modern banyak dilakukan oleh komputer, dan bahkan beberapa
perhitungan hanya dapat dilakukan oleh komputer berkecepatan tinggi, misalnya jaringan
saraf tiruan. Revolusi komputer telah membawa implikasi perkembangan statistika di
masa mendatang, dengan penekanan baru pada statistika eksperimental dan empirik.
Beberapa Piranti Lunak Statistika yang banyak digunakan antara lain:
Piranti lunak berlisensi
Mathematica
MATLAB
Minitab
MS Excel, dan berbagai add-ins
MODDE Umetrics
Statgraphics Centurion XV
S programming language
SAS programming language
SIMCA-P Umetrics
SPSS
Stata
StatSoft STATISTICA
Piranti Lunak Open Source
Bahasa pemrograman R
Sumberdaya Komputasi Statistika Online (UCLA)
Mondrian (Piranti lunak untuk Analisis Data Eksploratori)
GNU Octave
GNU PSPP
OpenOffice.org/Calc
Gnumeric
ROOT
Piranti Lunak Bebas
Winpepi
BV 4.1 Peranti lunak untuk analisis dekomposisi dan pengaturan musiman data runtun
waktu
Zaitun Time Series Piranti lunak untuk analisis data runtun waktu

################
MENGENAL ILMU STATISTIK SECARA SEDERHANA
Oleh:Okasatria Novyanto

Masih hangat dari ingatan kita tentang hasil survey fenomenal pada tahun 2002 dari
seorang dosen filsafat Universitas Gadjah Mada (Iip Wijayanto) yang menyebutkan
bahwa 97,05% Mahasiswi di Yogyakarta sudah kehilangan kewanitaannya. Lepas dari
kebenaran informasi tersebut, yang perlu kita kritisi adalah “bagaimanakah sampling
dilakukan (metode sampling)? Berapa besar samplenya? Berapa standar deviasi dari
datanya? Berapa % Error-marginnya?” dan masih banyak lagi pertanyaan-pertanyaan
mendasar yang perlu dikemukakan untuk memastikan kesimpulan dari penelitian tersebut
dapat diterima. Untuk itulah marilah kita mengenal tentang dasar-dasar dari ilmu statistik
yang akan dipaparkan pada pembahasan berikut ini secara sederhana. Disamping itu juga
hal ini perlu dilakukan karena untuk dapat mengaplikasikan Six Sigma secara benar,
pemahaman ilmu statistik dalam kerangka berpikir ilmiah merupakan suatu kebutuhan.
Statistik ialah ilmu yang membahas tentang pengumpulan, penyusunan, analisa,
interpretasi dan penyajian data. Tujuan penggunaan Statistika adalah untuk memprediksi
dan mencegah suatu keabnormalan proses, bukan hanya sekedar inspeksi dan deteksi
terhadap keabnormalan proses. Secara umum, Ilmu statistik ada 2 jenis yaitu :
- Statistik Deskriptif (Memberikan informasi tentang kinerja dari sebuah proses).
- Statistik Inferensial (Memberikan informasi tentang prediksi yang berhubungan dengan
kinerja sebuah proses atau Peluang).

*Data
Dalam melakukan suatu observasi dibutuhkan data-data yang accountable. Data
yang baik apabila diolah maka akan menghasilkan informasi yang berguna atau
bermanfaat. Jadi yang dimaksud dengan data adalah sekumpulan fakta, angka atau segala
sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai referensi
dalam mengambil keputusan.
*Jenis Data
Data variable : disebut juga data continues atau measurement. Data ini berasal dari
hasil pengukuran dan nilainya berada dalam suatu interval atau jangkaun tertentu, contoh:
Hasil pengukuran berat badan dari 46 Inspector di PQA, hasill pengukuran panjang
Frame Main DV28EC selama 1 bulan, dll.
Data attribute : disebut juga data diskrit atau data non continues. Umumnya data ini
merupakan hasil perhitungan dan berupa bilangan bulat, contoh : Jenis suku bangsa
Inspector PQA, jenis kelamin (pria/ wanita), jumlah karyawan yang tidak masuk per hari,
dll.
*Alasan Perlunya Pengumpulan Data
a. Untuk mengumpulkan fakta-fakta tentang suatu masalah atau kesempatan yang dapat
dikuantifikasi.
b. Untuk menyampaikan fakta-fakta ini dalam bahasa yang sama.
c. Untuk menetapkan informasi mendasar tentang sebuah proses.
d. Untuk mengukur jumlah dan arah perubahan-perubahan yang terjadi.
e. Untuk membandingkan gambaran proses sebelumnya dan sesudahnya
f. Untuk memfasilitasi analisa keuntungan (Cost Benefit Analysis) dari solusi yang
diusulkan.
g. Untuk mengkuantifikasi dampak dari sebuah solusi.
Perlu diketahui bahwa data merupakan sebuah langkah awal dalam suatu analisa
untuk mengambil keputusan. Jika data yang kita kumpulkan tidak sistematis, akurat dan
aktual maka keputusan yang dihasilkan tentunya tidak akan akurat dan tidak dapat
dipertanggungjawabkan kebenarnnya. Dengan kata lain data yang dikumpulkan akan
terbuang sia-sia.
Jadi perlu dipikirkan terlebih dahulu point-point tentang apa saja yang akan dikumpulkan
sebelum kita memulai aktifitas pengumpulan data, misalnya : Jenis defect, waktu, biaya,
dll.

*Populasi dan sample


Populasi ialah keseluruhan object yang ingin kita ukur dan analisa. Sedang sample
ialah sebagian (kecil) dari populasi dimana kita benar-benar melakukan pengukuran dan
dengan ini kita dapat menarik kesimpulan.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah
populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan
keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita
mengumpulkan informasi tentang suatu populasi tanpa kita harus meneliti secara
keseluruhan.

Salah satu kelebihan kita menggunakan sampling secara statistik yakni kita dapat
menentukan tingkat akurasi dan ketepatan pengujian kita sebelum disebarkan. Dalam
penerapannya untuk membedakan antara populasi dan sample, para ahli statistik
memberikan simbol yang berbeda dan perhitungan yang sedikit berbeda.

Sebelum kita membahas lebih jauh lagi, ada beberapa terminology yang perlu diketahui
terlebih dahulu, yakni :
1. Populasi
Seluruh item yang membentuk suatu kelompok yang menarik untuk diteliti dan
populasi ini harus ditentukan sebelum kita memutuskan untuk mengambil sampling,
contoh : semua supplier part stamping untuk TEI, part stamping yang digunakan pada
drive model DW224EV, dll.
2. Kerangka sampling
Sebuah daftar , data base atau pengenal khusus lainnya tentang item-item yang akan
diikutsertakan menjadi sample, contoh : Bill Of Material yang mencakup semua
stamping part pada drive model DW224EV, Data di SAP yang menyimpan list semua
supplier stamping part untuk TEI, dll.
3. Unit sampling
Item sesungguhnya yang diikutkan dalam sampling, contoh: Sebuah Screw, dll.
4. Bias
Merupakan perbedaan antara data yang kita kumpulkan dalam sample dengan “kondisi
sebenarnya” dari populasi. Hal ini dapat mempengaruhi hasil interprestasi kita terhadap
hasil statistik yang dihasilkan (D.Manggala, 2005).

*Jenis-Jenis Sampling
Menurut Augustine A.Stagliano dalam bukunya Rath and Strong’s Six sigma
Advance Tool Pocket Guide (2004) disebutkan bahwa sampling diklasifikasikan menjadi
beberapa jenis :
Ditinjau dari segi jenisnya, sampling dikategorikan menjadi 2, yakni :
Sampel Judgmental
1. Sampel dipilih berdasarkan pengetahuan dan pengalaman.
2. Hanya sebagian kecil dari populasi yang diikutsertakan dalam proses seleksi.
3. Sampel dianggap mewakili populasi.
4. Contoh : PT. Livatech bermaksud mengadakan customer satisfication survey. Dari 20
customer yang ada hanya diambil sample 5 customer yang utama saja dengan
pertimbangan kelima customer tersebut ordernya diatas 100.000 Part/ bulan.
Sampel Statistical
1. Sampe dipilih secara acak.
2. Seluruh populasi diikutsertakan dalam proses seleksi.
3. Sampel mewakili seluruh populasi.
4. Contoh : PQA mengambil sampel Shaft PU (L) DV28EC dari 10 box yang ada dengan
masing-masing box diambil 50 Pcs secara acak.

*Metode Sampling
Sekurangnya ada 3 metode sampling, yakni :
1. Systematic sampling : Dalam pengambilan sampel, metode ini menekankan
pengambilan yang teratur dengan interval frekuensi yang jelas, misalnya : setiap
pengambilan sampel dilakukan diawal shift, pengambilan sampel setiap kelipatan 100
Pcs, dll.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya
dibantu dengan statistical software (MINITAB). Metode ini dipandang cukup aman dari
bias.
3. Stratified sampling : Ciri khas dari metode sampling ini adalah adanya penggolongan
sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini baru
dilakukan pengambilan sampel secara sistematik maupun random.

*Pengukuran Central Tendency


Untuk mengukur Central Tendency (diterjemahkan secara bebas = ukuran letak)
biasanya menggunakan indikator-indikator mean (rata-rata), median (nilai tengah) dan
modus (nilai yang sering muncul).
Mean (rata-rata) ialah jumlah semua observasi dibagi dengan banyaknya jumlah data.
Nilai mean sangat dipengaruhi oleh nilai-nilai yang ekstrim.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil
hingga terbesar (diranking). Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika
banyaknya data ganjil maka median sama dengan nilai data yang tepat berada ditengah-
tengah. Namun jika banyaknya data genap maka median sama dengan rata-rata dari dua
nilai yang berada ditengah. Hal inilah yang dapat dikatakan bahwa median sama dengan
50th percentile atau kuartile kedua (Q2). Sebagai informasi tambahan saja bahwa median
umumnya digunakan pada distribusi yang miring (skew) sedang distribusi yang seimbang
umumnya memakai mean.
Modus adalah nilai yang paling sering muncul.

*Pengukuran Variasi
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum dipakai adalah :
- Range (jangkauan) ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.
Dengan sedikit penjelasan diatas tentunya kita akan mengetahui bahwa dengan rata-rata
saja tidak cukup untuk membuat suatu kesimpulan dari data yang kita analisa. Kita perlu
mengukur variasi tentunya. Untuk lebih jelasnya, perhatikan contoh berikut ini :
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan
dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut (dalam
Juta Rupiah). Tujuan dari survey ini adalah untuk membuktikan apakah bisa dikatakan
gaji karyawan di Batam itu “rata-rata sama Rp. 3.000.000,00”?

Dengan melihat data diatas belum dapat dikatakan bahwa dua group yang mempunyai
mean dan median sama itu dikategorikan sama secara statistik.

*Jenis Distribusi
Pada pembahasan dimuka telah disinggung tentang klasifikasi data bahwa dapat
dikategorikan dalam data attribute dan data variable (continuous data) sehingga distribusi
data-pun secara umum dibagi menjadi 2, yakni :
1. Discrete distributions (untuk non continuous data).
2. Continuous distributions.

*Bentuk-bentuk Distribusi
Secara umum, bentuk-bentuk ditribusi adalah sebagai berikut :
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed (Positif), bila rata-rata > median
- Left Skewed (Negatif), bila rata-rata <>

Untuk mempercepat dan membantu kita dalam mengetahui persebaran data, penggunaan
histogram merupakan suatu langkah yang cepat untuk mengetahui bentuk distribusi suatu
data.

*Discrete Distributions
Jenis discrete distributions yang umum sering dipakai antara lain :
1. Binomial distributions - Untuk lebih mudah dalam pemahaman, mungkin akan lebih
mudah diterima jika menggunakan sebuah contoh : Anda seorang pemain Futsal yang
sedang melatih kemampuan untuk menendang bola ke gawang dari luar daerah Keeper.
Anda melakukan 6 tendangan setiap set dengan posisi serong kiri-serong kanan dan
depan, masing-masing 2 bola (total 6 bola setiap set). Dan dari sekian kali set, setelah
dirata-rata anda mendapatkan 3 Gol dari 6 kali tendangan. Dalam hal ini nilai
kemungkinan GOL adalah 0,5. Dari data ini kita dapat mengitung kemungkinan akan
GOL jika menendang 300 kali.
2. Poisson distributions - Banyak analisis dilakukan untuk jumlah suatu kejadian per area
of opportunity dimana area per opportunity dapat berupa waktu, ruang maupun area.
Misalnya : Anda sedang mengantri di Bank dan masih menunggu lama sekali untuk
dilayani. Mungkin anda menghitung dalam hati berapa pelanggan yang datang setiap satu
menit. Dalam satu menit pertama ada sepuluh orang yang datang berbarengan, menit
ketiga ada dua orang, menit ke sepuluh ada tujug orang datang. Jika anda setiap hari
menghitung laju kedatangan pelanggan per menit, dalam sebulan anda akan mempunyai
rata-rata laju kedatangan pelanggan per menit. Disini anda dapat dikatakan punya
distribusi yang disebut dengan Poisson disitribution. Distribusi ini sangat penting dalam
analisis operasi terutama dalam analisis produktivitas sistem atau peralatan yang
menggunakan teori antrian atau Queue theory. (D.Manggala, 2005)

*Continuous Distributions
Distribusi yang umum dipakai pada jenis Continous distribution, antara lain :
1. Normal Distributions Banyak kejadian yang muncul secara acak (random)
menghasilkan data dengan distribusi bell shaped. Kurva yang menghubungkan puncak-
puncak batang disebut Kurva Peluang Normal yang digunakan untuk meng-estimasi
Distribusi Normal dari kejadian-kejadian yang muncul secara acak (random). Dalam
kasus-kasus yang umum terjadi, asumsi yang digunakan dalam analisis adalah bahwa
data yang kita dapatkan terdistribusi dengan normal dan simetris. Hal ini berarti bahwa
kita perlu terlebih dahulu menguji bisa tidaknya suatu group dikatakan terdistribusi
secara normal. Dan jika anda menggunakan statistical software (MINITAB), menu
pilihan untuk menguji kenormalan distribusi telah tersedia dan juga dapat melihat bentuk
dari kurvanya (simetris ataukah miring).

2. Exponential Distribution Secara sederhana distribusi eksponensial dapat dijelaskan


sebagai suatu distribusi dari data-data yang menggambarkan periode (waktu) ataupun
ruang diantara dua kejadian. Contoh yang paling umum dalam penerapan distribusi
eksponensial ini adalah dalam mengukur periode kerusakan sebuah mesin (MTBF =
Mean Time Between Failure)

*Mengenal Confidence Interval


Sebagaimana telah disebutkan pada penjelasan diawal bahwa kita mengambil suatu
kesimpulan berdasarkan analisis yang dilakukan hanya atas dasar sampel yang diambil.
Kenyataan yang terjadi bahwa (misal : rata-rata) rata-rata sampel itu ternyata tidak sama
persis dengan rata-rata populasi. Dengan kata lain tentunya dalam hal ini terdapat
perbedaan rata-rata antara sampel satu dengan sampel lainnya dalam satu populasi yang
sama (populasi yang diambil). Perbedaan hasil statistik antara satu sampel dengan sampel
lainnya inilah yang disebut dengan “sampling error”. Jika kita memperbesar ukuran
sample maka akan menghasilkan “sampling error” yang lebih kecil. Para ahli statistik
mengeluarkan konsep estimasi interval dimana nilai karakteristik suatu populasi
diperkirakan dengan suatu tingkat kepastian akan berada didalam suatu interval. Interval
ini disebut dengan Confidence Interval Estimated. Ini merupakan suatu konsep yang
sangat penting dalam analisis statistik. Pada umumnya, analisis six sigma menggunakan
Confidence Interval Estimated sebesar 95%, hal ini berarti bahwa : jika semua sampel
diseleksi dalam ukuran “n”, maka 95% dari sampel itu akan memasukan parameter
populasi dalam interval hasil estimasi. Untuk membuat estimasi interval, anda mesti
mengetahui statistik dari sampel yang anda gunakan untuk menganalisis karakteristik
populasi dan distribusi samplingnya.
Confidence interval = Titik estimasi sampel + Margin of error

*Mengenal Hypothesis Test


Seringkali kita dihadapkan pada keharusan untuk membandingkan 2 buah group
data atau lebih, hal ini tentunya membutuhkan suatu analisis. Disinilah konsep
Hypothesis test diperlukan. Sebelum masuk pada pembahasan lebih jauh, terlebih dahulu
perlu diperkenalkan tentang Type I Error dan Type II Error. Agar lebih jelas, perhatikan
contoh berikut ini. Masih hangat dalam ingatan kita tentang kasus Roy Marteen tersangka
Narkoba. Tentunya hipotesis awal dia dianggap “tidak bersalah” dan hipotesis
alternatifnya tentu saja dia “bersalah”
Ho = Roy Marteen tidak bersalah
Ha = Roy Marteen bersalah Test hipotesis ini bertujuan membuktikan apakah keputusan
yang kita ambil benar-benar sesuai dengan kenyataan yang sebenar-benarnya. Oleh
karena itu kondisi antara keputusan yang kita ambil dengan kenyataan yang sebenarnya
dapat digambarkan sebagai berikut :

Dari Matriks diatas dapat dilihat bahwa ada 2 kemungkinan hakim melakukan kesalahan :
Kesalahan tipe I : Memenjarakan orang yang tidak bersalah
Kesalahan tipe II : membebaskan orang yang bersalah
Kemungkinan melakukan kesalahan tipe I didefinisikan sebagai alpha (siginificance
level), dimana 0 Kurang dari atau sama dengan alpha dan alfa kurang dari atau sama
dengan 1. Kemungkinan melakukan kesalahan tipe II didefinisikan sebaga Betta, dimana
0 kurang dari atau sama denga betta dan betta kurang dari atau sama dengan 1.
Pada umumnya, kuputusan kritis berasal dari kesalahan tipe I.
Pengujian Perbedaan Rata-Rata dari Dua Distribusi Kontinyu

Secara Umum, hypothesis dapat dinyatakan dalam persamaan berikut :


Untuk menguji rata-rata dengan test hypothesis biasanya dilakukan dengan t-test, dengan
langkah sederhana berikut :
1. Definisikan parameter yang diujikan dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha
=0,05 atau 0,01 atau 0,001)
3. Tentukan besar sampel dan lakukan t-test pada data tersebut dengan statistical software
(MINITAB) atau software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan
tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan
lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan
nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak
punya bukti yang kuat untuk merejectkan Ho
Catatan : Distribusi t merupakan pooled distribution dari standard deviasi dua sampel
yang berbeda. Untuk keterangan lebih lengkap silahkan membaca buku-buku tentang
statistik. Untuk contoh sederhana, perhatikan kasus berikut ini : Sebuah perusahaan ingin
melakukan pengujian statistik untuk membuktikan apakah terdapat perbedaan penggajian
antara pegawai pria dan wanita. Hal ini dilakukan untuk menepis isu adanya diskriminasi
terhadap pegawai wanita, yaitu pegawai wanita diberikan gaji yang lebih rendah dari
pegawai pria (pada golongan dan masa kerja yang sama). Oleh karena itu departement
Sumber Daya Manusia Mengumpulkan data gaji pegawai dan membandingkan gaji
pegawai pria dan wanita setelah dikelompokan pada golongan dan masa kerja yang sama.
Dalam melakukan pengujian, hypothesisnya adalah :
Ho = Gaji pegawai pria dan wanita adalah sama
Ha = Gaji pegawai pria tidak sama dengan pegawai wanita
Langkah berikutnya adalah menentukan confidence interval, yakni dipilih 95% (alpha =
0,05) lalu dilakukan pengujian dengan MINITAB yang menghasilkan p value sebesar
0,34 atau untuk two-sided test menjadi 0,68 Karena p lebih besar dari alpha (jauh lebih
besar dari alpha) maka dapat dikatakan bahwa kita tidak mempunyai bukti untuk menolak
hipotesis awal yakni bahwa gaji pegawai pria dan wanita adalah sama. Dengan kata lain
dapat disimpulkan bahwa dengan data yang ada kita perpendapat tidak ada perbedaan
antara gaji pegawai pria dan wanita (D. Manggala, 2005).
Pengujian Perbedaan antara Dua proporsi
Untuk pengujian proporsi, persamaan yang umum dipakai adalah

Langkah pengujiannya hampir sama dengan t-test untuk rata-rata, yaitu :


1. Definisikan parameter yang diuji dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha
=0,05 atau 0,01 atau 0,001).
3. Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan
MINITAB atupun software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan
tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan
lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan
nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak
punya bukti yang kuat untuk merejectkan Ho .
Pengujian Perbedaan Rata-Rata antara 2 group dengan Variance yang berbeda
Pengujian hipotesis untuk rata-rata, pada umumnya menggunakan asumsi bahwa variasi
dari 2 group yang diuji adalah sama. Jika asumsi tadi tidak bisa kita gunakan maka kita
harus melakukan test yang pada statistical software MINITAB disebut dengan “Separate-
Variance t-test” (Untuk Lebih lengkapnya silahkan pelajari tentang MINITAB).
Pengujian Perbedaan Variances antara 2 group yang berbeda
Kembali ke konsep awal bahwa untuk mengetahui apakah variasi antara 2 group yang
akan diuji secara statistik dapat dianggap sama atau tidak, diperlukan suatu pengujian
untuk menguji variance yang dikenal dengan F-test. Dan mengulang pembahasan
sebelumnya bahwa jika variance kedua group yang diuji secara statistik bisa dianggap
sama maka dapat menggunakann “pooled-variance t-test” tetapi jika tidak bisa dianggap
sama maka digunakan “separate-variance t-test”. Persamaan umum pengujian variances
yang sering dipakai :

Lagi, sebagai pengingat saja. Asumsi yang digunakan adalah bahwa data yang diuji
terdistribusi secara normal. Namun untuk “mengatakan”itu perlu dilakukan pengujian
terlebih dahulu. Pengujian yang perlu dilakukan yakni test “kenormalan” terhadap data-
data kita sebelum F-test. Pengujian tersebut sudah tersedia di MINITAB. Langkah
pengujian dua F-test untuk variances adalah sebagai berikut :
1. Definisikan parameter yang diuji dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha
=0,05 atau 0,01 atau 0,001).
3. Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan
MINITAB atupun software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan
tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan
lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan
nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak
punya bukti yang kuat untuk merejectkan Ho .
Analysis of Variances (ANOVA)
Jika diperhatikan sejauh ini penjelasan hanya menyentuh pada 2 group data saja. Lantas
bagaimanakah kaidah pengujian untuk yang lebih dari 2 group data, misalnya : 4 group
atau bahkan 10 group. Untuk menjawab “tuntutan” ini maka digunakanlah kaidah
ANOVA.
Sebagai contoh saja kita mempunyai 4 group data, kita dapat mengujinya apakah
keempat group tersebut mempunyai rata-rata yang sama ataukah tidak, Ingat hanya dalam
sekali pengujian. Secara sederhana dapat ditampilkan dengan hipotesis berikut :
Ho = Semua rata-rata dari populasi adalah sama
Ha = Tidak semua rata-rata dari populasi adalah sama Jika kita bermaksud menguji hanya
satu variable maka menu yang kita pilih adalah one-way ANOVA tetapi jika ada dua
variable yang akan diuji maka menggunakan two-way ANOVA.
Dan mengingat pembahasan ANOVA sangat panjang, alangkah baiknya jika diperdalam
dengan membaca buku-buku Statistik.

You might also like