You are on page 1of 30

36

OUTLINE BAHAN AJAR STATISTIKA DASAR (PAF-201)

Kompetensi Umum:
Setelah mengikuti matakuliah ini mahasiswa diharapkan mampu menyajikan data yang
telah dikumpulkan dan mampu menganalisis data statistik secara benar.

BAB I. PENDAHULUAN
1.1 Statistik dan Statistika
1.2 Jenis-jenis statistika
1.2.1 Statistika Deskriptif
1.2.2 Statistika Inferensia
1.3 Jenis-Jenis Data
1.3.1 Data Nominal
1.3.2 Data Ordinal
1.3.2 Data Interval
1.3.2 Data Rasio

Bab II. TEKNIK MENYAJIKAN DATA


2.1 Pendahuluan
2.2 Statistik Lima Serangkai
2.3 Diagram Dahan dan Daun (Sten-And-Leaf Plot).
2.4 Tabel Distribusi Frekuensi
2.5 Histogram
2.6 Boxplot

Bab III. PROBABILITAS


3.1 Permutasi dan Kombinasi
3.2 Definisi probabilitas
3.3 Ruang Kejadian dan Ruang Sampel
3.4 Kejadian Tunggal
37

3.5 Kejadian Majemuk


3.6 Kejadian Saling Bebas
3.7 Kejadian tidak saling bebas
3.8 Atural Bayes (Bayes Rule)

Bab IV. DISTRIBUSI PROBABILITAS


4.1 Pengertian variabel random
4.2 Distribusi Probabilitas
4.3 Distribusi Probabilitas Diskret
4.3.1 Distribusi Binomial
4.3.2 Distribusi Poisson
4.4 Distribusi Probabilitas Kontinu
4.4.1 Distribusi Normal
4.4.2 Distribusi t-Student

Bab V. DISTRIBUSI SAMPLING STATISTIK


5.1 Distribusi sampling rata-rata
5.2 Distribusi sampling selisih dua rata-rata
5.3 Distribusi sampling proporsi
5.4 Distribusi sampling selisih dua proporsi
5.5 Distribusi sampling variansi
5.6 Distribusi sampling rasio variansi

Bab VI. SELANG KEPERCAYAAN


6.1 Selang kepercayaan bagi rata-rata
6.2 Selang kepercayaan bagi selisih dua rata-rata
6.3 Selang kepercayaan bagi proporsi
6.4 Selang kepercayaan bagi selisih dua proporsi
6.5 Selang kepercayaan bagi variansi
6.6 Selang kepercayaan bagi rasio variansi
38

Bab VII. UJI HIPOTESIS


7.1 Uji Hipotesis bagi rata-rata
7.2 Uji Hipotesis bagi selisih dua rata-rata
7.3 Uji Hipotesis bagi proporsi
7.4 Uji Hipotesis bagi selisih dua proporsi
7.5 Uji Hipotesis bagi variansi
7.6 Uji Hipotesis bagi rasio variansi
7.7 Uji Kebaikan Suai (Goodness- of-Fit)

DAFTAR PUSTAKA
39

BAHAN AJAR

STATISTIKA DASAR

Tinjauan Mata Kuliah


Mata kuliah Statistika Dasar mengkaji masalah 1). Teknik menyajikan data
kuantitatif maupun kualitatif, 2). Kombinasi dan permutasi, 3). Variabel Random
Diskret dan Kontinu 4). Probabilitas dan Distribusi Probabilitas, 5). Ekspektasi
Variabel Random 6). Distribusi Sampling Statistik 7). Selang Kepercayaan dan 8).
Uji Hipotesis.
Setelah menyelesaikan kuliah statistika dasar, mahasiswa diharapkan mampu
menyajikan data yang telah dikumpulkan, mampu menganalisis data, mampu menarik
kesimpulan berdasarkan statistik deskriptif maupun inferensia.
Untuk mahamami dan mengaplikasikan materi mata kuliah ini mahasiswa harus
secara aktif mengerjakan soal-soal latihan yang ada di buku acuan.
40

BAB II
TEKNIK MENYAJIKAN DATA

2.1 Pendahuluan
Kumpulan data yang berupa hasil pengukuran terhadap variabel tertentu pada
umumnya tidak akan memiliki nilai yang persis sama satu dengan lainnya. Variasi nilai-
nilai pengamatan ini dapat kita lihat melalui pola distribusinnya dan pola ini dapat
berguna dalam menentukan karakteristik distribusi dari data tersebut.
Penciri numerik yang penting adalah ukuran pemusatan yaitu berupa nilai tempat
sebgian besar dari data tersebut mengumpul, dan distribusi data yang menunjukkan
besarnya rentangan atau jarak persebaran (distribusi) dari titik pusatnya.
Dalam BAB ini akan dibahas cara pemeriksaan bentuk atau pola distribusi data
dan penetuan karakteristiknya. Pertama yang akan disajikan adalah teknik mencari dan
menyajikan statistik lima serangkai, yaitu nilai minimum, nilai maksimum, median,
kuartil 1 dan kuartil 3, membuat diagram dahan (batang) dan daun (Stem-and-leaf),
diagram kotak garis (Boxplot), dan terakhir adalah mengkonstruksi Tabel frekuensi dan
histogram.

2.2 Statistik Lima Serangkai


Statistik lima serangkai, sesuai namanya, terdiri dari serangkaian lima statistik
yang terdiri dari nilai minimum, kuartil 1, median (kuartil 2), kuartil 3, dan maksimum.
Dalam pemahaman kelima statistik lima serangkai ini akan kita lihat dalam bentuk
bagan sebagai berikut : Misalkan kita mempunyai sekumpulan data, maka data tersebut
dapat dipilah-pilah sesuai urutannya menurut kelima statistik lima serangkai tersebut.
25% 25% 25% 25%
a K1 Median (K2) K3 b
a = nilai yang paling kecil
K1 atau kuartil 1= suatu nilai yang membagi data sedemikian sehingga sekitar 25% dari
data tersebut berada di bawahnya. Jadi kuartil 1 adalah suatu nilai
yang berada pada posisi ¼ dari banyaknya data setelah data tersebut
diurutkan
Kuartil 2 (Median)
41

Median atau K2 = suatu nilai yang membagi data sedemikian sehingga kira-kira 50%
dari data tersebut berada di bawahnya dan 50% berada di atasnya.
Jadi Kuartil 2 (Median) adalah suatu nilai yang berada pada posisi ½
dari banyaknya data setelah data tersebut diurutkan
K3 atau kuartil 3 = suatu nilai yang membagi data sedemikian sehingga sekitar 25% dari
data tersebut berada di atasnya. Jadi Kuartil 3 berada pada posisi ¾
dari banyaknya data setelah data tersebut diurutkan
b = nilai yang paling besar

contoh 1:
Tentukan statistik lima serangkai darai data berikut ini :
11 6 17 9 12 4 4 14 20 10 15

Jawab:
Terlebih dahulu data asal diurutkan dari kecil ke besar :
4 4 6 9 10 11 12 14 15 17 20
a k1 k2 k3 b
Berdasarkan data yang telah terurut, maka diperoleh:
nilai minimum =4, kuartil 1=6, median=11, kuartil 3=15 dan nilai maksimum=20

contoh 2: Misalkan kita mempunyai sekumpulan data berikut:


102 135 76 108 50 104 77 135 102 33
116 95 122 130 86 114 109 64 101 37
71 130 42 109 71 117 70 109 104 141
132 146 138 77 109 109 89 125 109 55
126 117 88 71 86 77 72 73 151 82
80 105 86 96 70 83 86 88 133 97
Tentukanlah statistik lima serangkai untuk kasus data pada contoh 2 di atas !
Langkah awal untuk menentukan statistik lima serangkai adalah mengurutkan
data tersebut:
33 37 42 50 55 64 70 70 71 71
1 2 3 4 5 6 7 8 9 10
71 72 73 76 77 77 77 80 82 83
11 12 13 14 15 16 17 18 19 20
86 86 86 86 88 88 89 95 96 97
42

21 22 23 24 25 26 27 28 29 30
101 102 102 104 104 105 108 109 109 109
31 32 33 34 35 36 37 38 39 40
109 109 109 114 116 117 117 122 125 126
41 42 43 44 45 46 47 48 49 50
130 130 132 133 135 135 138 141 146 151
51 52 53 54 55 56 57 58 59 60

1. a=33
2. Nilai K1 berada pada posisi ¼ (60+1) = 15.25
K1 = X15 + ¼ (X16-X15) = 77+ ¼ (77-77) =77.
3. Nilai Median (K2) berada pada posisi median : (n+1)/2 = 61/2=30.5
Median = ½ (X30+X31) = ½ (97+101)= 99
4. Nilai K3 berada pada posisi ¾ (60+1) =, 45.75
K3 = 116 + ¾ (117-116)=116+ 0.75 = 116.75.
3. Nilai maksimum =151

2.3 Diagram Dahan dan Daun (Sten-And-Leaf Plot).


Diagram dahan dan daun disusun baris perbaris secara vertikal, dan cukup efektif
dalam menggambarkan pola distribusi data yang berukuran kecil. Seperti dalam istilah
pohon, daun melekat pada dahan (batang), jadi dalam hal ini satuan dahan adalah satuan
yang terbesar sedangkan daun lebih kecil. Jika angka-angka yang kita miliki berkisar
antara 00 sampai 99, maka yang dijadikan sebagai dahan adalah puluhan sedanhgkan
daunnya adalah satuan. Ketika angka-angka yang kita miliki berkisar antara 0 sampai 9,
maka tekni penetuan dahannya adalah sebagai berikut:
 Untuk angka 0 dan 1 diberi simbol o
 Untuk angka 2 dan 3 diberi simbol t (two, three)
 Untuk angka 4 dan 5 diberi simbol f (four, five)
 Untuk angka 6 dan 7 diberi simbol s (six, seven)
 Untuk angka 8 dan 9 diberi simbol *

Contoh 3
43

Buatlah diagram dahan daun untuk data pada contoh 2!


Jawab:
Langkah-langkah membuat diagram dahan daun adalah sebagai berikut:
1. Menentukan dahan dan daun, dalam hal ini dahannya berupa puluhan dan daunnya
adalah satuan
Dahan daun
(puluhan) (satun)
3 37 artinya angka 33 dan 37
4 2 artinya angka 42
5 05 dst
6 4
7 00111236777
8 0236666889
9 567
10 1224458999999
11 4677
12 256
13 0023558
14 16
15 1 artinya 151

2. Menentukan deep (kedalaman)


Kedalaman dahan daun
2 3 37
3 4 2
5 5 05
6 6 4
17 7 00111236777
27 8 0236666889
30 9 567
30 10 1224458999999
17 11 4677
13 12 256
10 13 0023558
3 14 16
1 15 1

Dengan bantuan diagram dahan daun, dapat segera diperoleh informasi tentang
statistik lima serangkai. Dalam diagram dahan daun, posisi median data biasanya
dinformasikan melalui deep-nya yang diberi tanda “ ( ) “.. Nilai median untuk data di
atas = ½ (X30 + X31) = ½ (97+101)=99
44

contoh 4. Kembali pada soal no. 2. Anggaplah observasi 33 dihilangkan. Tentukan


diagram dahan daunnya !
dengan prosedur yang sama seperti pada contoh 3, maka diperoleh diagram dahan daun
berikut :
Deep Dahan Daun
1 3 7
2 4 2
4 5 05
5 6 4
16 7 00111236777
26 8 0236666889
29 9 567
(13) 10 1224458999999
17 11 4677
13 12 256
10 13 0023558
3 14 16
1 15 1
Perhatikan pada kolom deep, angka 13 berada ditandai dengan “( )” artinya bahwa nilai
median berada pada baris ini. Posisi median = ½(59+1) = 30. Dengan mengamati angka
deep sebelumnya, yaitu 29, maka maka nilai mdeian dapat ditentukan dengan angka
pada posisi 29, 30. Jadi mediannya adalah 101.

2.4 Tabel Distribusi Frekuensi dan Histogram


Jika data kuantitatif dibuat menjadi kelompok-kelompok, maka akan diperoleh
daftar distribusi frekuensi. Tabel distribusi frekuensi akan menjadi lebih informatif lagi
ketika disajikan dalam bentuk grafik. Grafik yang menghubungan kelas interval (sumbu
datar) dengan frekuensi/frekuensi relatif dinamakan Histogram. Dengan demikian
penyajian tabel distribusi frekuensi akan menjadi lebih informatif jika disajikan dalam
bentuk histogram. Dalam daftar distribusi frekuensi, banyak objek dikumpulkan dalam
kelompok-kelompok dalam bentuk a – b yang disebut kelas interval. Ke dalam kelas
interval a – b ini dimasukan semua data yang bernilai mulai dari a sampai dengan b.
Urutan kelas dimulai dari yang terkecil sampai terbesar.
Berikut ini akan disajikan bagaimana membuat tabel distribusi frekuensi dan
histogram. Andaikan kita mempunyai data berikut (data pada contoh 2).
45

102 135 76 108 50 104 77 135 102 33


116 95 122 130 86 114 109 64 101 37
71 130 42 109 71 117 70 109 104 141
132 146 138 77 109 109 89 125 109 55
126 117 88 71 86 77 72 73 151 82
80 105 86 96 70 83 86 88 133 97

1. Tentukan rentang, yaitu nilai terbesar dikurangi nilai terkecil.


Rentang = nilai terbesar – nilai terkecil
nilai terbesar = 151, nilai terkecil = 33, jadi rentang = 151 – 33 = 118
2. Menentukan banyak kelas, Banyak kelas = 1+3.3 log n, n=banyaknya data.
n=60, banyak kelas = 1+ 3.3 log 60 = 1 + 3.3(1.778151)=6.867899 = 7
(dibulatkan)
3. Menentukan panjang interval kelas, p
Harga p diambil sesuai dengan ketelitian satuan data yang digunakan. Jika data
berbentuk satuan, ambil harga p teliti sampai satuan.
p=rentang/banyak kelas = 118/7 = 16,85714=17.
4. Pilih ujung bawah kelas interval pertama, untuk kasus ini bisa diambil sama
dengan nilai terkecil atau nilai data yang lebih besar dari nilai terkecil
Selanjutnya daftar / tabel frekuensi dapat dinuat berdasarkan nilai-nilai yang
sudah diperoleh dari (1) sampai (4).

Tabel 2.4. Distribusi frekuensi untuk data pada contoh 2.


Batas Batas atas Titik
bawah tengah Frekuensi
Nilai
kelas kelas (a+b)/2 (f)
interval interval
32,5 49,5 33 - 49 41 3
49,5 66,5 50 - 66 58 3
66,5 83,5 67 - 83 75 14
83,5 100,5 84 - 100 92 10
100,5 117,5 101 - 117 109 17
117,5 134,5 118 - 134 126 7
134,5 151,5 135 - 151 143 6
46

2.5 Histogram
Histogram adalah sebuah grafik yang dibuat dengan menghubungkan batas-batas
bawah untuk setiap kelas interval dari tabel distribusi frekuensi (atau frekuensi
kumulatif) dengan nilai frekuensi (atau frekuensi relatifnya). Batas-batas kelas
diposisikan atau diletakan pada sumbu horizonal sedangkan frekuensi atau frkuensi
relatif pada sumbu vertikal. Misalkan dari contoh tabel distribusi frekuensi akan dibuat
histogramnya, maka akan diperoleh :

Gambar 2.5. Histogram dari tabel frekeunsi pada Tabel 1.


2.6 Boxplot
Boxplot merupakan penyajian dari statistik lima serangkai. Misalkan kita ingin
membuat boxplot berdasarkan data pada contoh 2. Prosedur pembuatannya adalah
sebagai berikut :
1. Menentukan statistik lima serangkaui; minimum, kuartil 1 (K1), median (Me),
kuartil 3 (K3), dan maksimum.
2. Menentukan jarak antar kuartil JAK = K3-K1
3. a. Menentukan batas atau pagar dalam:
Batas dalam bawah, BDB = K1-1.5(JAK)
Batas dalam Atas, BDA = K3+1.5(JAK)
47

b. Menentukan batas atau pagar luar:


Batas luar bawah, BLB = K1-3(JAK)
Batas luar Atas, BLA = K3+3(JAK)

4. Menentukan panjang tail


tail kiri ditarik dari K1 ke nilai paling kecil yang lebih besar dari BDB. dan
nilai-nilai lain yang < BDB merupakan outlier.
tail kanan ditarik dari K3 ke nilai paling besar yang lebih kecil dari BDA, dan
nilai-nilai yang lebih besar dari BDA merupakan outlier.

Contoh lihat data pada contoh:


1. Statistik lima serangkai : minimum =33, maksimim = 151, K1=77, 3=116.75,
Median = 99.
2. JAK = 116.75-77 = 39,75
3. BDB=17.375, BDA=176.375, BLB=-42.25, BLA=236
4. Menentukan tail, tail kiri ditarik dari K1 ke 33, tail kanan ditarik dari K3 ke 151
(Jelaskan mengapa !)

Boxplot yang terbentuk adalah : Lihat Gambar 2.

Gambar 2.6. Boxplot dari data pada contoh 2


48

BAB IV. DISTRIBUSI PROBABILITAS DISKRET DAN KONTINU

4.1 Pengertian Variabel Random


Variabe random adalah suatu fungsi yang memetakan setiap unsur dalam ruang
sampel ke bilangan real. (dalam kasus distribusi diskret ruang sampelnya merupakan
ruang sampel diskret (Countable), sehingga variabel randomnya mungkin 0,1,2,…).
Misalkan suatu percobaan melempar koin setimbang sebanyakn 3 kali, X
menyatakan banyaknya sisi muka (M) yang muncul, dan P(X)=P(X=x) = probabilitas
muncul M sebanyak x, sehingga nilai-nilai variabel random X yang mungkin adalah
X=0,1,2,3. Jika dinyatakan dalam sebuah pemetaan maka akan tampak seperti terlihat
pada gambar berikut :

Gambar 4.1. Pemetaan dari ruang sampel (RS) ke Bilangan Riil (X)

4.2 Distribusi Probabilitas


Distribusi probabilitas pada prinsipnya mendistribusikan probabilitas ke setiap
variabel random yang bersesuaian. Perhatikan kembali contoh percobaan pelemparan
sebuah koin seimbang sebanyak tiga kali, variabel random , X=0, 1, 2, dan 3
49

P(X=0)=P(BBB)=1/8
P(X=1)=P(MBB)+P(BMB)+P(BBM)=1/8 + 1/8 + 1/8 =3/8
P(X=2)=P(MMB)+P(MBM)+P(BMM)=1/8 + 1/8 + 1/8 =3/8
P(X=3)=P(MMM) =1/8
Sehingga tabel distribusi frekuensinya adalah :

X 0 1 2 3
P(X) 1 3 3 1
8 8 8 8

Contoh lainnya, dari percobaan yang sama, misalkan Y menyatakan banyaknya sisi
belakang (B) yang muncul, dan P(Y)=P(Y=y) = probabilitas muncul B sebanyak y kali .
jika sebuah koin setimbang dilempar 3 kali
Y= 0, 1, 2, 3
50

Y 0 1 2 3
P(Y)=P(Y=y) 1 3 3 1
8 8 8 8

Distribusi probabilitas ini dapat diringkas ke dalam suatu fungsi probabilitas


a. Untuk Variabel random X
1
 8 , untuk x = 0,3

3
P(X=x) P ( X = x) =  , untuk x = 1,2
8
0, untuk x selainnya


Atau dapat diringkas
 n  1  x  1  3− x
   1 −  , untuk x = 0,1,2,3
P ( X = x) =  x  2   2 

0 , untukl x selainnya

untuk variabel Y sama caranya dengan kasus variabel X (coba sendiri)


Kita lihat bahwa distribusi probabilitas untuk variabel X dan Y sama, maka variabel X
dan Y mempunyai distribusi identik.
51

Fungsi Distribusi Kumulatif (Cumulatif Distribution Function, disingkat CDF)


dilambangkan dengan F(x).
Definisi : fungsi F(x) disebut Fungsi Distribusi Kumulatif jika dan hanya jika 3 kondisi
berikut terpenuhi:

a. lim F ( x) = 0, dan lim F ( x ) = 1


x → −∝ x →∝

b. F(x) bukan fungsi yang monoton turun


c. F(x) kontinu dari kanan

Kita kembali ke contoh pelemparan sebuah koin dengan x menyatakan banyakanya sisi
M muncul.
x
F ( x) = P( X ≤ x) = ∑ P ( X = i ), untuk semua x
i =1

0, − ∝< x < 0


1
 , 0 ≤ x <1
8
 4
F ( x) =  , 1≤ x < 2
8
7
8 , 2≤ x<3

1, 3 ≤ x <∝

Dengan cara yang sama, fungsi distribusi kumulatif bagi Y dan hasilnya akan sama.
Rata-rata atau nilai ekspektasi dan variansi variabel diskret dapat dicari dengan
menggunakan rumus sebagai berikut : Misalkan X adalah suatu variabel random diskret
dengan fungsi massa probabilitas (fmp) P(X)=P(X=x),
n
Mean X = µ = ∑ X i P ( X i )
i =1
n
Variansi X = σ = ∑ X i P ( X i ) − µ 2
2 2

i =1

S tan dardeviasi = σ 2 = σ
n
Nilai Harapan X = E ( X ) = ∑ X i P ( X i )
i =1

Penurunan rumus mean dan variansi berasal dari Nilai harapan (Expected Value), Mean
= E(X) = µ dan Variansi dari variabel random X, atau disingkat Var(X) berasal dari
definisi sebagai berikut:
52

Var(X) =E(X-E(X))2 (di statistika lanjutan definisi ini selalu digunakan),


karena E(X)= µ, maka Variansi
Var(X) =E(X-µ)2 , selanjutnya dapat diuraikan
n
Var ( X ) = ∑ ( X i − µ ) 2 P ( X i )
i =1
n
= ∑ ( X i − 2 X i µ + µ 2 ) P( X i )
2

i =1
n n n
= ∑ X i P( X i ) − 2 µ ∑ X i P ( X i ) + µ 2 ∑ P ( X i )
2

i =1 i =1 i =1
n
= ∑ X i P( X i ) − 2 µµ + µ 2
2

i =1
n
= ∑ X i P( X i ) − µ 2
2

i =1

Untuk suatu distribusi yang probabilitas setiap titik sampelnya sama (probabilitas serba
sama P(Xi)=1/n untuk semua i=1,2,…n), jika ada n tindakan atau peristiwa, maka :
n

∑X i
Mean = µ = i =1
=X
n
Sifat-Sifat Nilai Harapan
Misalkan a dan b suatu konstanta, X adalah variabel random dengan mean (X) =µ dan
Variansi (X)=Var(X)=σ2 , dan misalkan Y=a+bX, maka

1. E ( a ) = ∑aP ( X i ) = a ∑P ( X i ) = a

2. E ( aX ) = ∑aX i P ( X i ) = a ∑X i P ( X i ) = aE ( X ) = aµ

3. E (Y ) = E ( a + bX ) = ∑( a + bX i ) P ( X i ) = a ∑P ( X i ) + b ∑X i P ( X i ) = a + bµ

4. Var ( aX ) = E ( aX − E ( aX )) 2 = E ( a ( X − E ( X )) 2 = a 2 E ( X − E ( X )) 2 = a 2Var ( X ) = a 2σ 2
5. Var (Y ) = E (Y − E (Y )) 2 = E ( a + bX − E ( a + bX )) 2
= E ( a + X − ( a + bE ( X )) 2 = E ( a + bX − a −bE ( X ) )
2

= E (bX −bE ( X )) 2 = E ( b( X − E ( X )) )
2

= b 2 E ( X − E ( X )) 2 = b 2 var( X ) = b 2σ 2
53

4.3 Distribusi Probabilitas Diskret


4.3.1 Distribusi Binomial
Seperti telah diketahui bahwa distribusi bernoulli adalah sebuah percobaan yang
dilakukan dengan hanya terjadi dua kemungkinan, yaitu sukses atau gagal. Dengan
demikian dalam distribusi bernoulli ini parameter yang ada hanya satu yaitu probabilitas
sukses (p).
Jika dalam percobaan bernoulli ini dilakukan berulang-ulang sebanyak n kali
maka akan mengikuti distribusi binomial. Jadi distribusi binomial merupakan perobaan
yang hanya mempunyai dua kemungkinan, yaitu sukses dan gagal dengan probabilitas
tertentu yang tetap dan percobaannya diulang sebanyak n kali. Dengan demikian
parameternya ada dua yaitu banyaknya percobaan (n) dan probabilitas suskes (p).

Contoh :
Banyaknya percobaan ada n dan dalam setiap kali kejadian dalam satu percobaan
tertentu ada dua kemungkinan kejadian yaitu sukses atau gagal. Misalkan probabilitas
sukses=p. probabilitas sukses (p) antar kejadian tetap (konstan) dan mendekati 0.5.
Misalkan X adalah variabel random yang berdistribusi binom dengan probabilitas
suskses p dan banyaknya percobaan n, probabilitas binom atau disebut juga fungsi massa
probabilitas binom didefinisikan:
Cara penulisan P(X) = P(X=x) untuk distribusi diskret.
 n  x n− x
  p (1 − p ) , x = 0,1,2,3...n
P(X)= P ( X = x ) =  x 
0 , x selainnya

Sifat=sifat
n
1. ∑ P( X ) = 1
x =0

2. P(X) ≥ 0
54

n
Mean = E ( X ) = ∑ XP ( X ) = 0 P ( X = 0) + 1P ( X = 1) + ... + n( PX = n)
x =0
n
= ∑ XP ( X ) (karena 0.P ( X = 0) = 0
x =1
n
n
= ∑ x  p x (1 − p ) n − x
x =1  x 
n
n!
= ∑x p x (1 − p) n − x
x =1 (n − x)! x!
n
n!
=∑ p. p x −1 (1 − p) n − x , cata tan n − x = (n − 1) − ( x − 1)
x =1 ( n − x )!( x − 1)!
n
n.(n − 1)!
=∑ p. p x −1 (1 − p) ( n −1) −( x −1)
x =1 (( n − 1) − ( x − 1))!( x − 1)!
n
(n − 1)!
= np ∑ p x −1 (1 − p ) n − x
x =1 (( n − 1) − ( x − 1))! ( x − 1)!
Misalkan; n' = n − 1, x' = x − 1,
untuk x = 1 → x ' = 0, untuk x = n → x' = n − 1 = n' ( karena n' = n − 1)
n'
( n' )!
= np ∑ p x ' (1 − p ) n '− x '
x '= 0 ( n '− x ' ))! ( x ' )!
n'
 n' 
= np ∑   p x ' (1 − p ) n '− x '
x '= 0  x ' 

n'
 n' 
= np (karena ∑   p x ' (1 − p) n '− x ' = 1)
x '= 0  x ' 

Variansi (X)= Var(X)


Var (X) = E(X2)-(np) 2

Var ( X ) = ∑ X 2 P ( X ) − (np ) 2

perhatikan bahwa X2 = X2 – X + X = X(X-1) + X, sehingga

Var ( X ) = ∑ [ X ( X − 1) + X ]P ( X ) + −(np ) 2

Var ( X ) = ∑ X ( X − 1)P ( X ) + ∑ X P ( X ) − (np ) 2

Var ( X ) = ∑ X ( X − 1)P ( X ) + np − (np ) 2


55

perhatikan ΣX(X-1)P(X), untuk x=0 dan 1, maka nilai X(X-1)P(X)=0, jadi x mulai dari
2
n n
n
∑ X ( X − 1)P ( X ) = ∑ x ( x − 1)  p x (1 − p ) n − x
x =2 x =2  x
n
n!
= ∑ x( x − 1) p x (1 − p ) n − x
x =2 (n − x)! x!
n
n(n − 1)(n − 2)!
= ∑ x( x − 1) p 2 p x −2 (1 − p ) n − x
x =2 (n − x)! x ( x − 1)( x − 2)!
n
(n − 2)!
= n(n − 1) p 2 ∑ p x −2 (1 − p) ( n − 2) −( x −2 )
x = 2 ( n − x )!( x − 2)!

Misalkan; x' = x − 2, n' = n − 2, untuk x = 2 → x ' = 0, untuk x = n → x' = n − 2 = n'


dan n − x = (n − 2) − ( x − 2) = n'− x' , sehingga
n n'
n '!
∑ X ( X − 1)P( X ) = n(n − 1) p 2 ∑
x =2 x '= 0 ( n '− x ' )! x ' !
p x ' (1 − p ) n '− x '

 n'
n '! 
= n( n − 1) p 2  karena ∑
x '= 0 ( n'− x ' )! x '!
p x ' (1 − p ) n '− x ' = 1
 

Jadi Var(X) = n(n-1)p2 + np – (np)2


= (n2 -n)p2 + np – (np)2
= n2p2- np2 + np - n2p2
= - np2 + np
= np(1 – p)
Dengan demikian dapat disimpulkan bahwa jika X berdistribusi binomial maka rata-rata
atau meannya=np dan Variansinya sama dengan np(1-p)

4.3.2 Distribusi Poisson


Distribusi ini dicirikan oleh nilai probabilitas keberhasilan (probabilitas sukses)
sangat kecil dan banyaknya percobaan atau tindakan sangat besar. Menurut Sudjana
ciri-ciri distribusi poisson ini adalah jika np < 5 untuk n minimal 50. (n≥50)
Fungsi Probabilitas dari X yang berdistribusi poisson:
e −µ µ x
P( X ) = P ( X = x ) =
x!
56

dan fungsi distribusi Kumulatif :


e −µ µ x
x
F( x ) = P(X ≤ x ) = ∑
x =0 x!

jadi dalam hal ini distribusi poisson hanya mempunyai 1 parameter, yaitu µ.
Mean dan Variansi

Mean = E ( X ) = ∑ XP( X ) = 0 P ( X = 0) + 1P ( X = 1) + ... + n( PX = n)
x =0

= ∑ XP( X ) (karena 0.P ( X = 0) = 0
x =1

e −µ µ x
= ∑x
x =1 x!

e − µ µµ x −1
= ∑x
x =1 x( x − 1)!
e − µ µ x −1

= µ∑
x =1 ( x − 1)!

Misalkan; x' = x − 1,
untuk x = 1 → x' = 0, untuk x =→∝ x' =∝

e −µ µ x '
= µ∑
x '= 0 x '!

e −µ µ x '
=µ (∑ = 1)
x '= 0 x '!

Var ( X ) = ∑ X 2 P ( X ) − µ 2

perhatikan bahwa X2 = X2 – X + X = X(X-1) + X, sehingga

Var ( X ) = ∑ [ X ( X − 1) + X ]P ( X ) − µ 2

Var ( X ) = ∑ X ( X − 1)P ( X ) + ∑ X P ( X ) − µ 2

Var ( X ) = ∑ X ( X − 1)P ( X ) + µ − µ 2
57


E ( X ( X − 1)) = ∑ X ( X − 1) P ( X ), ( X ( X − 1) P ( X ) = 0, untuk x = 0 dan x = 1)
x =0

= ∑ X ( X − 1) P ( X )
x=2

e −µ µ x
= ∑ x( x − 1)
x=2 x!

e −µ µ 2 µ x −2
= ∑ x( x − 1)
x=2 x ( x − 1)( x − 2)!
e −µ µ x−2

= µ2∑
x =1 ( x − 2)!

Misalkan; x' = x − 2,
untuk x = 2 → x' = 0, untuk x =→∝ x' =∝

e −µ µ x'
= µ2∑
x '= 0 x '!

e −µ µ x'
= µ2 (∑ = 1)
x '= 0 x '!

Jadi Variansi = Var (X) = µ2 + µ - µ2 = µ

Dengan demikian dapat disimpulkan bahwa jika X berdistribusi binomial maka rata-rata
atau meannya=µ dan Variansinya sama dengan µ.

4.4 Distribusi Variabel Random Kontinu


Bahasan pada distribusi kontinu ini lebih ditekankan pada distribusi normal
karena dalam beberapa kajian statistika parametrik distribusi ini sering digunakan.
Dalam pengujian hipotesis, seperti uji signifikansi parameter regresi sering kita jumpai
statistik uji t (t-student), oleh karena itu dalam selain distribusi normal, pada bahasan ini
juga akan disinggung sedikit mengenai distribusi student.
Sebagai pengantar ke distribusi normal, pada bagian awal akan diberikan kasus
distribusi kontinu untuk kasus fungsi probabilitas yang sederhana.

4.4.1 Distribusi Normal


Distribusi Normal menjadi sangat penting dalam bidang statistika karena merupakan
dasar bagi pengambilan keputusan (inferensia statistika), Grafaiknya disebut kurva
58

normal. Kurva Normal adalah kurva yang berbentuk genta (lonceng) seperti terlihat
pada Gambar 4.4.1
Kurva normal simetrik terhadap suatu garis tegak yang melalui mean µ. Luas daerah di
bawah kurva ini sama dengan 1.

µ
Gambar 4.4.1 Kurva Normal

Fungsi probabilitas normal bergantung pada nilai mean (µ) dan standar deviasi (σ,
akar kuadrat dari variansi).
Fungsinya adalah sebagai berikut :
1 x−µ 2
1 − ( ) 22
f ( x) = e 2 σ
, untuk − ∝< x <∝, π = , e = 2.71828
2π σ 7
, − ∝< µ <∝, σ > 0
persamaan ini memang kompleks, tapi untungnya dalam praktek disediakan Tabel
Distribusi Normal.

Kurva 1 Kurva 2
Kurva 1 Kurva 2

µ1 µ2
µ1= µ2
σ1=σ2 σ1 > σ2
(a) (b)
Gambar 4.4.2 Dua Kurva normal : (a) µ1 < µ2, tetapi σ1=σ2 (b) µ1 = µ2, tetapi σ1>σ2
59

4.4.2 Distribusi Normal Baku


Dapat dimengerti bahwa terdapat tak hingga banyaknya distribusi normal dengan
berbagai mean (µ) dan standar deviasi (σ), tetapi untunglah semua distribusi dapat
diakomodasi ke dalam sebuah tabel distribusi normal baku. Pada prinsipnya untuk
setiap variabel random X yang berdistribusi normal dengan mean µ dan standar deviasi

X −µ
σ, transformasi Z = akan menghasilkan distribusi normal dengan mean 0 dan
σ
standar deviasi 1 yang disebut dengan distribusi normal baku.
Distribusi asal dan distribusi hasil transformasi diilustrasikan dalam Gambar 4.4. Bila X
berada diantara X= x1 dan X=x2, maka variabel random Z akan berada diantara nilai-

x1 − µ x2 − µ
nilai padanannya, yaitu z1 = dan z 2 = . Luas daerah di bawah kurva X
σ σ
antara x1 dan x2 sama dengan luas di bawah kurva Z antara z1 dan z2. Dengan demikian
P(x1<X< x2)=P(z1<Z< z2). Sebagai catatan, karena distribusi normal merupakan
distribusi yang kontinu, maka probabilitas mengambil tepat salah satu nilainya sama
dengan nol, sehingga
P(x1<X≤ x2) = P(x1<X< x2) + P(X= x2)
= P(x1<X< x2) + 0
= P(x1<X< x2)
60

Tabel 4.4.2. Tabel Z


Luas daerah yang di arsir merupakan probabilitas normal P(0<Z<z), dan nilai
probabilitas ini diberikan pada tabel 1. Ingat bahwa luas total daerah di bawah kurva =1.

Daerah yang di arsir bersesuaian dengan nilai selnya.


Catatan : P(Z < 0)=0.5000

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
61

Cara membaca Tabel Distribusi Normal Baku.


Misalkan kita ingin mencari nilai – nilai probabilitas berikut :
a. P(0<Z<1.22)
b. P( Z<1.96)
c. P(-1.1<Z< 2.0)
Jawab :
a. dari Tabel 1.
Pada kolom paling kiri pilih 1.2 dan pada baris paling atas pilih 0.02, titik
perpotongannya merupakan nilai probabilitasnya, sehingga
P(0<Z<1.22) = 0.3888
b. Bentuk ke probabilitas standar seperti pada Tabel 1
P( Z<1.96) = P( Z<0) + P(0< Z<1.96),
= 0.5000 + 0.4750
= 0.9750
c. Perhatikan bahwa P(-1.1<Z< 2.0) = P(-1.1<Z< 0) + P(0<Z< 2.0)
P(-1.1<Z< 2.0) = P(-1.1<Z< 0) + P(0<Z< 2.0)
= P(-1.1<Z< 0) + 0.4772,
karena distribusi normal bersifat simetris, maka P(-1.1<Z< 0) = P(0<Z<1.1), dengan
demikian P(-1.1<Z< 0) = P(0<Z<1.1) = 0.3643,
Jadi P(-1.1<Z< 2.0) = 0.3643 + 0.4772 =0.8415

Misalkan variabel random X berdistribusi normal dengan mean µ dan variansi σ, maka
untuk menentukan probabilitas P( X <x) atau P(x1<X<x2) dan seterusnya harus
dilakukan transformasi dul ke variabel random Z. Sebagai ilustrasi misalkan X
berdistribusi normal dengan mean 20 dan standar deviasi 5. Tentukan :
a. P(20<X<26)
b. P(X>15)
c. P(X<25)
Jawab
 20 − 20 26 − 20 
a. P(20<X<26) = P <Z< 
 5 5 
62

= P(0<Z<1.2)
= 0.3849
 15 − 20 
b. P(X>15) = P Z > 
 5 
= P(Z >-1)
= P(Z<1) (karena simetris)
= p(Z<0) + P(0<Z<1)
= 0.5000+ 0.3413
= 0.8413
 25 − 20 
c. P(X<25) = P Z < 
 5 
= P(Z<1)
= p(Z<0) + P(0<Z<1)
= 0.5000+ 0.3413
= 0.8413

Hampiran Normal terhadap Distribusi Binomial


Distribusi Normal memberikan hampiran yang sangat baik bagi distribusi
binomial jika n besar dan probabilitas keberhasilan, yaitu p dekat pada 0.5. Sebagai
ilustrasi misalkan variabel random X berdistribusi binomial dengan n=8 dan p=0.5,
maka
Mean = n.p =8(0.5) = 4
Variansi = np(1-p) = 8(0.5)(1-0.5) = 2
Standar deviasi = akar kuadrat dari variansi = (2)0.5 = 1.41
X 0 1 2 3 4 5 6 7 8
P(X)=P(X=x) 0.0039 0.0313 0.1094 0.2188 0.2734 0.2188 0.1094 0.0313 0.0039
63

Dalam menerapkan hampiran normal terhadap binom perlu dilakukan koreksi


kontinuitas terlebih dahulu. Hal ini disebabkan karena distribusi binomial merupakan
distribusi diskret sedangkan distribusi normal kontinu. Sebagai ilustrasi bahwa X =6
sama dengan luas empat persegi panjang yang alasnya berpusat di titik 6. Dengan
bantuan Tabel binom diperoleh 0.1093. Nilai probabilitas ini kira-kira sama dengan luas
daerah yang di arsir antara 5.5 sampai 6.5 (Gambar di bawah)

 5.5 − 4 6.5 − 4 
P(5.5 < X < 6.5) = P <Z< 
 1.41 1.41 
P(1.06<Z<1.77) = P(0<Z<1.77) - P(0<Z<1.06)
= 0.4616-0.3554
= 0.1062
Jika X berdistribusi Binomial P(X≥6) dapat didekati dengan hampiran normal, yaitu
P(X>5.5).
64

4.4.3 Distribusi t-Student


Dari suatu populasi berukuran N dengan mean µ dan simpangan baku σ, dapat
ditarik sampel berukuran n (n< N), dan dari sampel berikuran n ini dapati dicari rata-
ratanya, misalkan x dan simpangan bakunya, s. statistik t didefinisikan sebagai

x−µ
t=
s
n
distribusi t juga simetrik terhadap mean=0 tetapi variansinya lebih besar dari 1.
Semakin ukuran sampel (n) semakin besar variansinya dan sebaliknya semakin besar
ukuran sampel semakin kecil variansinya. Bila n→∞ maka kurva t menyerupai kurva Z.

Db=∞

Db=8

Db=4

Gambar 4.4.3. Hubungan Kurva Z dan Kurva t


65

Tabel 4.4.3. Tabel t-student untuk berbagai derajat bebas dan α (alpha).


Derajat α
Bebas 0.25 0.10 0.05 0.03 0.01 0.01
1 1.000 3.078 6.314 12.706 31.821 63.657
2 0.817 1.886 2.920 4.303 6.965 9.925
3 0.765 1.638 2.353 3.182 4.541 5.841
4 0.741 1.533 2.132 2.776 3.747 4.604
5 0.727 1.476 2.015 2.571 3.365 4.032
6 0.718 1.440 1.943 2.447 3.143 3.707
7 0.711 1.415 1.895 2.365 2.998 3.499
8 0.706 1.397 1.860 2.306 2.896 3.355
9 0.703 1.383 1.833 2.262 2.821 3.250
10 0.700 1.372 1.812 2.228 2.764 3.169
11 0.697 1.363 1.796 2.201 2.718 3.106
12 0.695 1.356 1.782 2.179 2.681 3.055
13 0.694 1.350 1.771 2.160 2.650 3.012
14 0.692 1.345 1.761 2.145 2.624 2.977
15 0.691 1.341 1.753 2.131 2.602 2.947
16 0.690 1.337 1.746 2.120 2.583 2.921
17 0.689 1.333 1.740 2.110 2.567 2.898
18 0.688 1.330 1.734 2.101 2.552 2.878
19 0.688 1.328 1.729 2.093 2.539 2.861
20 0.687 1.325 1.725 2.086 2.528 2.845
21 0.686 1.323 1.721 2.080 2.518 2.831
22 0.686 1.321 1.717 2.074 2.508 2.819
23 0.685 1.319 1.714 2.069 2.500 2.807
24 0.685 1.318 1.711 2.064 2.492 2.797
25 0.684 1.316 1.708 2.060 2.485 2.787
26 0.684 1.315 1.706 2.056 2.479 2.779
27 0.684 1.314 1.703 2.052 2.473 2.771
28 0.683 1.313 1.701 2.048 2.467 2.763
∝ 0.674 1.282 1.645 1.960 2.326 2.576
Perhatikan bahwa nilai α merupakan daerah yang diarsir di sebelah kanan nilai-t tabel.
Nilai α disini disebut sebagai taraf signifikan. Cara pembacaan tabel distribusi t :
Misalkan kita akan mencari nilai t tabel jika diketahui nilai α=5% dengan derajat bebas
5, maka nilai t tabelnya sama dengan 2.015 (lihat nilai sel pada baris 5 dan pada kolom
0.05).

You might also like