You are on page 1of 12

Analisis Diskiminan

Setelah dilaksanakannya Analisis Gerombol, kemudian dilanjutkan


dengan Analisis Diskriminan. Menurut Johnson dan Wichern (1992), tujuan
dari Analisis Diskriminan adalah untuk menggambarkan ciri-ciri suatu
pengamatan dari bermacam-macam populasi yang diketahui, baik secara
grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata
lain Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke
dalam salah satu dari dua kelompok atau lebih.
Suatu fungsi diskriminan layak untuk dibentuk bila terdapat
perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena
itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap
perbedaan vektor nilai rataan dari kelompok-kelompok tersebut.
Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang
harus dipenuhi adalah:
Peubah-pubah yang diamati menyebar secara normal ganda
(multivariate normality)
Semua kelompok populasi mempunyai matrik ragam-peragam
yang sama

3.2.4.1 Uji Kenormalan Peubah Ganda
Menurut Karson (1982: 80), untuk menguji kenormalan peubah ganda
digunakan prosedur yang dikembangkan oleh Mardia dalam Susiyanto
(2003) dengan cara menghitung dua macam ukuran statistik yaitu ukuran
skewness (b
1,p
) dan kurtosis (b
2,p
), yaitu:
( ) ( ) ( ) ( )

1
]
1


n
u
n
u
u u p
X X S X X n b
1 1 '
3
'
1 2
, 1
1
( ) ( ) ( ) ( )

1
]
1


n
u
u u p
X X S X X n b
1
2
1
, 2
1
Hipotesa yang digunakan adalah:
H
0
: peubah ganda mengikuti sebaran normal
H
1
: peubah ganda tidak mengikuti sebaran normal
Bila:
nb
1,p
/6
2
6 / ) 2 )( 1 ( + + p p p

, dan
[b
2,p
p(p + 2)] /
n p p / ) 2 ( 8 +
Z

(tabel normal), maka tidak ada


alasan untuk menolak H
0
, berarti peubah ganda mengikuti sebaran normal.
Menurut Johnson dan Wichern (1992), untuk menguji kenormalan
ganda adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan
yaitu:
) ( )' (
1 2
X X S X X d
j j j


, di mana X
j
adalah pengamatan yang ke-j
dan S
-1
adalah kebalikan (inverse) matriks ragam-peragam S
Kemudian
2
j
d
diurutkan dari yang paling kecil ke yang paling besar,
selanjutnya dibuat plot
2
j
d
dengan nilai Chi-Kuadrat

,
_


n
j
p
2 1
2

dimana: j =
urutan = 1, 2, ..., n dan p = banyaknya peubah. Bila hasil plot dapat didekati
dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda menyebar
normal.
Menurut Nourosis dalam Susiyanto (2003), berdasar teori Wahl dan
Kronmal (1977), dikatakan bahwa seringkali kenormalan ganda sulit
diperoleh terutama bila sampel yang diambil relatif kecil. Bila hal ini terjadi,
uji vektor nilai rataan tetap bisa dilakukan selama asumsi kedua (kesamaan
ragam-peragam) dipenuhi.
3.2.4.2 Uji Kesamaan Matrik Ragam Peragam
Untuk menguji kesamaan matrik ragam-peragam () antar kelompok
digunakan hipotesa:
H
0
:
0
=
1
=
2
= ....
k
= .
H
1
: Sedikitnya ada dua kelompok yang berbeda.
Statistik uji yang digunakan adalah statistik Boxs M, yaitu:
-2ln
*
=
( ) ( )
j
k
j
j
S n k n W k n ln 1 ) ( ln
1

*
=
2 / ) (
1
2 / ) 1 (
) /(
k n
k
j
n
j
k n W
S
j

dimana:
k = banyaknya kelompok.
W / (n-k) = matrik ragam-peragam dalam kelompok gabungan.
S
j
= matrik ragam-peragam kelompok ke-j.
Bila hipotesa nol (H
0
) benar, maka (-2ln
*
) / b akan mengikuti sebaran
F dengan derajat bebas v
1
dan v
2
pada taraf signifikansi , dimana:
v
1
= (1/2)(k 1)p(p + 1)
v
2
= (v
1
+ 2) / (a
2
a
1
2
)
b = v
1
/ (1 a
1
- v
1
/ v
2
)
a
1
=
1
1
]
1

+
+

k
j j
k n n p k
p p
1
3
) (
1
) 1 (
1
) 1 )( 1 ( 6
1 3 2

a
2
=
1
1
]
1

+
+

k
j
j
k n n k
p p
1
2 2
) (
1
) 1 (
1
) 1 ( 6
) 2 )( 1 (
p = jumlah peubah pembeda dalam fungsi diskriminan.
Sehingga apabila (-2ln
*
) / b Fv
1
,v
2
, maka tidak ada alasan untuk
menolak H
0
dan dapat disimpulkan bahwa antar kelompok mempunyai
matrik ragam-peragam yang sama dan sebaliknya bila (-2ln
*
) / b > Fv
1
,v
2
,
maka H
0
ditolak, yang berarti bahwa antar kelompok tidak mempunyai
matrik ragamperagam yang sama.
3.2.4.3 Uji Vektor Nilai Rataan
Pengujian terhadap vektor nilai rataan antar kelompok dilakukan
dengan hipotesa:
H
0
:
0
=
1
=
2
= ...=
k
H
1
: Sedikitnya ada dua kelompok yang berbeda
Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah
statistik V-Bartlett yang menyebar mengikuti sebaran Chi-kuadrat (
2
)
dengan derajat bebas p(k - 1), apabila H
0
benar.
Statistik V-Bartlett diperoleh melalui:
[ ] ) ln( 2 ) ( ) 1 ( + k p n V

dimana:
n = banyaknya pengamatan
p = banyaknya peubah dalam fungsi diskriminan
k = banyaknya kelompok

+

B W
W
Wilks lambda
dalam hal ini:
W = matrik jumlah kuadrat dan hasil kali data dalam kelompok
=


k
i
n
j
i ij i ij
i
X X X X
1 1
)' )( (
B = matrik jumlah kuadrat dan hasil kali data antar kelompok.
=


k
i
i i i
X X X X n
1
)' )( (
X
ij
= pengamatan ke-j kelompok ke-i
i
X
= vektor rataan kelompok ke-i
n
i
= jumlah pengamatan pada kelompok ke-i,
X = vektor rataan total
Apabila V
2
) 1 ( ), 1 (

k p maka, tidak ada alasan untuk menolak H


0
, ini
berarti bahwa terdapat perbedaan vektor nilai rataan antar kelompok.
Sebaliknya bila V >
2
) 1 ( ), 1 (

k p maka H
0
ditolak.
Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka
fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok
serta berguna untuk mengelompokkan suatu obyek ke salah satu kelompok
tersebut.
Penentuan peubah bebas dalam pembentukan fungsi diskriminan
dengan prosedur stepwise
Menurut Nourosis dalam Susiyanto (2003), apabila dalam suatu
penelitian menggunakan banyak peubah maka untuk efisiensi dalam
menentukan peubah mana yang berperan dalam pembentukan fungsi
diskriminan dilakukan melalui analisis diskriminan bertatar (stepwise
disciminant). Prosedur ini digunakan untuk menghilangkan informasi dari
peubah bebas yang kurang berguna dalam membentuk fungsi diskriminan.
Prosedur diskriminan bertatar dimulai dengan pemilihan peubah bebas yang
paling berarti.
Kriteria untuk melihat variabel yang paling berarti (peubah yang dapat
diikutsertakan dalam pembentukan fungsi diskriminan), yaitu:
1. Peubah yang memiliki nilai F terbesar.
2. Peubah yang memiliki nilai Wilks Lambda terkecil.
Peubah yang sudah terpilih bisa dikeluarkan dari fungsi diskriminan
jika informasi yang dikandung tentang perbedaan kelompok ada di beberapa
kombinasi peubah-peubah terpilih lainnya.
Pembentukan Fungsi Diskriminan
Analisis Diskriminan merupakan teknik statistik yang menggunakan
peubah tak bebas Y berupa peubah kategorik dan peubah bebasnya adalah
interval atau rasio. Fungsi diskriminan merupakan fungsi atau kombinasi
linier peubah-peubah asal yang akan menghasilkan cara terbaik dalam
pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai
yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompok
(Dillon dalam Solikhah, 2003)
Banyaknya fungsi diskriminan yang terbentuk secara umum tergantung
dari min(p,k-1), dengan p adalah banyaknya peubah pembeda dan k adalah
banyaknya kelompok yang telah ditetapkan. Fungsi diskriminan ini diartikan
sebagai keragaman peubah yang terpilih sebagai kekuatan pembeda. Apabila
fungsi diskriminan yang terbentuk sebanyak lebih dari 1, maka dapat
dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan
pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya.
Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa
persamaan linier (Fishers Sample Linear Discriminant Function) yaitu:
p p j j
x x x x y
1 1 2 12 1 11 1

+ + + + +

p p j j
x x x x y
2 2 2 22 1 21 2

+ + + + +
p p j j
x x x x y
3 3 2 32 1 31 3

+ + + + +
.
p ip j ij i i i
x x x x y

2 2 1 1
+ + + + +

p qp j qj q q q
x x x x y

2 2 1 1
+ + + + +
dengan i=1,2,,q (min p,k-1)
j=1,2,,p
atau dapat ditulis sebagai
x y '


dimana:

= koefisien vektor
y = skor diskriminan
Nilai

dipilih sedemikian sehingga fungsi diskriminan berbeda


sebesar mungkin antara kelompok, atau sehingga rasio antara jumlah kuadrat
antar kelompok dengan jumlah kuadrat dalam kelompok maksimum.
Penilaian Kekuatan Fungsi Diskriminan
Untuk mengetahui kekuatan fungsi diskriminan dalam menilai tiap-
tiap observasi dan mengelompokkannya ke dalam kelompok yang
didefinisikan dapat dilakukan dengan melihat:
1. Korelasi Kanonik (Canonical correlation)
Canonical Correlation (R) merupakan ukuran hubungan antara kelompok
yang terbentuk oleh y dengan fungsi diskriminan yang ada. Ketika R
adalah nol, maka hal ini dapat diartikan bahwa tidak ada hubungan di
antara kelompok-kelompok yang ada dengan fungsi yang terbentuk.
Sebaliknya apabila R-nya besar (mendekati 1), maka menunjukkan
adanya korelasi yang tinggi antara fungsi diskriminan dengan kelompok
yang ada. R ini digunakan untuk menjelaskan seberapa besar masing-
masing fungsi berguna dalam menentukan perbedaan kelompok.
2. Akar Ciri (Eigen Value)
Nilai eigen value menunjukkan ada atau tidaknya multikolinearitas atau
terjadinya korelasi antar peubah bebas di dalam fungsi diskriminan.
Multikolinearitas akan terjadi bila eigen value mendekati 0 (nol).
3. Group Centroid
Group centroid merupakan rata-rata nilai diskriminan dari tiap-tiap
observasi di dalam masing-masing kelompok. Semakin besar perbedaan
group centroid antar kelompok, maka fungsi diskriminan yang diperoleh
semakin dapat membedakan kelompok yang ada.
Ketepatan Pengelompokan
Tingkat akurasi pengelompokkan sangat menentukan baik atau
tidaknya suatu pengelompokkan. Persentase ketepatan pengelompokan dapat
dihitung dari matrik klasifikasi yang menunjukkan nilai sebenarnya (actual
members) dan nilai prediksi (prediction members) dari setiap kelompok.
Rumus persentase ketepatan pengelompokan oleh fungsi diskriminan (hit
ratio) adalah:
Hit ratio
% 100
1
1

k
i
i
k
i
ic
n
n
dimana : n
i
= jumlah observasi dari
i
yang tepat dikelompokkan pada
i
n
ij
= jumlah observasi dari
i
yang salah dikelompokkan pada
ij
dengan i =1,2,,k dan j =1,2,,k
Dalam prakteknya, hasil dari hit ratio ini sering dibandingkan dengan suatu
standar persentase tertentu. Ada 2 (dua) standar persentase yang sering
digunakan yaitu kriteria peluang proporsional (the proportional chance
criterion) dan kriteria peluang maksimum (the maximum chance criterion).
Kriteria peluang proporsional digunakan jika ukuran masing-masing
kelompok tidak sama dan peneliti ingin mengidentifikasi dengan tepat tiap-
tiap observasi dari 2 (dua) kelompok atau lebih. Rumus yang digunakan
untuk kriteria peluang proporsional ini adalah:
C
proporsional
=

k
i
i
p
1
2
dimana:
C
proporsional
= kriteria peluang proporsional dari model peluang.
p = proporsi jumlah observasi dari kelompok.
Kriteria peluang maksimum ditentukan dengan menghitung persentase total
observasi yang ditunjukkan oleh persentase terbesar dari dua kelompok atau
lebih.
Hair et. Al dalam Solikhah (2003) menyarankan bahwa persentase
ketepatan pengklasifikasian yang diperoleh melalui analisis diskriminan
paling tidak 25 persen lebih besar dari persentase yang diperoleh melalui
model peluang.

You might also like