Professional Documents
Culture Documents
dimana
Tujuan dari analisis diskriminan secara umum adalah mengetahui apakah ada
perbedaan yang jelas antar grup pada variabel dependen, menentukan model diskriminan
dari suatu permasalahan. Jika model tersebut sudah diperoleh selanjutnya akan dilakukan
pengujian ketepatan klasifikasi model.
Model dari analisis diskriminan dapat digunakan untuk mencari hubungan antara
variabel dependen dengan variabel dependen dari permasalahan yang didapat.
BAB II
PEMBAHASAN
2.1.Analisis Diskiminan (Analisis Fungsi Pembeda )
Menurut Johnson dan Wichern (2007) Analisis Diskriminan digunakan untuk
mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Suatu
fungsi diskriminan layak untuk dibentuk, bila terdapat perbedaan nilai rataan di antara
kelompok-kelompok yang ada.
Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan
untuk mengelompokkan atau mengklasifikasi suatu objek dalam dua kelompok atau lebih
berdasarkan variabel independentnya.
Sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan
nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian tersebut, asumsi analisis
diskriminan yang harus dipenuhi adalah :
1. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate
Normality), jika data tidak berdistribusi normal,akan menyebabkan masalah pada
ketepatan fungsi (model) diskriminan.
2. Matriks varians kovarians grup dari semua variabel independen seharusnya sama.
3. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data
ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi
dari fungsi diskriminan.
4. Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel independen
mempunyai korelasi yang kuat,dikatakan terjadi multikolinieritas. Untuk mengetahui
adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel
independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.
2.2.Fungsi Diskriminan
0 1 1 2 2
...
i i j ij
Y b b X b X b X = + + + +
dimana :
Y = Nilai (skor) fungsi diskriminan dari responden ke-i
0
b = Intersep (konstanta), artinya jika nilai variabel 0 X = , maka besar nilai
0
Y b =
j
b = Koefisien fungsi diskriminan dari variabel ke-j
ij
X = Variabel bebas ke-j dari responden ke-i , dimana i = 1,2,...,n
2.3.Jumlah Sampel pada Analisis Diskriminan
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap
variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam
variabel independen, seharusnya minimal ada 6x5=30 sampel.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni
analisis sampel yang digunakan untuk Fungsi Diskriminan, serta holdout sample (split
sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70
sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk
holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analysis sample
dibandingkan dengan hasil fungsi diskriminan dari holdout sample, apakah terjadi
perbedaan yang besar ataukah tidak. Jika ketetapan klasifikasi kedua sampel hampir sama
besar, dikatakn fungsi diskriminan dari analysis sampel sudah valid. Inillah yang disebut
proses validasi silang (Cross Validation) dari fungsi diskriminan.
2.4.Tujuan Analisis Diskriminan
Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka
variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel
dependen bisa berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan
diskriminan secara umum adalah :
- Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel
dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota grup 1
dengan anggota grup 2?
- Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang
membuat perbedaan tersebut?
- Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan
persamaan regresi.
- Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris),
apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya)
termasuk grup 1 atau grup 2, atau lainnya.
2.5.Proses Dasar dari Analisis Diskriminan
Proses dasar analisis diskriminan :
- Memisah variabel-variabel menjadi variabel dependen dan Variabel Independen.
- Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua
metode dasar untuk itu, yaitu:
3. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan
secara bersama-sama kemudian dilakukan proses diskriminan.
4. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke
dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada
pada model, dan ada kemungkinan satu atau lebih variabel independen
yang dibuang dari model.
- Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan
Wilks Lambda, Pilai, F test dan lainnya.
- Menguji ketetapan klasifikasi dari fungsi diskriminan, termasuk mengetahui
ketetpan klasifikasi secara individual dengan casewise Diagnotics.
- Melakukan interpretasi terhadap fungsi diskrimminan tersebut.
- Melekukan uji validasi fungsi diskriminan.
a. Algoritma Pokok Analisis dan Model Matematika
Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai berikut:
1. Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk
point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi
sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa
dilihat pada Pooled Within-Groups Matrices.
2. Uji Vektor Rata-rata Kedua Kelompok
0 1 2
1 1 2
:
:
H
H
=
=
Diharapkan dari uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai
informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua
kelompok. Pada SPSS, uji ini dilakukan secara univariate (jadi yang diuji bukan
berupa vektor), dengan bantuan tabel Tests of Equality of Group Means.
3. Dilanjutkan pemeriksaan asumsi homoskedastisitas, dengan uji Boxs M. Diharapkan
dari uji ini hipotesisi nol tidak ditolak (
0 1 2
: H = ).
4. Pembentukan model diskriminan
a. Kriteria Fungsi Linier Fisher
Pembentukan Fungsi Linier (teoritis)
Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang
dihitung dari suatu fungsi linier ' Y X = dimana ' menyatakan vektor
yang berisi koefisien-koefisien variabel penjelas yang membentuk
persamaan linier terhadap variabel respon,
1 2
' , ,...,
p
( =
1
2
X
X
X
(
=
(
k
X menyatakan matriks data padakelomok ke-k
11 12 1
21 22 2
1 2
X . .
X . .
. . .
. . .
. . .
. . .
.
.
k k pk
k k pk
k
n k n k npk
X
X
X
X X X
X
X
(
(
(
(
( =
(
(
(
(
1, 2, ....,
1, 2, ....,
1, 2
i n
j p
k
=
=
=
ijk
X menyatakan observasi ke-i variabel ke-j pada kelompok ke-k
Di bawah asumsi ( . )
k k k
X N E maka
2
1 1
2
( )
( )
E X
E X
( (
= =
( (
dan
1 2
( ) ( )' ;
k k k k k
E X X = = =
1
.
. ;
.
k
k k
pk
(
(
(
(
=
(
(
(
adalah vektor rata-rata tiap variable X pada kelompok ke-k
11 12 1
22 22
. .
. . . .
. . . . . .
. . . . . .
. . . . .
.
p
pp
o o
o o
o
o (
(
(
(
=
(
(
(
1 2
1 2
1 2 1 2
variansi variabel j apabila j =j
kovarians variabel j dan j apabila j j
{
j j
o =
Fisher mentransformasikan observasi-observasi x yang multivariate
menjadi
observasi y yang univariate. Dari persamaanY X = diperoleh
;
( ) ( ' ) '
ky k k
E Y E X = = =
2
var( ' ) ' ;
Y
X o = =
ky
adalah rata-rata Y yang diperoleh dari X yang termasuk dalam
kelompok ke-k
2
Y
o adalah varians Y dan diasumsikan sama untuk kedua kelompok.
Kombinasi linier yang terbaik menurut Fisher adalah yang dapat
memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh
dari x dari kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai
berikut:
1
2
2
1 2 1 2
2
( )
'( )( ) '
'
Y
Y
Y
o
=
E
Jika
1 2
( ) o = makapersamaan di atas menjadi
2
( )
'
o
E
. Karena adalah
matriks definit positif, maka menurut teori pertidaksamaan Cauchy-
Schwartz, rasio
2
( )
'
o
E
dapat dimaksimumkan jika
1 1
1 2
' ( ) c c o
= E = E
dengan memilih c=1, menghasilkan kombinasi linier yang disebut
kombinasi linier Fisher sebagai berikut:
1
1 2
' ( ) Y X X
= = E
Pembentukan Fungsi Linier (dengan bantuan SPSS)
Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam
model dapat dilihat pada tabel Canonical Discriminant Function
Coefficient. Tabel ini akandihasilkan pada output apabila pilihan
Function Coefficient bagian Unstandardized diaktifkan.
Menghitung discriminant score
Setelah dibentuk fungsi liniernya, maka dapat dihitung skor
diskriminan untuk tiap observasi dengan memasukkan nilai-nilai
variabel penjelasnya.
Menghitung cutting score
Cutting score (m) dapat dihitung dengan rumus sebagai berikut
1 1 2 2
1 2
Y Y
n n
m
n n
+
=
k
n adalah jumlah sampel pada kelompok ke-k, k=1,2
Kemudian nilai-nilai discriminant score tiap observasi akan
dibandingkan dengan cutting score, sehingga dapat
diklasifikasikan suatu observasi akan termasuk ke dalam kelompok
yang mana. Suatu observasi dengan karakteristik x akan
diklasifikasikan sebagai anggota kelompok kode 1 jika
1
1 2
( )' , y x m
= E >
selain itu dimasukkan ke dalam kelompok
2(kodenol). Penghitungan m dilakukan secara manual, karena
SPSS tidak mengeluarkan output m. Namun, kita dapat
menghitung m dengan bantuan tabel Function at Group Centroids
dari output SPSS.
Penghitungan Hit Ratio (dalam model regresi logistik disebut
percentage correct)
Setelah semua observasi diprediksi keanggotaannya, dapatdihitung
hit ratio, yaitu rasio antara observasi yang tepat
pengklasifikasiannya dengan total seluruh observasi.
b. Kriteria posterior probability
Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah
berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x)
berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability
dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option
probabilities of group membership padabagian Save di kotak dialog utama.
( )
( )
( )
k k
k k
k
p f x
P k x
p f x
Dimana
k
p adalah prior probability kelompok ke-k dan
1
1
2 2
1 1
( ) exp ( ) ( ); 0,1
2
(2 )
k k k p
f x x x k
t
= =
Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota
kelompok 0 jika ( 0 ) ( 1 ) P k x P k x = > = .
b. Aplikasi dengan Menggunakan SPSS
KASUS
Sebuah perusahaan bergerak dalam penjualan Air Mineral Dalam Kemasan
mengumpulkan data sekelompok konsumen air mineral dengan variabel berikut;
- Tipe konsumen dari banyak tipe Air Mineral yang minum dengan kode:
Kode 0 = SEDIKIT (konsumne yang termasuk tipe sedikit minum air
mineral)
Kode 1 = BANYAK (konsumen yang termasuk tipe bnayak minum air
Mineral)
- Usia konsumen (tahun)
- Berat badan konsumen (kilogram)
- Tinggi badan konsumen (centimeter)
- Pendapatan konsumen (ribuan rupiah/bulan)
- Jam kerja konsumen dalam sehari (jam)
- Kegiatan olahraga konsumen dalam sehari (jam)
Dari kasus diatas akan dilakukan analisis diskriminan untuk mengetahui:
- Apakah ada perbedaan yang signifikan antara konsumen yang banyak minum air
mineral dengan konsumen yang sedikit minum air mineral?
- Jika ada perbedaan yang signifikan, variabel apa saja yang membuat perilaku
konsumsi air mineral mereka berbeda?
- Membuat model diskriminan dua faktor (tipe sedikit dan tipe banyak) untuk kasus
tersebut
- Menguji ketepatan model (fungsi) diskriminan
TAHAPAN PENGUJIAN ANALISIS DISKRIMINAN
A. MENGUJI VARIABEL
MENILAI VARIABEL YANG LAYAK UNTUK ANALISIS
Dari SPSS diperoleh output sebagai berikut,
Tests of Equality of Group Means
.945 4.247 1 73 .043
.934 5.173 1 73 .026
.946 4.186 1 73 .044
.894 8.656 1 73 .004
1.000 .000 1 73 .994
.946 4.183 1 73 .044
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
Wilks'
Lambda F df 1 df 2 Sig.
Analisis
Tabel diatas adalah hasilpengujian untuk setiap variabel bebas yang ada.
Keputusan bisa diambil lewat dua cara.
- Dengan angka Wilks Lambda
Angka wilks Lambda berkisar antara 0 sampai 1. Jika angka mendekati 0 maka data
tiap group cenderung berbeda, sedangkan jika angka mendekati 1 maka data tiap
group cenderung sama.
Dari tabel terlihat angka Wilks Lambda berkisar antara 0.894 sampai 1.000. Dari
kolom signifikan dilihat bahwa hanya variable Jam Kerja yang cenderung tidak
berbeda. Hal ini berarti jam kerja untuk mereka yang sedikit atau banyak
mengkonsumsi air mineral tidak berbeda secara nyata.
- Dengan F test
Perhatikan angka signifikan.
Jika sig. > 0.05 berarti tidak ada perbedaan antar grup
Jika sig < 0.05 berarti ada perbedaan antar grup
Analisis dari data diatas adalah
Variabel Usia, angka sig. < 0.05 (yaitu; 0.043). Hal ini berarti ada perbedaan
antar grup, atau usia responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Berat, angka sig. < 0.05 (yaitu; 0.026). Hal ini berarti ada perbedaan
antar grup, atau berat badan responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Tinggi, angka sig. < 0.05 (yaitu; 0.044). Hal ini berarti ada perbedaan
antar grup, atau tinggi responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Income, angka sig. < 0.05 (yaitu; 0.004). Hal ini berarti ada
perbedaan antar grup, atau income responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Jam Kerja, angka sig. > 0.05 (yaitu; 0.994). Hal ini berarti tidak ada
perbedaan antar grup, atau jam kerja responden tidak memengaruhi banyak
sedikitnya mengkonsumsi air mineral.
Variabel Olah Raga, angka sig. < 0.05 (yaitu; 0.44). Hal ini berarti ada
perbedaan antar grup, atau olah raga responden memengaruhi banyak
sedikitnya mengkonsumsi air mineral.
Dari 6 varible tersebut ada lima variabel berbeda secara signifikan untuk dua group
diskriminan, yaitu USIA, BERAT, TINGGI, INCOME, OLAH RAGA. Dengan demikian
sedikit atau banyaknya konsumsi air mineral dipengaruhi oleh variabel-variabel tersebut.
UJI VARIANS DARI SETIAP VARIABEL,
Uji selanjutnya adalah menguji varians dari setiap variabel. Dapat dilakukan dengan dua
cara yaitu dengan Boxs M atau dilihat dari output LOG DETERMINANT.
Analisis diskriminan mempunyai asumsi bahwa:
Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian,
seharusnya varians dari responden yang sedikit mengkonsumsi air mineral sama
dengan varians dari responden yang banyak mengonsumsi air mineral.
Varians diantara variabel-variabel bebas seharusnya juga sama. Jika demikian,
seharusnya varians dari income sama dengan varians dari olah raga.
Kedua pengertian diatas bisa disimpulkan, seharusnya group covariance matrices
adalah relatif sama, yang di uji dengan alat Boxs M dengan ketentuan:
HIPOTESIS
diterima
Jika sig<0.05 berarti
ditolak
Dari SPSS diperoleh output sebagai berikut
Analisis
Dari tabel terlihat bahwa angka sig. > 0,05, yaitu 0.163 yang menerima
berarti group
covariance matrices adalah relatif sama. Hal ini berarti data di atas sudah memenuhi
asumsi analisis diskriminan.
Analisis
Terlihat angka log determinant untuk kategori SEDIKIT (14,081) dan BANYAK (14,520)
tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua
grup.
B. MELAKUKAN ANALISIS DISKRIMINAN
Dari SPSS diperoleh output sebagai berikut
Test Results
29.866
1.297
21
19569.371
.163
Box's M
Approx.
df 1
df 2
Sig.
F
Tests null hypothesis of equal populat ion cov ariance mat rices.
Log Determi nants
6 14.081
6 14.520
6 14.706
MINUM
.00
1.00
Pooled within-groups
Rank
Log
Determinant
The ranks and natural logarithms of determinants
printed are those of the group covariance matrices.
Analisis
Tabel GROUP STATISTICS pada dasarnya berisi data statistic yang utama, yaitu rata-rata
dan standar deviasi dari kedua grup konsumen.
Misalnya, Konsumen yang termasuk tipe SEDIKIT meminum air mineral mempunyai
berat badan rata-rata 57,21 kilogram. Sedangkan konsumen yang termasuk tipe
BANYAK meminum air mineral mempunyai berat badan rata-rata 51,81 kilogram.
Terlihat bahwa ada 38 responden yang tergolong sedikit mengonsumsi air mineral,
sedangkan 37 responden lainnya tergolong banyak mengonsumsi air mineral. Semua
variabel terisi angka 38 atau 37, maka pada kasus ini tidak ada data yang hilang, sehingga
total data untuk semua variabel adalah 75 buah. Tentu ini adalah keadaan yang ideal.
Group Statistics
31.8684 6.1256 38 38.000
57.2105 11.7661 38 38.000
158.4474 5.6650 38 38.000
659.4737 106.7948 38 38.000
5.2684 .1110 38 38.000
3.1974 .5538 38 38.000
28.9459 6.1552 37 37.000
51.8108 8.4848 37 37.000
161.5676 7.4444 37 37.000
578.9189 129.5244 37 37.000
5.2686 .1567 37 37.000
2.9054 .6778 37 37.000
30.4267 6.2734 75 75.000
54.5467 10.5655 75 75.000
159.9867 6.7434 75 75.000
619.7333 124.5313 75 75.000
5.2685 .1345 75 75.000
3.0533 .6312 75 75.000
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
MINUM
.00
1.00
Total
Mean Std. Dev iat ion Unweighted Weighted
Valid N (list wise)
Analisis
Tabel ini menyajikan variabel mana dari variabel input yang bisa dimasukkan ke dalam
persamaan diskriminan.
Karena proses adalah stepwise (bertahap), maka akan dimulai dengan variabel yang
mempunyai angka F hitung (statistic) terbesar.
Tahap pemasukan variabel bebas:
Pada tahap pertama, angka F hitung variabel Income adalah terbesar, mencapai 8.656
maka pada tahap ini variabel Income terpilih.
Pada tahap kedua, dengan variabel yang berkurang satu, angka F hitung terbesar
kedua adalah Berat,mencapai 7.170 maka pada tahap kedua ini variabel Berat terpilih.
Pada tahap ketiga, dengan variabel sudah berkurang dua, angka F hitung terbesar
ketiga adalah Tinggi, mencapai 7.343, maka pada tahap ketiga ini variabel Tinggi
terpilih.
Ketiga variabel tersebut mempunyai angka sig. < 0.05 yaitu angka sig. Income adalah
4.367E-03 < 0.05, angka sig. Berat adalah 1.446E-03 < 0.05, angka sig. Tinggi adalah
2.351E-04 < 0.05.
Variables Entered/Removed
a,b,c,d
INCOME .462
.00 and
1.00
8.656 1 73.000 4.367E-03
BERAT .776
.00 and
1.00
7.170 2 72.000 1.446E-03
TINGGI 1.208
.00 and
1.00
7.343 3 71.000 2.351E-04
Step
1
2
3
Entered Stat istic
Between
Groups Stat istic df 1 df 2 Sig.
Exact F
Min. D Squared
At each st ep, the variable that maximizes t he Mahalanobis distance between t he two closest
groups is entered.
Maximum number of steps is 12.
a.
Maximum signif icance of F to ent er is .05.
b.
Minimum signif icance of F to remov e is .10.
c.
F lev el, tolerance, or VIN insuf f icient f or f urther computation.
d.
Dengan demikian, dari lima variabel yang dimasukkan hanya ada tiga variabel yang
signifikan. Dengan kata lain Income, Berat, Tinggi konsumen memengaruhi perilaku
konsumen tersebut sedikit atau banyak minum air mineral.
Analisis
Pada Step 1, variabel Income adalah variabel pertama yang masuk ke dalam model
diskriminan. Karena variabel tersebut mempunyai angka sig. of F to remove yang
paling sedikit, yaitu 0.004. < 0.05
Pada Step 2, dimasukkan variabel kedua, yaitu Berat. Karena mempunyai angka sig.
0f F to remove sebesar 0.26 < 0.05.
Pada Step 3, dimasukkan variabel ketiga, yaitu Tinggi. Karena mempunyai angka sig.
of F to remove sebesar 0.012 < 0.05.
Variables in the Analysis
1.000 .004
.997 .004 .276
.00 and
1.00
.997 .026 .462
.00 and
1.00
.993 .004 .647
.00 and
1.00
.944 .008 .721
.00 and
1.00
.943 .012 .776
.00 and
1.00
INCOME
INCOME
BERAT
INCOME
BERAT
TINGGI
St ep
1
2
3
Tolerance
Sig. of F to
Remove
Min. D
Squared
Between
Groups
Analisis
Pada Step 0, keenam variabel secara lengkap ditayangkan dengan angka sig. of F to
remove sebagai fakor uji. Angka sig. of F to remove variabel Income terkecil yaitu
0.004 < 0.05. Maka variabel Income dikeluarkan dari step 0, yang berarti variabel
Income bukan termasuk variabel yang tidak dianalisis.
Variables Not in the Analysis
1.000 1.000 .043 .227
.00 and
1.00
1.000 1.000 .026 .276
.00 and
1.00
1.000 1.000 .044 .223
.00 and
1.00
1.000 1.000 .004 .462
.00 and
1.00
1.000 1.000 .994 .000
.00 and
1.00
1.000 1.000 .044 .223
.00 and
1.00
.318 .318 .542 .484
.00 and
1.00
.997 .997 .026 .776
.00 and
1.00
.997 .997 .042 .721
.00 and
1.00
1.000 1.000 .952 .462
.00 and
1.00
.538 .538 .953 .462
.00 and
1.00
.317 .316 .458 .812
.00 and
1.00
.943 .943 .012 1.208
.00 and
1.00
.995 .993 .837 .778
.00 and
1.00
.537 .537 .876 .777
.00 and
1.00
.316 .316 .524 1.238
.00 and
1.00
.958 .908 .779 1.214
.00 and
1.00
.523 .523 .798 1.213
.00 and
1.00
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
USIA
BERAT
TINGGI
JAMKERJA
OLAHRAGA
USIA
TINGGI
JAMKERJA
OLAHRAGA
USIA
JAMKERJA
OLAHRAGA
Step
0
1
2
3
Tolerance
Min.
Tolerance
Sig. of F
to Enter
Min. D
Squared
Between
Groups
Pada Step 1, tersisa lima variabel. Angka sig. of F to remove variabel Berat terkecil
yaitu 0.026 < 0.05. Maka variabel Berat dikeluarkan dari step 1, yang berarti variabel
Berat bukan termasuk variabel yang tidak dianalisis.
Pada Step 2, tersisa empat variabel. Angka sig. of F to remove variabel Tinggi terkecil
yaitu 0.012< 0.05. Maka variabel Tinggi dikeluarkan dari step 2, yang berarti variabel
Tinggi bukan termasuk variabel yang tidak dianalisis.
Pada Step 3, tersisa tiga variabel. Angka sig. of F to remove ketiga variabel tersebut
lebih dari 0.05. Maka variabel tersebut tidak dikeluarkan dari step 3, yang berarti
variabel Tinggi termasuk variabel yang tidak dianalisis.
Wilks Lambda pada prinsipnya adalah varians total dalam discriminant scores yang tidak
bisa dijelaskan oleh perbedaan di antara grup-grup yang ada.
Analisis
Pada Step 1, jumlah variabel yang dimasukkan ada satu Income dengan angka Wilks
Lambda adalah 0.894. hal ini berarti 89,4 % varians tidak dapat dijelaskan perbedaan
antara grup-grup.
Pada Step 2, dengan tambahan variabel Berat, angka Wilks Lambda turun menjadi
0.834.
Pada Step 3, angka Wilks Lambda turun menjadi 0.763. penurunan angka Wilks
Lambda baik untuk model diskriminan, karena varians yang tidak bisa dijelaskan juga
semakin kecil.
Summary of Canonical Discriminant Functions
Wi lks' Lambda
1 .894 1 1 73 8.656 1 73.000 4.367E-03
2 .834 2 1 73 7.170 2 72.000 1.446E-03
3 .763 3 1 73 7.343 3 71.000 2.351E-04
Step
1
2
3
Number of
Variables Lambda df 1 df 2 df 3 Stat istic df 1 df 2 Sig.
Exact F
Ei genvalues
.310
a
100.0 100.0 .487
Function
1
Eigenvalue % of Variance Cumulat iv e %
Canonical
Correlation
First 1 canonical discriminant f unctions were used in t he
analysis.
a.
Analisis
Canonical Correlation mengukur keeratan hubungan antara discriminant score dengan
grup (pada kasus ini, karena ada dua tipe konsumen, maka ada dua grup). Angka 0.487
menunjukkan keeratan yang cukup tinggi, dengan skala asosiasi antara 0 sampai 1.
Analisis
Tabel diatas menyatakan angka akhir dari Wilks Lambda. Angka Chi-Square sebesar
19.321 dengan tingkat signifikansi yang tinggi menunjukkan perbedaan yang jelas antara
dua grup konsumen.
Analisis
Tabel diatas menjelaskan korelasi antara variabel independen dengan fungsi diskriminan
yang terbentuk. Varibel Income paling erat hubungannya dengan fungsi diskriminan,
diikuti oleh variabel Berat dan Tinggi.
Wi lks' Lambda
.763 19.321 3 .000
Test of Function(s)
1
Wilks'
Lambda Chi-square df Sig.
Structure Matrix
.618
.521
.478
.475
-.430
-.069
INCOME
USIA
a
BERAT
OLAHRAGA
a
TINGGI
JAMKERJA
a
1
Function
Pooled within-groups correlations between discriminating
variables and standardized canonical discriminant f unctions
Variables ordered by absolute size of correlat ion wit hin f unction.
This variable not used in the analysis.
a.
Analisis
Tabel diatas menunjukkan FUNGSI DISKRIMINAN:
Kegunaan fungsi ini untuk mengetahui seorang konsumen air mineral masuk pada Grup
yang kesatu atau tergolong pada Grup yang kedua.
Analisis
Karena ada dua tipe konsumen, maka disebut Two-Group Discriminant, dimana grup yang
satu mempunyai Centroid (Grup Means) negative, dan grup yang satu mempunyai
Centroid (Grup Means) positif. Angka pada tabel menunjukkan besaran Z yang
memisahkan kedua grup tersebut.
Gambar :
Canonical Discri minant Function Coeffi cients
.064
-.093
.006
7.884
BERAT
TINGGI
INCOME
(Constant)
1
Function
Unstandardized coef f icient s
Functions at Group Centroids
.542
-.557
MINUM
.00
1.00
1
Function
Unstandardized canonical discriminant
f unct ions ev aluated at group means
0
N=3
8
Z= 0,542 Z= - 0,557
N=3
7
SEDIK
IT
BANYA
K
Terlihat distribusi anggota grup dengan kode 0 (sedikit) dan kode 1 (banyak) , dimana dari
75 responden, 37 orang pada Grup Banyak, dan 38 orang ada pada Grup Sedikit.
Analisis
Tabel diatas memperihatkan komposisi ke 75 responden, yang dengan model diskriminan
menghasilkan 37 responden ada di Grup Banyak dan 38 responden ada di Grup Sedikit.
Analisis
Memberikan persamaan dengan pembagian berdasrkan Grup.
Konsumen yang minum air mineral dalam kategori Sedikit:
SCORE = -297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME
Konsumen yang minum air mineral dalam kategori Banyak:
SCORE = -306,557 3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME
Prior Probabilities for Groups
.500 38 38.000
.500 37 37.000
1.000 75 75.000
MINUM
.00
1.00
Total
Prior Unweighted Weighted
Cases Used in Analy sis
Classificati on Function Coefficients
3.506E-02 -3.48E-02
3.587 3.690
3.641E-02 3.007E-02
-297.882 -306.557
BERAT
TINGGI
INCOME
(Constant)
.00 1.00
MINUM
Fisher's linear discriminant f unctions
Selisih antara Grup Sedikit dengan Grup Banyak adalah
(-297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME) - (306,557
3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME)
Atau
Z Score = 8,675 + 0,06986 BERAT 0,103 TINGGI + 0,00634 INCOME
Disebut fungsi diskriminan dari Fisher yang hampir sama dengan fungsi Unstandarized
sebelumnya.
Analisis
Pada tabel Discriminant Score menunjukkan penghitungan score dari perilaku konsumen
dalam mengonsumsi air mineral.
Hasil score tersebut selanjutnya akan dibandingkan dengan cut off score, untuk
mengetahui apakah konsumen masuk dalam Grup Sedikit atau Grup banyak.
Dari tabel diatas didapat jumlah responden Sedikit adalah 38 orang, sedangkan responden
Banyak adalah 37 orang. Dengan demikian dengan mengaitkannya dengan angka grup
centroid, didapat:
( ) ( ) atau praktis sama dengan
0
Perhitungan
(angka kriris):
Dimana:
: jumlah sampel dari grup A dan B, yang dalam kasus ini adalah grup Sedikit
dan Banyak
Penggunaan angka
(Discriminating Z score):
Angka skor kasus diatas
Karena angka ketepatan tinggi maka model diskriminan di atas sebenarnya bisa digunakan
untuk analisis diskriminan.
Setelah terbukti bahwa Fungsi Diskriminan mempunyai ketepatan prediksi yang tinggi,
maka fungsi diskriminan tersebut bisa digunakan untuk memprediksi sebuah kasus,
apakah akan diklasifikasikan ke tipe sedikit atau tipe banyak.
Kesimpulan
Dari proses diskriminan, dimulai uji variabel sampai analisis output, sehingga didapat
kesimpulan yang terkait dengan tujuan awal.
Ada perbedaan yang signifikan antara konsumen yang banyak minum dengan
konsumen yang sedikit minum air mineral. Hal ini dibuktikan pada analisis Wilks
Lambda.
Variabel yang membuat perilaku konsumsi air mineral mereka berbeda adalah Berat
Badan, Tinggi Bada, dan Income.
Model atau fungsi diskriminan untuk kasus tersebut adalah:
Model (fungsi) diskriminan diatas mempunyai ketepatan mengklasifikasi kasus
sebesar 68 %. Karena diatas 50 %, ketepatan model dianggap tinggi dan model bisa
digunakn untuk mengklasifikasi sebuah kasus pada tipe minum tertentu.
BAB III
PENUTUP
Kesimpulan
Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan
untuk mengelompokkan atau mengklasifikasi suatu objek dalam dua kelompok atau lebih
berdasarkan variabel independentnya.
Asumsi analisis diskriminan yang harus dipenuhi adalah :
5. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate
Normality)..
6. Matriks varians kovarians grup dari semua variabel independen seharusnya sama.
7. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen..
8. Tidak ada korelasi yang kuat antar-variabel independen.
Fungsi diskriminannya
0 1 1 2 2
...
i i j ij
Y b b X b X b X = + + + +
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap
variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam
variabel independen, seharusnya minimal ada 6x5=30 sampel.
Tujuan diskriminan secara umum adalah :
- Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel
dependen atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan
anggota grup 2.
- Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang
membuat perbedaan.
- Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan
persamaan regresi.
- Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris),
apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya)
termasuk grup 1 atau grup 2, atau lainnya.
Proses dasar analisis diskriminan :
- Memisah variabel-variabel menjadi variabel dependen dan Variabel Independen.
- Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua
metode dasar untuk itu, yaitu:
5. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan
secara bersama-sama kemudian dilakukan proses diskriminan.
6. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke
dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada
pada model, dan ada kemungkinan satu atau lebih variabel independen
yang dibuang dari model.
- Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan
Wilks Lambda, Pilai, F test dan lainnya.
- Menguji ketetapan klasifikasi dari fungsi diskriminan, termasuk mengetahui
ketetpan klasifikasi secara individual dengan casewise Diagnotics.
- Melakukan interpretasi terhadap fungsi diskrimminan tersebut.
- Melekukan uji validasi fungsi diskriminan.