P. 1
Analisis Regresi

Analisis Regresi

4.67

|Views: 59,803|Likes:
Published by api-3700955

More info:

Published by: api-3700955 on Oct 14, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

03/18/2014

pdf

text

original

ANALISIS REGRESI

Materi
1. Pendahuluan :Pengertian regresi: 1.1. Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lain

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter
1.3. Koefisien determinasi

1.4.Asumsi model
1.5. Langkah-langkah dalam pemodelan 1.6. Persoalan yang sering dihadapi dalam pemodelan regresi 2. Pengujian asumsi 3. Regresi Linier Sederhana 3.1. Cara pembuatan model regresi linier sederhana 3.2. Pengujian parameter regresi 3.3. Pengujian asumsi 4. Regresi Linier Berganda 4.1. Cara pembuatan model regresi linier sederhana 4.2. Pengujian parameter regresi 4.3. Pengujian asumsi 5. Pemilihan model terbaik 5.1. Best subset regression 5.2. Metode stepwise dan Backward

I.

PENDAHULUAN

PENGERTIAN REGRESI
1.1.Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lain
Digunakan untuk memodelkan hubungan antara variable respons (yang dipengaruhi) dan variable predictor (yang mempengaruhi) 1. REGRESI LINIER SEDERHANA

Y = β 0 + β1 X + ε

2. REGRESI LINIER BERGANDA

Y = β 0 + β1 X 1 β1 + β 2 X 2 + β 3 X 3 + .........β k X k + ε

LINIER DALAM PARAMETER

KETERANGAN: βi : parameter regresi ε : error Y : variabel respons X: variabel predictor 3. CONTOH REGRESI LINIER YANG LAIN:

Y = β 0 + β1 X 21 β1 + β 2 X 2 2 + β 3 X 2 3 + .........β k X 2 k + ε

Y = e β 0 + β1 X +ε
(Dikatagorikan sebagai model regresi linier karena dapat dilinierkan melalui transformasi), Misalnya: Zi = Xi2 Y =

β 0 + β1Z1β1 + β 2 Z 2 + β 3 Z 3 + .........β k Z k + ε
ln Y = β 0 + β1 X + ε Y ' = β 0 + β1 X + ε

Y’ = ln Y

Tujuan utama: menemukan model yang paling sesuai βi???????

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter
Contoh data 1: Diduga ada hubungan linier antara variabel X dan variabel Y, dimana Y dapat dinyatakan sebagai fungsi dari X: Y = f(x) = β0 + β1 x + ε obs X Y 1 1.5 3 2 1.7 2.5 3 2 3.5 4 2.2 3 5 2.5 3.1 6 2.5 3.6 7 2.7 3.2 8 2.9 3.9 9 3 4 10 3.5 4 11 3.8 4.2 12 4.2 4.1 13 4.3 4.8 14 4.6 4.2

Y = f(x) = β0 + β1 x + ε
Y
9 8 7 6 5 4 3 2 1 0 0

Berapa taksiran β0 dan β1

Y

b0 dan b1

CONTOH DATA
2 4 6 8 10

Untuk mendapatkan taksiran dari β0 dan β1, digunakan Metode maximum Likelihood Estimator (MLE) dimana metode ini secara prinsip adalah meminimumkan jumlah kuadrat kesalahan Σεi2 (εi= Y- (β0 + β1 xi). Pengujian parameter dilakukan untuk mengetahui apakah parameter tersebut secara significant berbeda dengan nol atau tidak , artinya apakah memang variabel prediktor X berpengaruh terhadap variabel respon Y dengan besaran β1. Hipotesis dalam pengujian ini adalah : H0: β1 = 0 H1: β1 ≠ 0 Jika H0 diterima artinya memang X tidak berpengaruh terhadap variabel respon Y secara linier.

1.3. Koefisien determinasi dan Asumsi Model Regresi
Koefisien Determinasi Koefisien determinasi, disiimbolkan dengan R2 adalah sebuah besaran yang mengukur ketepatan garis regresi. Nilai R2 ini menunjukkan prosentase besarnya variabilitas dalam data yang dijelaskan oleh model regresi. Maksimum nilai R 2 adalah 100% dan mnimal 0. Jika nilai R2=100%, misalnya untuk regresi linier sederhana semua titik data akan menempel ke garis regresi, semakin kecil R2 maka data makin menyebar jauh dari garis. Oleh karena itu jika R2 kecil maka keeratan hubungan antara X dan Y lemah dan jika R2=0 menunjukkan bahwa X tidak memiliki hubungan dengan Y.

∑ (Y

i

2 ˆ − Y ) = ∑ Yi − Y

(

) + ∑ (Y − Yˆ )
2 i i

2

JUMLAH KUADRAT SEKITAR MEAN

JUMLAH KUADRAT SEKITAR REGRESI

JUMLAH KUADRAT KRN REGRESI JUMLAH KUADRAT TOTAL Y TERKOREKSI

Artinya diantara keragaman y disekitar nilai tengah (mean), sebagian keragaman itu

ˆ berasal dari garis regresi dan sebagian lainnya, ∑ Yi − Yi menunjukkan bahwa amatan – amatan itu tidak seluruhnya terletak pada garis regresi.
Untuk mengevaluasi baik tidaknya garis regresi sebagai peramal dapat dilihat dari berapa banyak variasi disekitar nilai mean terurai (dijelaskan) oleh variasi karena regresi dan variasi di sekitar regresi. Atau: R2 = Asumsi Model Regresi Asumsi model regresi dikaitkan dengan pengujian parameter model dimana pengujian dikatakan sahih jika asumsi model regresi dipenuhi. Asumsi tersebut menyangkut sifat dari distribusi residual (εi), yaitu: εi ~ IIDN (0, σ2) Artinya residual harus menyebar disekitar 0, memiliki varians konstan (identik) dan independen (tidak berkorelasi satu sama lain). Salah satu syarat untuk mencapai ini adalah pengamatan antar Yi tidak berkorelasi, misalnya tidak bersifat time series. Berkaitan dengan metode penaksiran (MLE), maka untuk regresi linier berganda dibutuhkan kondisi bahwa antar variabel X tidak saling berkorelasi (independent). 1.4. Langkah-langkah dalam pemodelan
Definisikan masalahnya pilih responnya Tentukan variabelvaribelnya Kumpulkan data. Periksa mutu data tebaran. Coba modelnya Apakah parameter stabil dalam ruang sampelnya Apakah model sudah divalidasi ?
Ti dak Ya

(

)2

VARIASI KARENA REGRESI VARIASI DI SEKITAR MEAN(TOTAL)

Apakah variabelvariabel itu penting dan tersedia
S top Ti dak Ya

Konsultasikan pada pakar untuk mendapatkan kritik & komentar

Apakah ada ketidakpastian model ?
Tidak

Ya

Matriks korelasi regresi pertama

Tentukan tujuan 2 galat baku, R Taksir biayanya

Buat distribusi variabel-variabel. Tentukan variabelvariabel baru yang dapat menjelaskan sisaan

Apakah koefisienkoefisiennya wajar ? Apakah persamaannya masuk akal ? Apakah persamaan dapat digunakan ?
Tidak Ya

Apakah tujuan dan biaya dapat diterima ?
Ti dak S top

Ya

Peubah ditransformasi, bila perlu, dan tentukan persamaan regresinya

Pemeliharaan model

Apakah sasaran tercapai ?
Tidak

II.
Asumsi residual:

PENGUJIAN ASUMSI

 E(ε i ) = 0

, i= 1,2,3,…..n.

2  Varians ( ε i ) = σ  homoskedastisitas ( identik ).

 Tidak ada autokorelasi antar error; εi dan εj tidak berkorelasi, i ≠ j sehingga cov
(εi, εj) = 0  Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.

, artinya kesalahan error mengikuti distribusi normal dengan rata-rata nol dan varians σ2. Dalam bentuk gambar diilustrasikan sbb :
N β0 + β1 X , σ 2 Y1 Y1

ε i ≈ N ( 0, σ 2 )

(

)

GRS YG SEBENARNYA

β0 ÷ β1 X

X1

X2

. ..........

Xn

X

2.1. Pengujian Asumsi Residual SECARA GRAFIK

1. Over All Plot

-5

0

5

10

Jika model benar  residual akan beristribusi normal dengan mean nol 2. Menyusun normal plot / half normal plot.

Jika jumlah data residual sangat banyak  over all plot dapat dibuat dengan cara membuat histogram

0

0

ˆ 3. Plot εi melawan YI atau Xi
Bentuk-bentuk yang mengkin terjadi:
i

VARIASI TIDAK KONSTAN SEIRING DENGAN MEMBESARNYA Yi  WEIGHTED LEAST SQUARE.

ˆ Yi

ˆ Yi

ADA SUATU POLA TERTENTU, MIS : εi UNTUK Ŷi TERTENTU NEG, DIATAS NILAI Ŷi TSB CENDERUNG POS  MUNGKIN TERJADI KRN β0 DIHILANGKAN.

i

i

MODEL TIDAK SESUAI  BUTUH PENYESUAIAN DENGAN MELAKUKAN TRANSFORMASI

X 1i

X 2i

5. The Time Sequence Plot
10

× ×
0

5

× ×

× 5 ×

× × 10 × ×

15

20

TIME ORDER

-5

ˆ Yi

X

j

Bentuk yang diinginkan
i

RANDOM, MEMBENTUK CONFIDENCE BAND
.

ˆ Yi

2.2. Melalui Pengujian
1. UJI KENORMALAN

e=

∑e
n

i

=0

ei = the unit normal deviate from of the residual i S

ε ei = dapat digunakan untuk melihat apakah asumsi i ~ N (0 , 1) dipenuhi S σ
95 % dari distribusi N (0,1) berada pada limit (-1,96 , 1.96) ~ (-2,2) Jika (n–p) terlalu kecil, maka dapat digunakan pendekatan distribusi t n-p.

III. REGRESI LINIER SEDERHANA
3.1. Cara pembuatan model regresi linier sederhana
Postulate Model Y = f(x) = β0 + β1 x + ε Bermacam-macam bentuk model regresi linier

β0=0

β0
β1=0

β0
1. Taksiran β 0 , β 1  METODE LEAST SQUARE (meminimkan jumlah kuadrat
error)  Model Taksiran :

ˆ Y = bo + b1 X
Y

bo dan b1 adalah taksiran dari β 0 , β 1

9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10

b0 = Y − b1 X

Y

b1 =

∑X Y
i =1 n

n

i i 2 i

− nXY − nX 2

∑X
i =1

3.2.

Pengujian parameter
Tujuan : Menguji pengaruh X terhadap Y  Gunakan Tabel Anova

Langkah-langkah menggunakan minitab : Contoh : Lihat data produksi (Lampiran 2)

Stat>Regressión>Regresión

Dialog Box items: Response: memilih kolom yang berisi variabel Y (respon) Predictors:memilih kolom yangberisi variabel X (prediktor)

Model Regresi yang terbentuk :
The regression equation is PRODUKSI = ­ 7863 + 0.273 BAHAN BAKU Predictor       Coef       StDev          T        P Constant       ­7863        5828      ­1.35    0.192 BAHAN BA     0.27307     0.01376      19.84    0.000 S = 6143        R­Sq = 95.2%     R­Sq(adj) = 94.9% Analysis of Variance Source       DF          SS          MS         F        P Regression    1 14851467624 14851467624    393.55    0.000 Error        20   754744349    37737217 Total        21 15606211973 Unusual Observations Obs  BAHAN BA   PRODUKSI    Fit  StDev Fit   Residual    St Resid 17    513469   146650   132348       1909      14302       2.45R  R denotes an observation with a large standardized residual

3.3.

Pengujian Residual Sebelum dilakukan pengujian residual terlebih dahulu menyimpan residual dan nilai dugaan dalam kolom baru. Stat>Regression>Regression>Storage Dialog Box Items: Diagnostics Measures Residual : Pilih untuk menyimpan residual

Standard residual : Pilih untuk menyimpan residual yang sudah distandarisasi Deleted t residual: Pilih untuk menyimpan Residual Studendized Hi (leverages): Pilih untuk menyimpan leverages Cook’sdistances: Pilih untuk menyimpan cook’s distances DFITS : Pilih untuk menyimpan DFITS Karakteristik estimasi persamaan: Coeffficients : Pilih untuk menyimpan koefisien dari persamaan regresi Fits : Pilih untuk menyimpan nilai dugaan MSE : Pilih untuk menyimpan mean square error (Hal ini juga digambarkan dalam tabel analisis varians, dibawah MS) catatan bahwa akar kuadrat MSE sama dengan s yang juga diikutkan dalam output. X’X inverse: Pilih untuk menyimpan inverse dari X’X. Matrik ini bila dikalikan dengan MSE adalah matrik varians covarians dari koefisien. Jika anda melakukan weigthted regression (lihat options) kemudian pilihan ini disimpan dalam invers matriks X’WX. (lihat juga Stored Regressions Matrices) R matrix: Pilih untuk menyimpan matrik R dari QR atau Cholesky decomposition, lihat Stored Regressions Matrices

Stat>Regression>Regression>Residual Plot menampilkan plot residual untuk mengecek kesesuaian model.

Dialog Box Items: Residual for Plots: anda dapat menentukan tipe residual plot yang mau ditampilkan. Regular :Pilih plot biasa atau residual baris Standardized : Pilih plot untuk residual yang sudah distandarisasi Deleted : Pilih plot untuk rediual studendized yang dihapus Residual Plots Histogram of Residual: pilih untuk menampilkan residual dalam bentuk histogram Normal plot of residuals : pilih untuk menampilkan plot probabilitas normal untuk residual Residual versus fits: Pilih plot residual versus nilai dugaan (Y^) Residual versus order: Pilih plot residual versus urutqan data. Jumlah baris untuk setiap titik data ditunjukkan dengan sumbu X contohnya: 1, 2, 3,…,n Residual versus variabel: Pilih untuk plot residual versus variable yang dipilih, kemudian pilih kolom yang berisi variable ini. Minitab menmpilkan paragraph yang terpisah untuk setiap kolom yang anda enter didalam kotak dialog

Residual Model Diagnostics
Normal Plot of Residuals
Residual
10000 10000 0 -10000
-3.0SL=-13103 X=0.000

I Chart of Residuals
1 3.0SL=13103

0

-10000 -2 -1 0 1 2

Residual

0

10

20

Normal Score

Observation Number

Histogram of Residuals
8 7 6 5 4 3 2 1 0 -12000 -8000 -4000 0 40008000 12000 16000

Residuals vs. Fits
10000

Frequency

Residual

0

-10000 60000 80000 100000 120000 140000

Residual

Fit

IV.

REGRESI LINIER BERGANDA

4.1. Struktur Data Contoh: Data tentang hasil produksi, bahan baku, tenaga kerja dan jenis mesin No 1 2 3 4 . . . 20 21 22 Y Produksi 74970 106430 83285 86810 . . . 131767 110120 88333 X1 X2 Bahan baku Tenaga kerja 308956 29 416141 35 325644 32 339427 29 . . . . . . 515209 39 472347 35 378199 29 X3 Mesin 11 12 12 11 . . . 12 12 11

Akan dibuat model regresi yang menghubungkan hasil produksi dengan bahan baku, tenaga kerja dan mesin. Y : Hasil produksi X1: Bahan baku X2: Tenaga kerja X3: Mesin 4.2. Cara Penaksiran Parameter Regresi dan Pengujian Model  Postulate Model :

Dalam bentuk Matriks Y = X β + ε Dimana:

Y=

Y1  Y   2 .    .  .    Yn   

X=

1 x11 ... xk 1    .  . . . . .    .  . . 1 x ... x  kn   1n

β=

β 0  β   1 .    .  .    β k   

ε 0  ε   1 .  ε =  .  .    ε k   

Taksiran parameter menggunakan metode Metode Least Square, diperoleh: Estimasi Parameter : b = ( X’ X) -1 X’Y Model estimasinya:

ˆ Y = Xb

Sebagai contoh model yang memuat 2 variabel prediktor dapat digambarkan sebagai berikut:

Model regresi yang menjelaskan hubungan antara kualitas dengan variable temperature dan tekanan.
2 2 ˆ y = −5.127,9 + 31,10 x1 + 39,75 x 2 − −0,146 x1 x 2 − 0,133x1 − 1,14 x 2

Pengujian Model:
Uji Serentak (Overall)  Hipotesa: Ho : β1 = β2 = … = βk = 0 H1 : minimal ada satu βi ≠ 0, dimana i = 1, 2, 3, …, k  Statistik Uji:

MS regr MS res

=

SS regr / k

SS res / n − (k + 1)

=

SS regr (b1 , b2 ,...bk | b0 ) s2

Fhitung =  Daerah Kritis: tolak Ho, jika Fhitung ≥ F k;n-(k+1);α

Tabel Anova
Sumber variasi Regresi Residual Total terkoreksi Derajat bebas k n-(k+1) n-1 Jumlah kuadrat b1 X1 Y − nY 2 Y1Y-b1X1Y Y 1Y − n Y 2 Rata – rata jumlah kuadrat (b1 X1 Y − nY 2 ) = MSregr k ( Y1 Y − b 1 X1 Y ) = MSres ( n − k − 1) F hitung MSregr / MSres

Uji Indvidu Untuk menguji signifikansi dari pengaruh masing-masing variabel terhadap variabel y (respons)  Hipotesa : Ho : βi = 0 H1 : βi ≠ 0

, i = 1, 2, …, k , i = 1, 2, …, k

 Statistik Uji : bi thitung = sd (b ) i  Daerah Kritis : Tolak Ho, jika | thitung | > t 1-α/2,n-(k+1)

4.3. Pembuatan Model dengan Menggunakan Minitab
Gunakan data produksi diatas 1. Klik Stat > Regression > Regression 2. Masukkan variabel Produksi (Y) ke kotak Response dan variabel Bahan Baku dan Tenaga Kerja (X1 dan X2) ke kotak Prediktors. Klik OK

Untuk mengontrol tampilan output pada window session Klik Stat>Regression>Regression>Results Dialog Box Items: Kontrol tampilan hasil Display nothing: Pilih untuk tidak menampilkan apa-apa Regression equation, table of coefficients, s, R-squared, and basic analysis of variance: Pilih untuk menampilkan beberapa output keluaran regresi In addition, sequential sums of square nand the unusual observation in the table of fits and residual: Pilih untuk menampilkan tambahan dari sebelumnya, sequential sum of squares (ditambahkan jumlahan kuadrat yang dijelaskan oleh setiap tambahan predictor) dan suatu tabel untuk nilai-nilai yang tidak umum In addition, the full table of fits and residuals: Pilih untuk menampilkan tambahan sebelumnya, suatu tabel nilai dugaan dan observasi redual

Output :
The regression equation is PRODUKSI = ­ 19592 + 0.245 BAHAN BAKU + 715 TENAGA KERJA Predictor       Coef       StDev          T        P Constant      ­19592        9065      ­2.16    0.044 BAHAN BA     0.24461     0.02177      11.23    0.000 TENAGA K       715.1       434.9       1.64    0.117 S = 5897        R­Sq = 95.8%     R­Sq(adj) = 95.3% Analysis of Variance Keterangan: Jika digunakan α=5%, maka tenaga kerja terlihat tidak signifikan dalam model. Mengapa???

Source       DF          SS          MS         F        P Regression    2 14945508709  7472754354    214.90    0.000 Error        19   660703264    34773856 Total        21 15606211973

Source       DF      Seq SS BAHAN BA      1 14851467624 TENAGA K      1    94041084 Unusual Observations Obs  BAHAN BA   PRODUKSI    Fit  StDev Fit   Residual    St Resid  17   513469     146650  133897     2061      12753       2.31R  R denotes an observation with a large standardized residual

Interpretasi:

 Dari ANOVA  Model regresi signifikan pada alpha 5%
 Interpretasi model :  Bila bahan baku meningkat 1 (satuan), maka produksi akan meningkat 18,3%. Dengan syarat variabel lain konstan.  Bila tenaga kerja bertambah 1 orang, maka produksi akan meningkat sebesar 919. Dengan syarat variabel lain konstan.  Dan bila mesin bertambah 1 buah, maka produksi akan meningkat 5766 kali. PENGUJIAN RESIDUAL
Residual Model Diagnostics
Normal Plot of Residuals
10000 20000
3.0SL=14787

I Chart of Residuals
10000

Residual

Residual

0

0 -10000

X=-2.0E-11

-3.0SL=-14787

-10000 -2 -1 0 1 2

-20000 0 10 20

Normal Score

Observation Number

Histogram of Residuals
5 10000 4 3 2 1 0 -8000 -4000 -6000 -2000 0 2000000000 000 4 6 8 10000 -10000 50000

Residuals vs. Fits

Frequency

Residual

Asumsi Residual dari model yang terbentuk terpenuhi, yaitu identik, independen, berdistribusi normal (IIDN)

0

100000

150000

Residual

Fit

Catatan:

Bila akan menambahkan variable baru: Prediction intervals for new observation : memasukkan nilai baru yang ingin diprediksi sebagai respon Confidence Level : Storage : pilih untuk menyimpan tambahan dari sebelumnya Fits : pilih untuk menyimpan fitted values untuk observasi yang baru SEs of fits : pilih untuk mengestimasi standard error dari nilai dugaannya Confidence limits : pilih untuk menampilkan batas keyakinan dengan batas atas dan batas bawah

Prediction limits : pilih untuk menampilkan nilai prediksi dengan batas atas dan batas bawah

V.

PEMILIHAN MODEL TERBAIK

Jika antar variabel prediktor saling berkorelasi satu sama lain, dikatakan terjadi kasus multicolinear. Hal ini kana mengakibatkan beberapa variabel prediktor tidak significant berada dalam model valaupun sesungguhnya variabel tersebut berhubungan sangat erat dengan variabel respon Y. Untuk mendapatkan model yang diinginkan terdapat dua pertimbangan dalam pembentukan model, diantaranya: • Agar persamaan regresi bermanfaat untuk tujuan prediksi, serigkali diinginkan model yang memuat sebanyak-banyaknya variabel X (prediktor) yang mempengaruhi variabel Y (respon) • Kareena pertimbangan biaya untuk mendapatkan informasi, maka digunakan sesedikit mungkin variabel X (prediktor) yang mempengaruhi variabel Y (respon) Untuk itu dibutuhkan metode untuk dapat mengakomodasikan dua kepentingan di atas dengan cara Selecting the best regression equation. Berikut ini adalah cara-cara yang sering digunakan dalam memilih model terbaik. 5.1. Best Subset Model Memilih semua subset (model) yang terbaik yang memenuhi kriteria diatas. Kriteria yang digunakan adalah: R2 terbesar MS residual terkecil Cp yang mendekati jumlah parameter Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Best Subsets Dalog box items Respons : Masukkan kolom yang memuat variabel respon Y Free predictors: masukkan yang memuat variabel –variabel prediktor X (maksimum 31 variabel) Predictors in all models: pilih kolom-kolom yang memuat variabel yang ingin dimasukkan dalam model. Kolom-kolom ini tidak boleh terdaftar dalam Free predictors. Jika anda menganalisis data dengan lebih dari 15 variabel prediktor, pertimbangkan termasuk variabel prediktor ini dalam rangka mengurangi jumlah free variables dan mempercepat proses perhitungan.

Best Subsets Regression
Response is Y               R­Sq                    X X X X X  Vars   R­Sq   (adj)   C­p         S   1 2 3 4 5     1   92.3   92.0   25.4    27.314         X       1   88.5   88.1   50.3    33.288   X             2   95.4   95.0    6.9    21.580   X     X       2   92.6   92.1   25.1    27.188     X   X       3   96.4   96.0    2.0    19.378   X     X X     3   95.7   95.2    6.8    21.222   X X   X       4   96.4   95.8    4.0    19.758   X   X X X     4   96.4   95.8    4.0    19.762   X X   X X     5   96.4   95.6    6.0    20.165   X X X X X 

5.2. Stepwise and Eliminasi Backward Regression Stepwise Regression Model dibuat dengan memasukkan variabel prediktor satu persatu (secara bertahap) mulai dari variabel X yang memiliki korelasi tinggi Langkah-langkahnya: 1. Cari variabel X yang berkorelasi paling tinggi dengan Y, kemudian buat regresinya 2. Pemilihan variabel berikutnya adalah variabel yag memiliki korelasi parsial terbesar dengan Y dan buat model dengan memasukkan variabel tersebut. 3. Uji parameter yang telah ada di dalam model 4. Begitu seterusnya ulangi langkah 2-3 sampai diperoleh model terbaik Eliminasi Backward Membuat model dengan memasukkan semua variabel kemudian dikeluarkan satu persatu dengan melakukan pengujian terhadap parameter –parameternya dengan menggunakan partial F test. Nilai partial F-test (FL) terkecil dibandingkan dengan F0 table:

• •

Jika FL < F0, maka X yang bersangkutan dikeluarkan dari model dan dilanjutkan dengan pembuatan model baru tanpa variable tersebut Jika FL > F0, maka proses dihentikan dan persamaan terakhir tersebut yang digunakan/dipilih.

Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Stepwise>Methods Dalog box items Stepwise (forward and backward): pilih standard stepwise regression Predictor in initial model: masukkan variabelprediktor. Variabel ini akan dikeluarkan jika p-value lebih besar dari alpha to enter value (Jika ingin mempertahankan variabel tertentu dalam model abaikan nilai p-value dan enter variabel tersebut dalam Predictor to include in every model dalam box utama) Alpha to enter : tetapkan nilai α untuk memasukkan variable dalam model Alpha to remove: tetapkan nilai α untuk mengeluarkan variable dalam model Forward selection: pilih Forward selection Alpha to enter : tetapkan nilai α untuk memasukkan variable dalam model Backward elimination Alpha to remove: tetapkan nilai α untuk mengeluarkan variable dalam model Force: masukkan variabel prediktor yang tidak ingin dikeluarkan dari model. Contoh: Klik Stat > Regression > Stepwise Masukkan variabel X dan Y. Klik OK Gunakan data di Lampiran 2 Y = berat limbah blontong (kuintal) X1 = berat kapur tohor (kuintal) X2 = berat sulfur (kg) X3 = berat flokulan (kg) X4 = berat tebu (kuintal) X5 = berat fosfat (kg)

Variabel X1-X5 dipilih untuk dimasukkan dalam model

Stepwise Regression
 F­to­Enter:      4.00    F­to­Remove:      4.00  Response is    Y     on  5 predictors, with N =   30     Step        1        2        3 Constant    74.68    74.56    74.72 X1          0.076    0.076    0.076 T­Value      4.80     4.95     5.25 X2         ­0.001                   T­Value     ­0.01                   X3            0.3      0.3          T­Value      0.10     0.10          X4         0.0209   0.0209   0.0209 T­Value      6.35     7.01     7.17 X5           ­4.7     ­4.7     ­4.7 T­Value     ­2.19    ­2.68    ­2.74 S            20.2     19.8     19.4 R­Sq        96.40    96.40    96.39

Jumlah variable yang signifikan dalam model hanya 3 variabel yaitu X1, X4 dan X5.Model yang terbentuk: Y=74,72 + 0,076 X1+0,0209 X4-4,7 X5 R2=96,39

Variabel X1-X5 ingin dimasukkan dalam model.

Stepwise Regression
 F­to­Enter:      4.00    F­to­Remove:      4.00  Response is    Y     on  5 predictors, with N =   30     Step        1 Constant    74.68 X1          0.076 T­Value      4.80 X2         ­0.001 T­Value     ­0.01 X3            0.3 T­Value      0.10 X4         0.0209 T­Value      6.35 X5           ­4.7 T­Value     ­2.19 S            20.2

R­Sq        96.40

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->