Analisis Regresi

ANALISIS REGRESI
Materi
1. Pendahuluan :Pengertian regresi:

1.1. Pengertian regresi, regresi linier sederhana dan regresi liner berganda
serta bentuk-bentuk yang lain
1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter
1.3. Koefisien determinasi
1.4.Asumsi model
1.5. Langkah-langkah dalam pemodelan
1.6. Persoalan yang sering dihadapi dalam pemodelan regresi
2. Pengujian asumsi
3. Regresi Linier Sederhana
3.1. Cara pembuatan model regresi linier sederhana
3.2. Pengujian parameter regresi
3.3. Pengujian asumsi
4. Regresi Linier Berganda
4.2. Pengujian parameter regresi
4.3. Pengujian asumsi
5. Pemilihan model terbaik
5.1. Best subset regression
5.2. Metode stepwise dan Backward
I. PENDAHULUAN
PENGERTIAN REGRESI
1.1.Pengertian regresi, regresi linier sederhana dan regresi liner berganda

serta bentuk-bentuk yang lain
Digunakan untuk memodelkan hubungan antara variable respons (yang dipengaruhi)

dan variable predictor (yang mempengaruhi)
1. REGRESI LINIER SEDERHANA

Y = β 0 + β1 X + ε
2. REGRESI LINIER BERGANDA LINIER DALAM
Y = β 0 + β1 X 1 β1 + β 2 X 2 + β 3 X 3 + .........β k X k + ε PARAMETER
KETERANGAN:
βi : parameter regresi
ε : error
Y : variabel respons
X: variabel predictor
3. CONTOH REGRESI LINIER YANG LAIN:

Y = β 0 + β1 X 21 β1 + β 2 X 2 2 + β 3 X 2 3 + .........β k X 2 k + ε
Y = e β 0 + β1 X +ε
(Dikatagorikan sebagai model regresi linier karena dapat dilinierkan melalui
transformasi), Misalnya:
Zi = Xi2 Y = β 0 + β1Z1β1 + β 2 Z 2 + β 3 Z 3 + .........β k Z k + ε
Y’ = ln Y ln Y = β 0 + β1 X + ε
Y ' = β 0 + β1 X + ε
Tujuan utama: menemukan model yang paling sesuai βi???????
1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter
Contoh data 1:
Diduga ada hubungan linier antara variabel X dan variabel Y, dimana Y dapat
dinyatakan sebagai fungsi dari X:
Y = f(x) = β0 + β1 x + ε
obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14
X 1.5 1.7 2 2.2 2.5 2.5 2.7 2.9 3 3.5 3.8 4.2 4.3 4.6
Y 3 2.5 3.5 3 3.1 3.6 3.2 3.9 4 4 4.2 4.1 4.8 4.2
Y = f(x) = β0 + β1 x + ε
Y
9 Berapa taksiran β0 dan β1

8
7
6
5
4
Y
b0 dan b1
3
2
1
0 CONTOH DATA
0 2 4 6 8 10
Untuk mendapatkan taksiran dari β0 dan β1, digunakan Metode maximum Likelihood
Estimator (MLE) dimana metode ini secara prinsip adalah meminimumkan jumlah
kuadrat kesalahan Σεi2 (εi= Y- (β0 + β1 xi).
Pengujian parameter dilakukan untuk mengetahui apakah parameter tersebut
secara significant berbeda dengan nol atau tidak , artinya apakah memang variabel
prediktor X berpengaruh terhadap variabel respon Y dengan besaran β1. Hipotesis
dalam pengujian ini adalah :
H0: β1 = 0
H1: β1 ≠ 0
Jika H0 diterima artinya memang X tidak berpengaruh terhadap variabel respon Y secara
linier.
1.3. Koefisien determinasi dan Asumsi Model Regresi
Koefisien Determinasi
Koefisien determinasi, disiimbolkan dengan R2 adalah sebuah besaran yang

mengukur ketepatan garis regresi. Nilai R2 ini menunjukkan prosentase besarnya
variabilitas dalam data yang dijelaskan oleh model regresi. Maksimum nilai R 2 adalah
100% dan mnimal 0. Jika nilai R2=100%, misalnya untuk regresi linier sederhana semua
titik data akan menempel ke garis regresi, semakin kecil R2 maka data makin menyebar
jauh dari garis. Oleh karena itu jika R2 kecil maka keeratan hubungan antara X dan Y
lemah dan jika R2=0 menunjukkan bahwa X tidak memiliki hubungan dengan Y.
∑ (Y i
2
(
− Y ) = ∑ Yî − Y ) + ∑ (Y − Yˆ )
2
i i
2
JUMLAH KUADRAT JUMLAH KUADRAT

SEKITAR MEAN SEKITAR REGRESI
JUMLAH KUADRAT
KRN REGRESI
JUMLAH KUADRAT TOTAL

Y TERKOREKSI
Artinya diantara keragaman y disekitar nilai tengah (mean), sebagian keragaman itu
berasal dari garis regresi dan sebagian lainnya, ∑ Yi − Yî ( )2
menunjukkan bahwa
amatan – amatan itu tidak seluruhnya terletak pada garis regresi.
Untuk mengevaluasi baik tidaknya garis regresi sebagai peramal dapat dilihat dari
berapa banyak variasi disekitar nilai mean terurai (dijelaskan) oleh variasi karena regresi
dan variasi di sekitar regresi. Atau:
VARIASI KARENA REGRESI
R2 =
VARIASI DI SEKITAR MEAN(TOTAL)
Asumsi Model Regresi
Asumsi model regresi dikaitkan dengan pengujian parameter model dimana

pengujian dikatakan sahih jika asumsi model regresi dipenuhi. Asumsi tersebut
menyangkut sifat dari distribusi residual (εi), yaitu:
εi ~ IIDN (0, σ2)
Artinya residual harus menyebar disekitar 0, memiliki varians konstan (identik) dan
independen (tidak berkorelasi satu sama lain). Salah satu syarat untuk mencapai ini
adalah pengamatan antar Yi tidak berkorelasi, misalnya tidak bersifat time series.
Berkaitan dengan metode penaksiran (MLE), maka untuk regresi linier berganda
dibutuhkan kondisi bahwa antar variabel X tidak saling berkorelasi (independent).
1.4. Langkah-langkah dalam pemodelan
Definisikan Apakah parameter

Kumpulkan data.
masalahnya pilih stabil dalam ruang
Periksa mutu data
responnya sampelnya
tebaran. Coba
Tentukan variabel- Apakah model
modelnya
varibelnya sudah divalidasi ?
Ti dak Ya
Apakah variabel- Konsultasikan

Apakah ada
variabel itu pada pakar untuk
ketidakpastian
penting dan mendapatkan
model ?
tersedia kritik & komentar
S top Ti dak Ya
Tidak
Ya
Matriks korelasi Buat distribusi
regresi pertama variabel-variabel. Apakah koefisien-
Tentukan variabel- koefisiennya wajar ?
variabel baru yang
dapat menjelaskan Apakah
Tentukan tujuan sisaan persamaannya
galat baku, R2 masuk akal ?
Taksir biayanya Apakah persamaan
Peubah dapat digunakan ?
ditransformasi, bila
perlu, dan tentukan Tidak Ya
Apakah tujuan Ya persamaan
dan biaya dapat regresinya Pemeliharaan
diterima ? model
Ti dak Apakah sasaran

tercapai ?
S top
Tidak
II. PENGUJIAN ASUMSI
Asumsi residual:
 E(ε i ) = 0 , i= 1,2,3,…..n.
 Varians ( ε i ) = σ  homoskedastisitas ( identik ).

2
 Tidak ada autokorelasi antar error; εi dan εj tidak berkorelasi, i ≠ j sehingga cov
(εi, εj) = 0
 Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.
 ε i ≈ N ( 0, σ 2 )
, artinya kesalahan error mengikuti distribusi normal
dengan rata-rata nol dan varians σ2.
Dalam bentuk gambar diilustrasikan sbb :
(
N β0 + β1 X , σ 2 )
Y1
Y1
GRS YG SEBENARNYA
β0 ÷ β1 X
X1 X2 . .......... Xn X
2.1. Pengujian Asumsi Residual SECARA GRAFIK
1. Over All Plot
-5 0 5 10
Jika model benar  residual akan beristribusi normal dengan mean nol
2. Menyusun normal plot / half normal plot.

• Jika jumlah data residual sangat banyak  over all plot dapat dibuat
dengan cara membuat histogram
0 0
3. Plot εi melawan ŶI atau Xi

Bentuk-bentuk yang mengkin terjadi:
i • VARIASI TIDAK KONSTAN

SEIRING DENGAN MEMBESAR-
NYA Yi  WEIGHTED LEAST
SQUARE.
Yî
• ADA SUATU POLA TERTENTU,

MIS : εi UNTUK Ŷi TERTENTU
NEG, DIATAS NILAI Ŷi TSB
CENDERUNG POS
Yî  MUNGKIN TERJADI KRN
β0 DIHILANGKAN.
i i
X 1i X 2i
MODEL TIDAK SESUAI  BUTUH PENYESUAIAN DENGAN
MELAKUKAN TRANSFORMASI
5. The Time Sequence Plot
10
×
5 ×
×
0
× ×
5
× 10 × 15 20
× TIME ORDER
-5
× Ŷi
× X j
Bentuk yang diinginkan
i
RANDOM,
MEMBENTUK CONFIDENCE BAND
.
Ŷi
2.2. Melalui Pengujian
1. UJI KENORMALAN
e=
∑e i
=0
n
ei
= the unit normal deviate from of the residual i
S
ei ε
= dapat digunakan untuk melihat apakah asumsi i ~ N (0 , 1) dipenuhi
S σ
95 % dari distribusi N (0,1) berada pada limit (-1,96 , 1.96) ~ (-2,2)
Jika (n–p) terlalu kecil, maka dapat digunakan pendekatan distribusi t n-p.
III. REGRESI LINIER SEDERHANA
Postulate Model
Y = f(x) = β0 + β1 x + ε
Bermacam-macam bentuk model regresi linier
β0=0
β0
β1=0
β0
1. Taksiran β 0 , β 1  METODE LEAST SQUARE (meminimkan jumlah kuadrat

error)
 Model Taksiran : ˆ =b +b X
Y o 1
bo dan b1 adalah taksiran dari β 0 , β 1
b0 = Y − b1 X
9
8
7
n
∑X Y
6
5 i i − nXY
Y
4
b1 = i =1
n
∑X
3
2
2
i − nX 2
1 i =1
0
0 2 4 6 8 10
3.2. Pengujian parameter

Tujuan :
Menguji pengaruh X terhadap Y  Gunakan Tabel Anova
Langkah-langkah menggunakan minitab :
Contoh :
Lihat data produksi (Lampiran 2)
Stat>Regressión>Regresión
Dialog Box items:
Response: memilih kolom yang berisi variabel Y (respon)
Predictors:memilih kolom yangberisi variabel X (prediktor)
Model Regresi yang terbentuk :
The regression equation is
PRODUKSI = 7863 + 0.273 BAHAN BAKU
Predictor Coef StDev T P
Constant 7863 5828 1.35 0.192
BAHAN BA 0.27307 0.01376 19.84 0.000
S = 6143 RSq = 95.2% RSq(adj) = 94.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 14851467624 14851467624 393.55 0.000
Error 20 754744349 37737217
Total 21 15606211973
Unusual Observations
Obs BAHAN BA PRODUKSI Fit StDev Fit Residual St Resid
17 513469 146650 132348 1909 14302 2.45R
R denotes an observation with a large standardized residual
3.3. Pengujian Residual

Sebelum dilakukan pengujian residual terlebih dahulu menyimpan residual dan nilai
dugaan dalam kolom baru.
Stat>Regression>Regression>Storage
Dialog Box Items:
Diagnostics Measures
Residual : Pilih untuk menyimpan residual
Standard residual : Pilih untuk menyimpan residual yang sudah
distandarisasi
Deleted t residual: Pilih untuk menyimpan Residual Studendized
Hi (leverages): Pilih untuk menyimpan leverages
Cook’sdistances: Pilih untuk menyimpan cook’s distances
DFITS : Pilih untuk menyimpan DFITS
Karakteristik estimasi persamaan:
Coeffficients : Pilih untuk menyimpan koefisien dari persamaan regresi
Fits : Pilih untuk menyimpan nilai dugaan
MSE : Pilih untuk menyimpan mean square error (Hal ini juga digambarkan
dalam tabel analisis varians, dibawah MS) catatan bahwa akar kuadrat MSE sama
dengan s yang juga diikutkan dalam output.
X’X inverse: Pilih untuk menyimpan inverse dari X’X. Matrik ini bila dikalikan
dengan MSE adalah matrik varians covarians dari koefisien. Jika anda melakukan
weigthted regression (lihat options) kemudian pilihan ini disimpan dalam invers
matriks X’WX. (lihat juga Stored Regressions Matrices)
R matrix: Pilih untuk menyimpan matrik R dari QR atau Cholesky decomposition,
lihat Stored Regressions Matrices
Stat>Regression>Regression>Residual Plot
menampilkan plot residual untuk mengecek kesesuaian model.
Dialog Box Items:
Residual for Plots: anda dapat menentukan tipe residual plot yang mau ditampilkan.
Regular :Pilih plot biasa atau residual baris
Standardized : Pilih plot untuk residual yang sudah distandarisasi
Deleted : Pilih plot untuk rediual studendized yang dihapus
Residual Plots
Histogram of Residual: pilih untuk menampilkan residual dalam bentuk
histogram
Normal plot of residuals : pilih untuk menampilkan plot probabilitas normal untuk
residual
Residual versus fits: Pilih plot residual versus nilai dugaan (Y^)
Residual versus order: Pilih plot residual versus urutqan data. Jumlah baris untuk
setiap titik data ditunjukkan dengan sumbu X contohnya: 1, 2, 3,…,n
Residual versus variabel: Pilih untuk plot residual versus variable yang dipilih,
kemudian pilih kolom yang berisi variable ini. Minitab menmpilkan paragraph
yang terpisah untuk setiap kolom yang anda enter didalam kotak dialog
Residual Model Diagnostics

Normal Plot of Residuals I Chart of Residuals
1
3.0SL=13103
10000 10000
Residual
Residual
0 0 X=0.000
-10000
-10000 -3.0SL=-13103
-2 -1 0 1 2 0 10 20
Normal Score Observation Number
Histogram of Residuals Residuals vs. Fits

8
7 10000
Frequency
6
Residual
5
4
0
3
2
1
-10000
0
-12000
-8000-4000 0 4000800012000
16000 60000 80000 100000 120000 140000
Residual Fit
IV. REGRESI LINIER BERGANDA
4.1. Struktur Data
Contoh:
Data tentang hasil produksi, bahan baku, tenaga kerja dan jenis mesin
No Y X1 X2 X3
Produksi Bahan baku Tenaga kerja Mesin
1 74970 308956 29 11
2 106430 416141 35 12
3 83285 325644 32 12
4 86810 339427 29 11
. . . . .
. . . . .
. . . . .
20 131767 515209 39 12
21 110120 472347 35 12
22 88333 378199 29 11
Akan dibuat model regresi yang menghubungkan hasil produksi dengan bahan baku,
tenaga kerja dan mesin.
Y : Hasil produksi
X1: Bahan baku
X2: Tenaga kerja
X3: Mesin
4.2. Cara Penaksiran Parameter Regresi dan Pengujian Model
 Postulate Model :
Dalam bentuk Matriks Y = X β + ε
Dimana:
Y1  β 0  ε 0 
Y  1 x11 ... xk 1  β  ε 
 2    1  1
.  . . . 
.  . 
Y=   X= . . .  β=   ε = 
.    .  . 
.  . . .  .  . 
  1 x ... x     
 1n kn 
Yn   β k  ε k 
Taksiran parameter menggunakan metode Metode Least Square, diperoleh:

Estimasi Parameter : b = ( X’ X) -1 X’Y
Model estimasinya:
ˆ = Xb
Y
Sebagai contoh model yang memuat 2 variabel prediktor dapat digambarkan sebagai
berikut:
Model regresi yang menjelaskan hubungan antara kualitas dengan

variable temperature dan tekanan.
2 2
yˆ = −5.127,9 + 31,10 x1 + 39,75 x 2 − −0,146 x1 x 2 − 0,133x1 − 1,14 x 2
Pengujian Model:
Uji Serentak (Overall)

 Hipotesa:
Ho : β1 = β2 = … = βk = 0
H1 : minimal ada satu βi ≠ 0, dimana i = 1, 2, 3, …, k
 Statistik Uji:
MS regr SS regr / k SS regr (b1 , b2 ,...bk | b0 )
= =
MS res SS res / n − (k + 1) s2
Fhitung =
 Daerah Kritis:
tolak Ho, jika Fhitung ≥ F k;n-(k+1);α
Tabel Anova
Sumber Derajat Jumlah Rata – rata

F hitung
variasi bebas kuadrat jumlah kuadrat
(b1 X1 Y − nY 2 ) MSregr /
Regresi k b1 X1 Y − nY 2 = MSregr
k MSres
Residual ( Y1 Y − b 1 X1 Y )
n-(k+1) Y1Y-b1X1Y = MSres
( n − k − 1)
Total
n-1 Y 1Y − n Y 2
terkoreksi
Uji Indvidu
Untuk menguji signifikansi dari pengaruh masing-masing variabel terhadap variabel y

(respons)
 Hipotesa :
Ho : βi = 0 , i = 1, 2, …, k
H1 : βi ≠ 0 , i = 1, 2, …, k
 Statistik Uji : bi
thitung = sd (b )
i
 Daerah Kritis :
Tolak Ho, jika | thitung | > t 1-α/2,n-(k+1)
4.3. Pembuatan Model dengan Menggunakan Minitab
Gunakan data produksi diatas

1. Klik Stat > Regression > Regression
2. Masukkan variabel Produksi (Y) ke kotak Response dan variabel Bahan Baku dan
Tenaga Kerja (X1 dan X2) ke kotak Prediktors. Klik OK
Untuk mengontrol tampilan output pada window session Klik
Stat>Regression>Regression>Results
Dialog Box Items:
Kontrol tampilan hasil

Display nothing: Pilih untuk tidak menampilkan apa-apa
Regression equation, table of coefficients, s, R-squared, and basic analysis of
variance: Pilih untuk menampilkan beberapa output keluaran regresi
In addition, sequential sums of square nand the unusual observation in the table
of fits and residual: Pilih untuk menampilkan tambahan dari sebelumnya,
sequential sum of squares (ditambahkan jumlahan kuadrat yang dijelaskan oleh
setiap tambahan predictor) dan suatu tabel untuk nilai-nilai yang tidak umum
In addition, the full table of fits and residuals: Pilih untuk menampilkan tambahan
sebelumnya, suatu tabel nilai dugaan dan observasi redual
Output :
The regression equation is
PRODUKSI = 19592 + 0.245 BAHAN BAKU + 715 TENAGA KERJA
Predictor Coef StDev T P Keterangan:
Jika digunakan
Constant 19592 9065 2.16 0.044
α=5%, maka
BAHAN BA 0.24461 0.02177 11.23 0.000 tenaga kerja
TENAGA K 715.1 434.9 1.64 0.117 terlihat tidak
signifikan dalam
S = 5897 RSq = 95.8% RSq(adj) = 95.3% model.
Mengapa???
Analysis of Variance
Source DF SS MS F P
Regression 2 14945508709 7472754354 214.90 0.000
Error 19 660703264 34773856
Total 21 15606211973
Source DF Seq SS
BAHAN BA 1 14851467624
TENAGA K 1 94041084
Unusual Observations
Obs BAHAN BA PRODUKSI Fit StDev Fit Residual St Resid
17 513469 146650 133897 2061 12753 2.31R
R denotes an observation with a large standardized residual
Interpretasi:
 Dari ANOVA  Model regresi signifikan pada alpha 5%

 Interpretasi model :
 Bila bahan baku meningkat 1 (satuan), maka produksi akan meningkat
18,3%. Dengan syarat variabel lain konstan.
 Bila tenaga kerja bertambah 1 orang, maka produksi akan meningkat
sebesar 919. Dengan syarat variabel lain konstan.
 Dan bila mesin bertambah 1 buah, maka produksi akan meningkat 5766
kali.
PENGUJIAN RESIDUAL
Residual Model Diagnostics
Normal Plot of Residuals I Chart of Residuals
20000
10000 3.0SL=14787
10000
Residual
Residual
0 0 X=-2.0E-11 Asumsi Residual

-10000
dari model yang
-10000
-3.0SL=-14787
terbentuk
-20000
-2 -1 0 1 2 0 10 20 terpenuhi, yaitu
Normal Score Observation Number identik,
Histogram of Residuals Residuals vs. Fits independen,
5 10000 berdistribusi
4
normal (IIDN)
Frequency
Residual
3
0
2
0 -10000
-8000
-6000
-4000
-2000 0 2000
4 000
6000
8 000
10000 50000 100000 150000
Residual Fit
Catatan:
Bila akan menambahkan variable baru:
Prediction intervals for new observation : memasukkan nilai baru yang ingin
diprediksi sebagai respon
Confidence Level :
Storage : pilih untuk menyimpan tambahan dari sebelumnya
Fits : pilih untuk menyimpan fitted values untuk observasi yang baru
SEs of fits : pilih untuk mengestimasi standard error dari nilai dugaannya
Confidence limits : pilih untuk menampilkan batas keyakinan dengan batas atas dan
batas bawah
Prediction limits : pilih untuk menampilkan nilai prediksi dengan batas atas dan batas
bawah
V. PEMILIHAN MODEL TERBAIK
Jika antar variabel prediktor saling berkorelasi satu sama lain, dikatakan terjadi
kasus multicolinear. Hal ini kana mengakibatkan beberapa variabel prediktor tidak
significant berada dalam model valaupun sesungguhnya variabel tersebut berhubungan
sangat erat dengan variabel respon Y. Untuk mendapatkan model yang diinginkan
terdapat dua pertimbangan dalam pembentukan model, diantaranya:
• Agar persamaan regresi bermanfaat untuk tujuan prediksi, serigkali
diinginkan model yang memuat sebanyak-banyaknya variabel X (prediktor)
yang mempengaruhi variabel Y (respon)
• Kareena pertimbangan biaya untuk mendapatkan informasi, maka digunakan
sesedikit mungkin variabel X (prediktor) yang mempengaruhi variabel Y
(respon)
Untuk itu dibutuhkan metode untuk dapat mengakomodasikan dua kepentingan di atas
dengan cara Selecting the best regression equation. Berikut ini adalah cara-cara yang
sering digunakan dalam memilih model terbaik.
5.1. Best Subset Model
Memilih semua subset (model) yang terbaik yang memenuhi kriteria diatas.
Kriteria yang digunakan adalah:
R2 terbesar
MS residual terkecil
Cp yang mendekati jumlah parameter
Dengan menggunakan Minitab lakukan langkah berikut:
Stat > Regression > Best Subsets
Dalog box items
Respons : Masukkan kolom yang memuat variabel respon Y

Free predictors: masukkan yang memuat variabel –variabel prediktor X (maksimum 31
variabel)
Predictors in all models: pilih kolom-kolom yang memuat variabel yang ingin dimasukkan
dalam model. Kolom-kolom ini tidak boleh terdaftar dalam Free predictors. Jika anda
menganalisis data dengan lebih dari 15 variabel prediktor, pertimbangkan termasuk
variabel prediktor ini dalam rangka mengurangi jumlah free variables dan mempercepat
proses perhitungan.
Best Subsets Regression
Response is Y
RSq X X X X X
Vars RSq (adj) Cp S 1 2 3 4 5
1 92.3 92.0 25.4 27.314 X
1 88.5 88.1 50.3 33.288 X
2 95.4 95.0 6.9 21.580 X X
2 92.6 92.1 25.1 27.188 X X
3 96.4 96.0 2.0 19.378 X X X
3 95.7 95.2 6.8 21.222 X X X
4 96.4 95.8 4.0 19.758 X X X X
4 96.4 95.8 4.0 19.762 X X X X
5 96.4 95.6 6.0 20.165 X X X X X
5.2. Stepwise and Eliminasi Backward Regression
Stepwise Regression
Model dibuat dengan memasukkan variabel prediktor satu persatu (secara
bertahap) mulai dari variabel X yang memiliki korelasi tinggi
Langkah-langkahnya:
1. Cari variabel X yang berkorelasi paling tinggi dengan Y, kemudian buat
regresinya
2. Pemilihan variabel berikutnya adalah variabel yag memiliki korelasi parsial
terbesar dengan Y dan buat model dengan memasukkan variabel tersebut.
3. Uji parameter yang telah ada di dalam model
4. Begitu seterusnya ulangi langkah 2-3 sampai diperoleh model terbaik
Eliminasi Backward
Membuat model dengan memasukkan semua variabel kemudian dikeluarkan
satu persatu dengan melakukan pengujian terhadap parameter –parameternya dengan
menggunakan partial F test. Nilai partial F-test (FL) terkecil dibandingkan dengan F0
table:
• Jika FL < F0, maka X yang bersangkutan dikeluarkan dari model dan
dilanjutkan dengan pembuatan model baru tanpa variable tersebut
• Jika FL > F0, maka proses dihentikan dan persamaan terakhir tersebut
yang digunakan/dipilih.
Dengan menggunakan Minitab lakukan langkah berikut:
Stat > Regression > Stepwise>Methods
Dalog box items
Stepwise (forward and backward): pilih standard stepwise regression

Predictor in initial model: masukkan variabelprediktor. Variabel ini akan
dikeluarkan jika p-value lebih besar dari alpha to enter value (Jika ingin
mempertahankan variabel tertentu dalam model abaikan nilai p-value dan enter
variabel tersebut dalam Predictor to include in every model dalam box utama)
Alpha to enter : tetapkan nilai α untuk memasukkan variable dalam model
Alpha to remove: tetapkan nilai α untuk mengeluarkan variable dalam model
Forward selection: pilih Forward selection
Alpha to enter : tetapkan nilai α untuk memasukkan variable dalam model
Backward elimination
Alpha to remove: tetapkan nilai α untuk mengeluarkan variable dalam model
Force: masukkan variabel prediktor yang tidak ingin dikeluarkan dari model.
Contoh:
Klik Stat > Regression > Stepwise

Masukkan variabel X dan Y. Klik OK
Gunakan data di Lampiran 2
Y = berat limbah blontong (kuintal)
X1 = berat kapur tohor (kuintal)
X2 = berat sulfur (kg)
X3 = berat flokulan (kg)
X4 = berat tebu (kuintal)
X5 = berat fosfat (kg)
Variabel X1-X5 dipilih untuk dimasukkan dalam model
Stepwise Regression
FtoEnter: 4.00 FtoRemove: 4.00
Response is Y on 5 predictors, with N = 30
Step 1 2 3
Constant 74.68 74.56 74.72
X1 0.076 0.076 0.076
TValue 4.80 4.95 5.25
Jumlah variable yang signifikan dalam
X2 0.001 model hanya 3 variabel yaitu X1, X4
TValue 0.01 dan X5.Model yang terbentuk:
Y=74,72 + 0,076 X1+0,0209 X4-4,7 X5
X3 0.3 0.3
TValue 0.10 0.10 R2=96,39
X4 0.0209 0.0209 0.0209
TValue 6.35 7.01 7.17
X5 4.7 4.7 4.7
TValue 2.19 2.68 2.74
S 20.2 19.8 19.4
RSq 96.40 96.40 96.39
Variabel X1-X5 ingin dimasukkan dalam model.
Stepwise Regression
FtoEnter: 4.00 FtoRemove: 4.00
Response is Y on 5 predictors, with N = 30
Step 1
Constant 74.68
X1 0.076
TValue 4.80
X2 0.001
TValue 0.01
X3 0.3
TValue 0.10
X4 0.0209
TValue 6.35
X5 4.7
TValue 2.19
S 20.2
RSq 96.40

Analisis Regresi

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Analisis Regresi

Uploaded by

Copyright:

Available Formats

ANALISIS REGRESI

1. Pendahuluan :Pengertian regresi:

1.1.Pengertian regresi, regresi linier sederhana dan regresi liner berganda

Digunakan untuk memodelkan hubungan antara variable respons (yang dipengaruhi)

1. REGRESI LINIER SEDERHANA

3. CONTOH REGRESI LINIER YANG LAIN:

Tujuan utama: menemukan model yang paling sesuai βi???????

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter

9 Berapa taksiran β0 dan β1

1.3. Koefisien determinasi dan Asumsi Model Regresi

Koefisien determinasi, disiimbolkan dengan R2 adalah sebuah besaran yang

JUMLAH KUADRAT JUMLAH KUADRAT

JUMLAH KUADRAT TOTAL

Asumsi Model Regresi

Asumsi model regresi dikaitkan dengan pengujian parameter model dimana

1.4. Langkah-langkah dalam pemodelan

Definisikan Apakah parameter

Apakah variabel- Konsultasikan

Ti dak Apakah sasaran

 Varians ( ε i ) = σ  homoskedastisitas ( identik ).

 Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.

Dalam bentuk gambar diilustrasikan sbb :

2.1. Pengujian Asumsi Residual SECARA GRAFIK

1. Over All Plot

2. Menyusun normal plot / half normal plot.

3. Plot εi melawan ŶI atau Xi

i • VARIASI TIDAK KONSTAN

• ADA SUATU POLA TERTENTU,

Bentuk yang diinginkan

2.2. Melalui Pengujian

Bermacam-macam bentuk model regresi linier

1. Taksiran β 0 , β 1  METODE LEAST SQUARE (meminimkan jumlah kuadrat

3.2. Pengujian parameter

Langkah-langkah menggunakan minitab :

Model Regresi yang terbentuk :

3.3. Pengujian Residual

Residual Model Diagnostics

Histogram of Residuals Residuals vs. Fits

4.1. Struktur Data

4.2. Cara Penaksiran Parameter Regresi dan Pengujian Model

Taksiran parameter menggunakan metode Metode Least Square, diperoleh:

Model regresi yang menjelaskan hubungan antara kualitas dengan

Uji Serentak (Overall)

Sumber Derajat Jumlah Rata – rata

Untuk menguji signifikansi dari pengaruh masing-masing variabel terhadap variabel y

4.3. Pembuatan Model dengan Menggunakan Minitab

Gunakan data produksi diatas

Dialog Box Items:

Kontrol tampilan hasil

 Dari ANOVA  Model regresi signifikan pada alpha 5%

0 0 X=-2.0E-11 Asumsi Residual

5.1. Best Subset Model

Stat > Regression > Best Subsets

Dalog box items

Respons : Masukkan kolom yang memuat variabel respon Y

5.2. Stepwise and Eliminasi Backward Regression

Dengan menggunakan Minitab lakukan langkah berikut:

Stat > Regression > Stepwise>Methods

Dalog box items

Stepwise (forward and backward): pilih standard stepwise regression

Klik Stat > Regression > Stepwise

You might also like