P. 1
Analisa data statistik dengan R

Analisa data statistik dengan R

|Views: 10,662|Likes:
Published by Reza Vahlevi

More info:

Published by: Reza Vahlevi on Mar 27, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

07/24/2013

pdf

text

original

SUHARTONO

© 2008 Jurusan Statistika, ITS, Surabaya

ANALISIS DATA STATISTIK
DENGAN
 R

©sht90

Dedicated to

‐    ‐

ii

When the Lord created the world and people to live in it − an enterprise
which, according to modern science, took a very long time − I could well
imagine that He reasoned with Himself as follows: “If I make everything
predictable, these human beings, whom I have endowed with pretty good brains,
will undoubtedly learn to predict everything, and they will thereupon have no
motive to do anything at all, because they will recognize that the future is
totally determined and cannot be influenced by any human action. On the other
hand, if I make everything unpredictable, they will gradually discover that
there is no rational basis for any decision whatsoever and, as in the first case,
they will thereupon have no motive to do anything at all. Neither scheme
would make sense. I must therefore create a mixture of the two. Let some
things be predictable and let others be unpredictable. They will then, amongst
many other things, have the very important task of finding out which is which.”

Small Is Beautiful

E. F. SCHUMACHER

Untuk
Azizah, Alivia, Vanissa

©sht90

Kata Pengantar

‐      ‐

iii

KATA PENGANTAR

R adalah suatu sistem untuk analisis data yang termasuk kelompok software
statistik open source yang tidak memerlukan lisensi atau gratis, yang dikenal dengan
freeware. Sampai saat ini, pengguna statistika di Indonesia masih belum banyak yang
menggunakan R untuk keperluan analisis data. Sebagian besar pengguna statistika di
Indonesia masih menggunakan paket‐paket statistik komersil, seperti SPSSMINITAB,
SplusSAS, atau Eviews. Salah satu faktor penyebabnya adalah masih terbatasnya buku
tentang R yang dalam bahasa Indonesia.
Buku ini bukan merupakan suatu buku teks tentang teori‐teori dalam analisis
statistik, tetapi lebih merupakan buku terapan tentang metode‐metode statistik dengan
penggunaan R. Tujuan penulisan buku ini adalah untuk menunjukkan bagaimana cara
melakukan analisis data statistik dengan menggunakan R. Dalam hal ini, ditunjukkan
bagaimana R sebagai suatu paket statistik yang powerful dan menyediakan sistem grafik
yang baik untuk mendukung analisis. Jika proses perhitungan dalam analisis data
menjadi mudah, maka energi dari pengguna statistika diharapkan dapat lebih difokuskan
pada pemahaman tentang data yang dianalisis.
Paket R memiliki fasilitas yang sangat banyak untuk analisis data statistik, mulai
dari metode yang klasik sampai dengan yang modern. Pada Bab 1 diuraikan tentang
paket statistik R, yaitu tentang sejarah singkat, cara memperoleh dan menginstal, serta
fasilitas RGUI (Graphical User Interface) atau RCommander dan cara menginstalnya.
Bab 2 dan 3 membahas tentang manajemen data di R, khususnya dengan menggunakan
fasilitas di RCommander dan perintah langsung di RConsole.
Analisis grafik pada R dijelaskan pada Bab 4, khususnya penggunaan fasilitas di
RCommander. Pada Bab 5 dibahas tentang penggunaan fasilitas di RCommander untuk
perhitungan fungsi distribusi peluang, yang mencakup perhitungan peluang pada
distribusi kontinu dan diskrit. Bahasan tentang analisis statistik deskriptif dijelaskan pada
Bab 6. Pada Bab 7 dijelaskan tentang penggunaan fasilitas di RCommander untuk
analisis statistik inferensi, yang mencakup uji hipotesis (tentang rata‐rata, proporsi, dan
varians), analisis regresi, dan model linear tergeneralisir (GLM). Pada bagian akhir dari
bab ini diberikan ringkasan beberapa perintah dan library yang berkaitan dengan analisis
regresi. Dalam Bab 8 dibahas tentang analisis grafik dengan menggunakan perintah
langsung di RConsole atau command line.
Bab 9 membahas tentang penggunaan R untuk analisis runtun waktu. Dalam bab
ini ada tiga sub‐bab utama tentang model‐model dalam analisis runtun waktu yang
dibahas, yaitu model tren linear, model eksponensial smoothing, dan model ARIMA.
Pada Bab 10 dijelaskan tentang penggunaan R untuk analisis multivariat, yang mencakup
tentang Analisis Faktor, Analisis Diskriminan, dan Analisis Cluster. Pada akhirnya, Bab 11
dijelaskan tentang pemrograman di R.

©sht90

Kata Pengantar

‐      ‐

iv

Buku ini ditujukan untuk pengguna R secara umum sebagai petunjuk pengantar
pemakaian R untuk analisis data statistik. Selain itu, buku ini juga diharapkan dapat
dipakai di kelas‐kelas pada pengajaran statistika baik di level dasar ataupun level lanjut
dengan teknik‐teknik analisis statistik tertentu. Saat ini buku ini digunakan sebagai salah
satu referensi pada mata kuliah Analisis Data I dan II di Program Sarjana (S1) dan mata
kuliah Analisis Data di Program Magister (S2) Jurusan Statistika, Institut Teknologi
Sepuluh Nopember (ITS), Surabaya.
Pada kesempatan ini, penulis mengucapkan terima kasih yang sebesar‐besarnya
kepada dosen‐dosen penulis yang telah banyak menginspirasi perkembangan akademik
penulis, khususnya Drs. Kresnayana Yahya, M.Sc. dan Ir. Dwiatmono A.W., M.Ikom.
selama penulis menempuh S1 di ITS Surabaya, Prof. T. Subba Rao dan Dr. Jingsong Yuan
dari Department of Mathematics, University of Manchester, United Kingdom, selama
penulis menempuh S2, dan Prof. Subanar, Ph.D. selama penulis menempuh S3 di UGM
Yogyakarta. Penulis juga mengucapkan banyak terima kasih kepada kolega‐kolega
akademik penulis yang telah banyak membantu dalam proses penulisan buku ini,
khususnya R. Mohamad Atok, S.Si., M.Si. dan Wahyu Wibowo, S.Si., M.Si. Akhirnya,
penulis juga mengucapkan banyak terima kasih kepada mahasiswa/i penulis, khususnya
mahasiswa/i S1 Statistika 2005 yang telah melakukan download paket dan library R
secara bersama‐sama sehingga banyak library (hampir 1000 library) yang sekarang telah
tersedia dan dapat diaktifkan.

Masukan dan umpan balik dari pembaca sangat diharapkan untuk perbaikan isi
buku ini. Pembaca dapat mengirimkan saran dan kritik melalui email ke alamat penulis,
yaitu suhartono@statistika.its.ac.id atau har_arema@yahoo.com. Semoga buku ini
dapat memberikan manfaat, khususnya bagi perkembangan ilmu statistika di Indonesia
dan secara umum bagi para pembaca.

Surabaya, 09 September 2008
Penulis,

Suhartono

©sht90

Daftar Isi

‐    ‐

v

DAFTAR ISI

hal.

KATA PENGANTAR

iv

DAFTAR ISI

vi

BAB 1.  PAKET STATISTIK R

1

1.1  Pendahuluan

1

1.2  Sejarah Singkat R

1

1.3   Cara Memperoleh R, Paket dan Library

1

1.4   Instalasi R dalam Sistem Operasi Windows

2

1.5   GUI R‐Commander dan Instalasinya dalam Sistem Operasi Windows

4

1.6   Manajemen Direktori Kerja di R

6

1.7   Fasilitas help

10

1.7.1   Mencari help dari suatu perintah (command) tertentu

10

1.7.2   Menggunakan help‐search‐engine

12

1.7.3   Online Search‐Engine

15

BAB 2.  MANAJEMEN DATA DI PAKET R

16

2.1   Data Entry menggunakan R‐Gui dengan R‐Commander

16

2.2  Menampilkan data yang sedang aktif di R‐Commander

19

2.3  Editing data di R‐Commander

20

2.4  Importing data di R‐Commander

20

2.4.1   Importing data file Excel di R‐Commander

20

2.4.2   Importing data file SPSS di R‐Commander

22

2.4.3   Importing data file MINITAB di R‐Commander

22

2.5  Memilih dataset yang aktif

24

2.6  Transformasi dataset atau pengaturan variabel pada dataset

25

2.6.1   Recode atau kode ulang peubah

25

2.6.2   Compute atau hitung peubah baru

27

BAB 3.  MANAJEMEN DATA DI R DENGAN COMMAND LINE

29

3.1   Jenis‐jenis Data Objek

30

3.1.1   Data Array Satu Dimensi atau Data Vektor

30

3.1.2   Data Matriks

31

3.1.3   Data Frame

34

3.1.4   Data List

37

3.2  Importing Data pada Command Line

38

3.2.1   Membaca File ASCII

38

3.2.2   Importing Data File Excel

39

3.2.3   Importing Data dari Paket Statistik

41

©sht90

Daftar Isi

‐    ‐

vi

BAB 4.  GRAFIK MENGGUNAKAN RCommander

43

4.1   Grafik dalam R‐GUI

45

4.2  Grafik Histogram

46

4.3  Diagram Dahan dan Daun (Stem‐and‐Leaf)

48

4.4  Grafik Box‐Plot

50

4.5  Grafik QQ‐Plot

51

4.6  Grafik Diagram Pencar (Scatter‐Plot)

53

4.7  Grafik Plot Rata‐rata (Mean)

55

4.8  Diagram Batang (Bar‐Chart)

56

4.9  Diagram Lingkaran (Pie‐Chart)

57

4.10 Plot Indeks

58

BAB 5.  FUNGSI DISTRIBUSI PELUANG DI RCommander

61

5.1   Fungsi Distribusi Kontinu

62

5.1.1   Menghitung Kuantil dari Distribusi Normal

62

5.1.2   Menghitung Peluang dari Distribusi Normal

63

5.1.3   Membuat Plot dari Distribusi Normal

64

5.1.4   Membangkitkan Data dari Distribusi Normal

67

5.2   Fungsi Distribusi Diskrit

69

5.1.1   Menghitung Kuantil dari Distribusi Binomial

69

5.1.2   Menghitung Peluang dari Distribusi Binomial

70

5.1.3   Membuat Plot dari Distribusi Binomial

72

5.1.4   Membangkitkan Data dari Distribusi Binomial

75

BAB 6.  STATISTIK DESKRIPTIF MENGGUNAKAN RCommander

78

6.1   Ringkasan Numerik (Summary)

79

6.1.1   Ringkasan Numerik dari Semua Variabel

79

6.1.2   Ringkasan Numerik untuk Suatu Variabel

81

6.2  Distribusi Frekuensi

83

6.3  Tabel Statistika

84

6.4  Matriks Korelasi

86

6.5  Uji Korelasi

87

6.6  Uji Kenormalan Shapiro‐Wilk

88

6.7  Tabel Kontingensi Dua Arah

89

6.8  Entry Langsung Data Frekuensi untuk Tabel Kotingensi Dua Arah

91

BAB 7.  STATISTIK INFERENSI MENGGUNAKAN RCommander

93

7.1   Pengujian Rata‐rata (Mean)

95

7.1.1   Pengujian Rata‐rata sampel tunggal

95

7.1.2   Pengujian Perbedaan Rata‐rata Dua sampel saling bebas

98

7.1.3   Pengujian Perbedaan Rata‐rata Sampel Berpasangan

102

©sht90

Daftar Isi

‐    ‐

vii

7.1.4   Analisis Varians satu arah (One‐way ANOVA)

105

7.1.5   Analisis Varians dua arah (Multi‐way ANOVA)

109

7.2   Pengujian Kesamaan Variansi

112

7.2.1   Pengujian Kesamaan Dua Variansi

112

7.2.2   Uji Bartlett

114

7.2.3   Uji Levene

115

7.3   Pengujian Proporsi

116

7.3.1   Pengujian Proporsi Sampel Tunggal

117

7.3.2   Pengujian Proporsi Dua Sampel

118

7.4   Analisis Regresi Linear

120

7.4.1   Regresi Linear

121

7.4.2   Model Linear

123

7.5   Generalized Linear Model

127

7.6   Rangkuman perintah dan library yang berkaitan dengan
Analisis Regresi

130

BAB 8.  GRAFIK MENGGUNAKAN RCLI

144

8.1   Fungsi‐fungsi Plot Utama

146

8.1.1   Perintah plot( )

146

8.1.2   Perintah qqnorm(x), qqline(x), qqplot(x,y)

150

8.1.3   Perintah hist(x)

154

8.1.4   Perintah image(x,y,z,…), contour(x,y,z,…), persp(x,y,z,…)

155

8.1.5   Argumen‐argumen untuk fungsi plot utama

156

8.2. Fungsi‐fungsi Plot Tambahan

157

8.3  Fungsi‐fungsi Plot yang bersifat interaktif

158

8.4  Notasi Matematika pada Plot

158

8.5  Setting parameter grafik

160

BAB 9.  ANALISIS RUNTUN WAKTU DENGAN R

162

9.1   Model Trend Linear

163

9.2. Model Exponential Smoothing

165

9.1.1   Model Holt‐Winters Aditif

167

9.1.2   Model Holt‐Winters Multiplikatif

171

9.1.3   Model Eksponensial Ganda

173

9.1.4   Model Eksponensial Smoothing Sederhana

174

9.3  Model ARIMA

176

9.3.1   Contoh Kasus Model ARIMA Non‐musiman yang Stasioner

181

9.3.2   Contoh Kasus Model Non‐musiman yang Tidak Stasioner

189

9.3.3   Model ARIMA Musiman

194

9.3.4   Contoh Kasus Model ARIMA Musiman

197

9.3.5   Kriteria Pemilihan Model

203

©sht90

Daftar Isi

‐    ‐

viii

9.4  Rangkuman perintah dan library yang berkaitan dengan
Analisis Runtun Waktu

205

BAB 10.   ANALISIS MULTIVARIAT DENGAN R

208

10.1  Analisis Faktor

208

10.2 Analisis Diskriminan

210

10.3 Analisis Cluster

212

DAFTAR PUSTAKA

215

DAFTAR INDEKS

216

TENTANG PENULIS

218

©sht90

Paket Statistik R

‐ 1 ‐

BAB 1
PAKET
 STATISTIK R

1.1. Pendahuluan

Secara umum ada dua macam kelompok paket software statistik untuk
keperluan analisis data, yaitu kelompok software komersil dan kelompok software
statistik open source atau freeware. Beberapa contoh software statistik komersil yang
popular di Indonesia adalah SPSS, MINITAB, Eviews, SAS, dan Splus. Sedangkan contoh
dari freeware statistik antara lain R, Open Stats, SalStat, Vista, dan lain‐lain (lihat
http://www.statistics.com/content/freesoft/ AZlisting.html).
Software statistik yang komersil mensyaratkan lisensi dengan harga yang relatif
sangat mahal untuk ukuran sebagian besar pengguna di Indonesia. Dengan demikian,
salah satu alternatif penyelesaian dari mahalnya lisensi tersebut adalah melalui
penggunaan freeware statistik, khususnya R.

1.2. Sejarah Singkat R

R dalam versi terakhirnya, yaitu versi 2.7.2 per 25 Agustus 2008, merupakan
suatu sistem analisis data statistik yang komplet sebagai hasil dari kolaborasi penelitian
berbagai ahli statistik (statistisi) di seluruh dunia. Versi awal dari R dibuat pada tahun
1992 di Universitas Auckland, New Zealand oleh Ross Ihaka dan Robert Gentleman. Pada
saat ini, source code kernel R dikembangkan terutama oleh R Core Team yang
beranggotakan 17 orang statistisi dari berbagai penjuru dunia (lihat http://www.r‐
project.org/contributors.html). Selain itu, para statistisi lain pengguna R di seluruh dunia
juga memberikan kontribusi berupa kode, melaporkan bug, dan membuat dokumentasi
untuk R.

Paket statistik R bersifat multiplatforms, dengan file instalasi binary/file tar
tersedia untuk sistem operasi Windows, Mac OS, Mac OS X, Linux, Free BSD, NetBSD,
irix, Solaris, AIX, dan HPUX. Secara umum, sintaks dari bahasa R adalah ekuivalen dengan
paket statistik Splus, sehingga sebagian besar keperluan analisis statistika, dan
pemrograman dengan R adalah hampir identik dengan perintah yang dikenal di Splus.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->