P. 1
an as Algoritma c4.5

an as Algoritma c4.5

|Views: 1,885|Likes:
Published by ach_baihaqi

More info:

Published by: ach_baihaqi on Dec 09, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

07/19/2013

pdf

text

original

Bitmap index blocks of 5-300 thousand records tables

Col #Distinct 5,000

(40) 10,000

(80) 30,000

(239) 50,000

(397) 70,000

(556) 100,000

(794) 150,000

(1191) 200,000

(1588) 300,000
(2378)

1

4

1

1

4

5

6

10

13

17

25

2

9

1

2

7

9

13

17

26

30

47

3

5

1

2

5

6

8

11

16

22

31

4

7

1

2

7

7

11

14

21

28

41

5

10

1

2

5

10

15

20

25

35

50

Total of
bitmap index
blocks

5

9

28

37

53

72

101

132

194

Keterangan: 5,000 (40) berarti bahwa tabel yang berisi 5000 rekord menempati 40 blok pada disk.

Pada kelompok eksperimen kedua, Gambar III.7 menunjukkan bahwa konstruksi
pohon pada tabel yang diindeks dengan bitmap lebih cepat dibandingkan dengan
yang tidak diindeks, baik pada Function-7 maupun Function-7. Tapi, pengurangan
waktu eksekusi lebih besar pada Function-7. Makin besar ukuran tabel,
pengurangan waktu eksekusi juga makin besar.
Analisis. Analogi dengan eksperimen pertama, perbaikan waktu eksekusi di sini
terjadi karena Algoritma III.1 hanya mengakses indeks bitmap yang berukuran
lebih kecil dibandingkan tabel asli. Penambahan ukuran indeks bitmap, yang
bergantung kepada jumlah nilai unik di kolom dan jumlah rekord, dapat tidak
berbanding lurus dengan penambahan ukuran tabel asli (untuk jumlah rekord yang
sama, ukuran indeks bitmap berbanding lurus dengan jumlah nilai unik di kolom).
Karena itu makin besar ukuran tabel, akses I/O dapat makin dihemat
(dibandingkan jika mengakses tabel asli). (Jika tabel perlu diakses beberapa kali,
pengurangan waktu akses pada indeks bitmap, yang ukurannya lebih kecil
dibandingkan ukuran tabel, menjadi signifikan.)

54

Pengaruh Ukuran Pohon terhadap Efisiensi

Pada kelompok eksperimen kedua, terlihat bahwa waktu untuk konstruksi pohon
pada tabel yang berisi himpunan data Function-1 (baik yang diindeks maupun
tidak) lebih cepat dibandingkan dengan himpunan data Function-7. Pohon yang
dihasilkan dari Function-1 berukuran 4 simpul dengan 3 daun. Berarti, pohon
hanya memiliki kedalaman dua. Pohon yang dihasilkan dari Function-7
berukuran 32 simpul dengan 19 daun dan kedalaman pohon maksimum adalah 6.
Jadi, eksekusi pohon yang berukuran besar memakan waktu lebih lama.
Analisis. Sebagaimana dibahas pada Bab 2, kompleksitas komputasi pada setiap
simpul yang memiliki atribut split bertipe diskret adalah O(n2

). Jika terdapat S

simpul pada pohon, maka waktu komputasi adalah SO(n2

), yang artinya makin

banyak jumlah simpul, maka waktu komputasi makin lama. Selain itu, pada
konstruksi pohon dengan SQL, makin banyak jumlah simpul juga makin banyak
akses I/O yang harus dilakukan dan memperbesar waktu eksekusi, karena
pemilihan atribut test pada setiap simpul dilakukan dengan memanggil fungsi
SQL (SELECT COUNT) yang mengakses tabel atau indeks bitmap secara
langsung.

Kesimpulan dari eksperimen ini adalah waktu konstruksi pohon atau efisiensi
Algoritma III.1 lebih baik dibandingkan Algoritma II.1 pada tabel yang memiliki
5 dan 10 kolom, dengan jumlah nilai unik kecil (4 sampai 10) dan diindeks
bitmap.

55

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->