1

1
Teori Bahasa dan Otomata

PENDAHULUAN

Teori bahasa dan otomata merupakan bagian dari teori komputasi pada ilmu komputer. Beberapa teori komputasi datang dari bahasa dan rekayasa sistem, terutama yang berbasiskan matematika. Dalam hal ini penekanannya adalah pada pemecahan masalah. Melalui contoh-contoh ilustrasi-masalah dapat dikenali latar belakang dari suatu konsep dan hubungannya dengan definis dan teorema yang ada. Secara teoritis ilmu komputer diawali dari sejumlah berbeda disiplin ilmu; ahli biologi mempelajari neural network, insinyur elektro mengembangkan switching sebagai tools untuk mendesain perangkat keras, matematikawan bekerja berdasarkan logika, dan ahli bahasa menyelidiki tata bahasa untuk bahasa alami (natural language) Finite state automata dan ekspresi reguler awal dikembangkan berdasarkan pemikiran neural network dan switching circuit. Finite state automata merupakan tools yang sangat berguna dalam perancangan suatu penganalisa leksikal (lexical analyzer) yang berguna dalam mengelompokkan karakter-karakter kedalam token-token sebagai unit terkecil dalam mengenali pola. Jadi apa sesungguhnya teori bahasa tersebut ? Teori bahasa merupakan suatu gagasan mendasar dalam komputasi yang menjadi tools untuk mengenali persoalan. Gagasan dasar tersebut dimodel dengan suatu simbol-simbol yang merepresentasikan juga suatu fungsi dari komputer digital. Teori bahasa pada awalnya lebih diarahkan untuk mengenali suatu tata bahasa dan dapat mendefinisikan spesifikasi formal dari tata bahasa tersebut. Sehingga pada akhirnya dapat didefinisikan langkah-langkah algoritmik dalam pemrosesan tata bahasa.

PUSAT PENGEMBANGAN BAHAN AJAR – UMB

Puji Catur Siswipraptini S.Kom Teori Bahasa Otomata

juga diterapkan pada ilmu sains lainnya. Tanpa penerapan timbul pertanyaan.2 Teori bahasa dan otomata dalam ilmu komputer Suatu teori hanya menarik jika dapat membantu dalam mencari solusi terbaik. dari perancangan mesin sampai pemrograman. terdapat keseragaman prinsip-prinsip umum yang dipakai. Meskipun model tersebut sederhana untuk diterapkan langsung pada dunia nyata. keuntungan yang diperoleh dari mempelajarinya adalah memberikan landasan untuk basis dari suatu pengembangan algoritma.Kom Teori Bahasa Otomata . Teori bahasa dan automata persoalan Logika dasar persoalan Pseudo code / flow chart Algoritma dan struktur data Program sumber compiler Data masukan Program komputer Data keluaran PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S. Disamping perbedaan yang ada. Model ini memiliki fungsi-fungsi yang penting dan umum pada perangkat keras dan perangkat lunak komputer. kita mengkonstruksi suatu mesin otomata sebagai model abstrak dari komputer dan komputasi. Untuk mempelajari prinsip-prinsip dasar tersebut. Bidang ilmu komputer meliputi topik yang luas. Pendekatan ini. mengapa mempelajari teori? Teori memberikan konsep dan prinsip yang menolong untuk memahami perilaku dari suatu persoalan yang berkorelasi dengan teori tersebut.

Kom Teori Bahasa Otomata . meja. Aturan tersebut dikenal sebagai Tata Bahasa (grammar). …} Dengan mengikuti aturan tata bahasa tersebut. besar. bung. atau Kt Sdng+Kt Bnda +Kt Ket. Sandang+ Kt Benda + Kt Keterangan Kata kerja atau Kata kerja + Objek Kata Benda atau Kt Sandang +Kt benda atau Kt Benda+Kt Ket. atau lebih detilnya aturan penulisan suatu kalimat berita adalah : Kalimat berita Subjek Predikat Kata Benda atau Kata Sandang + Kata benda atau Kata Benda + Kata Keterangan atau Kt. Kata kerja Kata benda  {memukul. bola. penulisan sebuah kalimat berita akan mengikuti aturan SP (Subjek Predikat). menulis  {kambing. Sebagai contoh dalam bahasa Indonesia. cantik . …} Kata sandang  {Si. menggigit.3 Tata Bahasa Penulisan suatu kalimat dalam sebuah bahasa. akan mengikuti suatu aturan tertentu yang berlaku pada bahasa tersebut. dapat direkonstruksi suatu kalimat berita sebagai berikut : Adik menulis Kucing menggigit tikus Si kambing cantik memakan sayuran segar PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S. memasak. adik. kucing. … } Kata Keterangan  {kecil. jauh.

simbol-simbol terminal. Pada tahun 1959 seorang ahli bernama Hirarki Chomsky.Kom Teori Bahasa Otomata . Ada beberapa macam translator : 1.4 Periksalah kalimat berikut apakah memenuhi aturan tersebut : Si tikus jorok mengejar kucing galak Si bola besar menendang kambing jelek Klasifikasi Tata Bahasa Tata bahasa (grammar) bisa didefinisikan secara formal sebagai kumpulan dari himpunan-himpunan variabel. simbol awal yang dibatasi oleh aturan-aturan produksi. Assembler PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S. Penggolongan tersebut bisa dilihat pada tabel berikut: Noam Chomsky melakukan penggolongan tingkatan bahasa menjadi empat. yang disebut dengan Bahasa Regular Tipe 3 Mesin Otomata Finite State Automata (FSA) meliputi Deterministic Finite Automata (DFA) & Nondeterministic Finite Automata (NFA) Push Down Automata (PDA) Linier Bounded Automata Mesin Turing Batasa Aturan Produksi α adalah sebuah simbol variabel β maksimal memiliki sebuah simbol variabel yang bila ada terletak diposisi paling kanan α berupa sebuah simbol variabel | α| ≤ | β| tidak ada batasan Bebas Konteks (Context Free) Tipe 2 Context Sensitive Tipe 1 Unrestricted/Phase Structure/Natural Language/ Tipe 0 TRANSLATOR Sebuah translator melakukan pengubahan source code/source program (program sumber) ke dalam target code/object code/object program (program objet).

Sorurce Code Assembler Object Code Gambar stuktur Sistem Assembler 2.Kom Teori Bahasa Otomata . Contoh : Basic. object kode adalah bahasa mesin atau bahasa assembler. Data Source Code Compiler Object Code Eksekusi computer Hasil Gambar struktur Sistem Kompilator 3. Interpreter Interpreter tidak membangkitkan object code. Source code dan data diproses pada saat yang berbeda Contoh : Turbo Pascal. Data PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S. Contohnya : Turbo Assembler dan Macro Assembler. hasil translasi hanya dalam bentuk internal. Kompilator/Compiler Source code adalah bahasa tingkat tinggi.5 Source code adalah bahasa assembly. object code adalah bahasa mesin.

Kerumitan kompilator dapat dikurangi jika perancang bahasa pemrograman mempertimbangkan bermacam-macam faktor perancangan. Sebuah intruksi akan mengerjakan mirip dengan arti intruksi itu. Kontruksi yang diturunkan dari bahasa alami berguna untuk kejelasan dan kemudahan pembacaan. MODEL KOMPILATOR Pekerjaan untuk membuat sebuah kompilator untuk suatu bahasa sumber sangat rumit. Penjelasan masing-masing sebagai berikut : 1. 3. dan bahasa pemrograman yang sudah ada. PERANCANGAN KOMPILATOR BAHASA PEMROGRAMAN Gagasan untuk perancangan compiler bahasa pemrograman bisa berasal dari bahasa alami (natural langgue).6 Source Code Interpreter Hasil Gambar struktur Sistem Interpreter. Kerumitan serta sifat dari proses kompilasi tergantung pada tingkat keluasan dari bahasa sumber.Kom Teori Bahasa Otomata . 2. Matematika telah banyak dipakai untuk aturan aturan yang terdapat pada bahasa pemrograman misalnya ekspresi matematika. matamatika. Tetapi perlu ketelitian saat menggunakan karena bahasa yang sudah ada itu mungkin mengandung kesalahan yag serius. Bagian-bagian sebuah kompilator : PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S. Bahasa pemrograman yang sudah ada bisa menjadi sumber yang bagus untuk perancangan bahasa pemrograman.

Analisis • • • • • Mengenali masukan (Scanner) Memeriksa kebenaran tata bahasa masukan (Parser) Menangkap makna masukan (pengenal semantik) 2.Kom Teori Bahasa Otomata . Penganalisa Leksikal (scanner) Fungsi scanner adalah membaca seluruh teks program sumber karakter per karakter. Sintesis Pembangkit Kode Pengoptimal Kode Semua bagian tersebut dalam operasinya didukung dan merefer ke Tabel Simbol Program sumber Program objek ANALISIS Penganalisis Leksikal (Scanner) Penganalisis Sintaks (Parser) SINTESIS Pembangkit kode (code generator) Pengoptimal kode (optimizer) Penganalisis semantik Tabel Simbol Bagian Analisis berhubungan dengan pemisahan bagian-bagian dari program sumber menjadi bagian-bagian dasar (token). Secara lebih detil setiap elemen sintesis melakukan tugas-tugas sebagai berikut : 1. mengenali bagian dasar dari teks (bagian leksikografis terkecil/ token) dan memisahkannya dengan spasi kosong.7 1. Keluaran dari penganalisa leksikal adalah daftar token. PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S.

Keluaran dari bagian analisis selanjutnya digunakan oleh bagian sintesis untuk membangkitkan program objek yang sesuai dengan program sumber dan mesin. dan prosedur. Penganalisa Sintaks (Parser) Daftar token yang dihasilkan scanner. Id dibangkitkan dengan mereferensi kepada informasi yang tersimpan dalam tabel simbol. Pengoptimal Kode (optimizer) Pada kompilator yang canggih. Dengan mengacu pada tata aturan penulisan kalimat (tata bahasa/grammar). 1. Pembangkit Kode (code generator) Intermediate code akan diterjemahkan kedalam bahasa rakitan (assembly) atau langsung kedalam bahasa mesin. 2. Kalimat dapat berupa ekpspresi. PUSAT PENGEMBANGAN BAHAN AJAR – UMB Puji Catur Siswipraptini S. Salah satu model kode antara adalah Notasi Polish. kode-kode objek dari pembangkit kode akan dianalisa dan langkah-langkah operasi serta kemunculan berulang dari suatu ekpresi akan direduksi. 2. statement. Penganalisa Semantik Pohon sintaks yang dihasilkan oleh parser kemudian digunakan oleh penganalisa semantik untuk menangkap makna yang dimaksud oleh kalimat tersebut. 3. kalimat yang terbentuk akan dianalisa untuk menghasilkan pohon sintaks atau yang sejenisnya.8 Setiap token dalam daftar token dilengkapi dengan kode penanda token (id) dan keterangan jenis token. oleh parser selanjutkan akan dikelompokkan atas kalimat-kalimat sesuai urutan keberadaan token dalam program sumber. Hasil reduksi tersebut dimaksudkan untuk menghasilkan program objek yang lebih efisien. Pohon sintaks mengidentifikasikan kalimat yang benar secara tata bahasa jika semua simpul daun berupa token dan setiap simpul yang bukan daun mewakili suatu tipe kelas sintaks.Kom Teori Bahasa Otomata . Keluaran dari proses analisis semantik adalah Kode Antara (intermediate code).

Sign up to vote on this title
UsefulNot useful