P. 1
NLP

NLP

|Views: 140|Likes:

More info:

Published by: Muhammad Nashrullah ムハンマド on Nov 02, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

04/08/2015

pdf

text

original

DAFTAR ISI

Kata Pengantar…………………….

…………………………………………………………………………
1. Pendahuluan ………………………………. ………………………………………………………………………………………. 3 3

2

Latar Belakang……………………………….
…………………………………………………………………………………… 2. Isi………………………………. ……………………………………………………………………………………………………… … 5 1. Pengertian………………………………. ……………………………………………………………………………………… 2. Bahasa Alami………………………………. ……………………………………………………………………………… 2.1 Komponen 2.2 Sistem 2.2.1 Sistem Speech 6 5

Utama Pemrosesan

Pengolahan
6

Bahasa Bahasa

Alami Alami

…………………………………………………..

……………………………………………………………………… 6

Recognition……………………………………………………………………
7 2.2.2 Sistem Text to

Speech…………………………………………………………………………….
9 2.2.3 Natural Language

Processing…………………………………………………………………
2.3 Aplikasi 3. Bidang

11

Pengolahan Pengetahuan

Bahasa
12

Alami Natural
15

……………………………………………………………………

Dalam

Language…………………………………………………………
3.1 Proses

Sintaksis……………………………………………………………………………………
………………… 17 1

3.2 Gramatika

………………………………. 17

……………………………………………………………………………… 3.3 Chomsky

Hierarchy

Of
19

Generative

Grammar………………………………………………………

3.4 Parsing…………………………………………………………………………………… ………………………………… 20

3.5 Semantik………………………………………………………………………………… …………………………………21 3.6 Semantik

Grammar…………………………………………………………………………………
……………… 22

3.7 Automated Transition Networks (ATN) ………………………………. …………………………… 24

3. Penutup………………………………. ……………………………………………………………………………………………… 1. Kesimpulan………………………………. …………………………………………………………………………… 2. Daftar Pustaka………………………………. ……………………………………………………………………… 29 27 27

KATA PENGANTAR

2

karenanya kritik dan saran yang membangun sangat kami butuhkan untuk kemajuan kita bersama. Demikianlah tugas ini kami susun semoga bermanfaat untuk kita semua. Makalah ini dibuat untuk memenuhi tugas kelompok pada mata kuliah Kecerdasan Buatan. 29 Maret 2011 Penulis Bab I PENDAHULUAN 1. Penulis menyadari akan kekurangan dan ketidak-sempurnaan dalam penulisan ini.1 Latar Belakang Teknologi berkembang semakin cepat dari waktu ke waktu karena penemuan satu teknologi baru dapat mempercepat penemuan teknologi berikutnya.Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat serta hidayah-Nya kepada penulis sehingga dapat menyelesaikan makalah ini dengan baik dan tepat waktu. Jakarta. Terima kasih kami sampaikan kepada Bapak Victor Amrizal selaku dosen mata kuliah Kecerdasan Buatan yang telah memberikan kuliah demi lancarnya tugas ini. Serta rekanrekan yang memeberikan masukkan dan motivasinya kepada kelompok kami. Yang didalamnya membahas secara menyeluruh tentang Natural Language Processing. Makalah ini merupakan tugas mata kuliah Kecerdasan Buatan dengan materi “Natural Language Processing” atau Pemrosesan Bahasa Alami. Dalam sejarah peradaban 3 .

peradaban manusia telah sampai pada suatu keadaan dimana kita tidak mungkin melepaskan diri dari teknologi komputer digital. Berbagai film fiksi ilmiah mencoba menggambarkan bentuk komputer masa depan tersebut. penemuan teknologi mesin uap oleh Thomas Savery (1689) yang selanjutnya disempurnakan oleh James Watt menjadi bentuk yang lebih memungkinkan digunakan pada berbagai aplikasi. Namun. • berbagai sensor untuk menerima masukan dan mendeteksi keadaan di sekitarnya. disertai dengan tersedianya prosesor mikro yang semakin tinggi kemampuannya. Tentunya. Sebagai contoh. Salah satunya mengggambarkan sebuah computer berbentuk kartu kredit yang dilengkapi dengan : • prosesor yang sangat kuat dan memori yang sangat besar. Bahkan. terdapat banyak penemuan yang dapat menghasilkan teknologi yang berpengaruh besar terhadap kehidupan manusia. atau catatan singkat. • perangkat untuk menghasilkan suara dan memproyeksikan gambar. • batere yang tahan lama dan manajemen energi yang baik. serta • kemampuan untuk berinteraksi secara lisan dengan pemakaianya menggunakan ucapan menggunakan bahasa sehari-hari. pencatatan jadual kegiatan. Melihat keadaan teknologi yang sudah dicapai saat ini serta kesadaran bahwa teknologi yang ada sekarang berkembang terus dengan cepat. Sebagai contoh perkembangan komputer saat ini adalah munculnya PDA (Personal Digital Asistant). serta teknologi telekomunikasi nirkabel untuk mengakses jaringan nirkabel yang berada disekitarnya. PDA mulai mampu menjalankan berbagai aplikasi yang tadinya hanya dapat dijalankan di atas PC. komputer tersebut juga tetap harus dilengkapi dengan perangkat lunak untuk mengedalikan semua sistem serta menjalankan fungsi-fungsinya.manusia. Pertanyaan yang menarik untuk dipikirkan adalah ‘akan seperti apa bentuk komputer pada akhir abad ini?’. tidak berlebihan jika berharap computer yang mendekati ’komputer masa depan’ tersebut akan tersedia sebelum abad ini berakhir. PDA pada awalnya hanya dirancang untuk menjalankan fungsi-fungsi praktis seperti pencatatan serta pencarian daftar alamat dan telpon. sesuai dengan kebutuhan yang berkembang. kini telah terjadi perkawinan antara PDA dengan telepon selular menjadi PDA-phone atau smart phone. yaitu perangkat lunak yang melakukan 4 . bukan bahasa khusus yang rumit. atau penemuan teknologi komputer. penemuan teknologi telpon oleh Alexander Graham Bell (1876). Kini. Perangkat keras serta sebagian perangkat lunak akan bersifat generik. tetapi sebagian komponen perangkat lunaknya akan bersifat ’language dependent’.

pemrosesan bahasa alami secara lisan. Dewasa ini aplikasi konsep AI terus berkembang. baik dari segi kata. 5 . Sandi Setiawan [1993:3]. bagaimana kata-kata bergabung menjadi satu kalimat dan konteks kata dalam kalimat. Bab II ISI 1. dan merespon perintah tersebut dalam bahasa sehari-hari. terjadinya interaksi antara manusia dan komputer dengan perantara bahasa alami yang dipakai oleh manusia. Salah satunya adalah bagaimana membuat komputer memahami perintah yang diberikan pengguna dalam bahasa sehari-hari (natural language). Pengertian NLP adalah proses pembuatan model komputasi bahasa sehingga memungkinkan “Natual Language Processing (NLP) atau Pengolahan Bahasa Alami (PBA) merupakan salah satu bidang ilmu kecerdasan buatan (Artificial Intelligence) yang mempelajari komunikasi antara manusia dengan komputer”. NLP memodelkan pengetahuan terhadap bahasa. Bagian berikutnya dari tulisan ini akan difokuskan pada pembahasan teknologi yang berkaitan dengan pemrosesan bahasa alami tersebut. Untuk itulah penulis mencoba mengangkat tema Natural Language Processing dalam makalah ini.

Pada prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang ingin dikomunikasikan antar manusia. Untuk alasan-alasan inilah maka komputer harus bisa mengoutputkan bahasa alami yang memadai dengan cara yang paling mudah. sintaksis. 2. semantik. Dalam pemahaman suatu bahasa ada beberapa bidang yang harus disertakan yaitu morfologi. pikiran dan perasaan.1 Komponen Utama Pengolahan Bahasa Alami 6 . Bentuk utama representasinya adalah berupa suara/ucapan (spoken language). tetapi sering pula dinyatakan dalam bentuk tulisan. Bahasa merupakan fenomena yang rumit yang melibatkan proses pengenalan bunyi atau huruf. Bila komputer sudah mengerti input kita. Bahasa alami adalah bahasa yang dipakai manusia dalam kehidupan sehari-hari misalnya Bahasa Indonesia. Untuk mengelola kerumitan ini. semantik. Kita harapkan agar outputnya pun akan dinyatakan atau diekspresikan dalam bahasa alami juga. frase dan output lainnya. Komputer harus mengerti gramatika dan definisi kata-kata. morfologi.Agar komputer bisa memahami pertanyaan dalam bahasa alami. Parser berfungsi untuk membaca kalimat. kalimat. dan pengetahuan tentang dunia sekitar. Bahasa Alami “Bahasa adalah suatu sistem untuk komunikasi yang tardiri atas simbol dan aturan yang digunakan untuk mengekspresikan ide. sintaksis. sintaksis.dan pengetuhuan tentang dunia sekitar. maka ia bisa melakukan hal-hal yang kita harapkan/output. Dalam hubungan ini teknik AI digunakan untuk menampilkan pengetahuan internal dan mengolah input. inferensi semantik tingkat tinggi bahkan komunikasi emosi lewat irama bicara. para ahli bahasa telah mendefinisikan tingkat analisis yang berbeda untuk bahasa alami yaitu persanjakan. kata demi kata dan menentukan jenis kata apa saja yang boleh mengikuti kata tersebut. fonologi. pragmatik. komputer harus mempunyai pengetahuan analisis dan interpretasi input dalam mengakuisisi data knowledgenya. pragmatik. Inti dari pemrosesan bahasa alami adalah penguraian kalimat atau sering disebut dengan parser. Pelacakan klasik dan teknik penyocokan pola (pattern matching) digunakan bersama dengan basis pengetahuan agar komputer bisa mengerti apa yang kita masukkan dalam bahasa alami. 2. Untuk bisa mencapai keinginan di atas maka perlu adanya teknik-teknik “pengemasan” kalimat. fonologi. Bahasa Inggris dan sebagainya.

c. sistem pemeriksa sintaks bahasa. 2) Sub-sistem Text to Speech (TTS). berfungsi untuk melakukan pemrosesan secara simbolik terhadap bahasa tulisan. Parser Yaitu suatu system yang mengambil kalimat input dan menguraikannya kedalam beberapa bagian gramatika (kata benda kerja. kata sifat dll) b. Suatu sistem atau teknik yang berlaku untuk suatu bahasa tidak mudah diterapkan untuk bahasa lainnya. 3) Sub-Sistem Speech Recognition (SR).1 Sistem Speech Recognition 7 . Beberapa bentuk aplikasi sub sistem ini adalah translator bahasa alami (misalnya dari Bahasa Inggris ke Bahasa Indonesia). System Representasi Pengetahuan Suatu system yang menganalisis output parser untuk menentukan maknanya. yaitu sebagai berikut. dan sebagainya. 2. 1) Sub-Sistem Natural Language Processing (NLP).2 Sistem Pemrosesan Bahasa Alami Suatu sistem pemrosesan bahasa alami secara lisan dapat dibentuk dari tiga subsistem. yaitu sistem yang berfungsi untuk mengubah atau mengenali suatu ucapan (bahasa lisan) menjadi text (bahasa tulisan). 2. berfungsi untuk mengubah text (bahasa tulisan) menjadi ucapan (bahasa lisan). merupakan kebalikan teknologi Text to Speech. sistem yang dapat ”menyimpulkan” suatu narasi. Berbeda dengan kebanyakan sistem lain yang bersifat generik. teknik-teknik yang digunakan dalam pemrosesan bahasa alami bersifat sangat ‘language dependent’. Output Translator Suatu terjemahan yang merepresentasikan system pengetahuan dan melakukan langkah-langkah yang bisa berupa jawaban atas bahasa alami atau output khusus dengan program computer lainnya.Pengolahan bahasa alami terdiri dari tiga bagian utama yaitu: a.2.

Pada domain frekuensi. diperlihatkan konfigurasi tipikal suatu system Pengenalan Ucapan. noise. Untuk setiap ucapan yang berbeda akan dihasilkan pola ciri yang berbeda. Gambar 1. Masukan sistem adalah ucapan manusia. kondisi emosi.Sistem Speech Recognition atau Sistem Pengenalan Ucapan adalah sistem yang berfungsi untuk mengubah bahasa lisan menjadi bahasa tulisan. setiap sinyal dapat terlihat memiliki ciri-ciri yang unik. Namun demikian. Pada gambar 1. pengucapan suatu unit bunyi ucapan (fonem) seringkali bervariasi antar orang yang berbeda. dan faktor-faktor lainnya. Sistem ini biasanya lebih akurat dan lebih mudah dilatih. untuk kurun waktu yang singkat. juga terpengaruh oleh fonem-fonem disekitarnya. selanjutnya sistem akan mengidentifikasikan kata atau kalimat yang diucapkan dan menghasilkan teks yang sesuai dengan apa yang diucapkan. Sistem yang lebih sederhana adalah sistem yang hanya dapat mengenal sejumlah kata yang jumlahnya terbatas. 8 . Sistem Speech Recognition yang dapat mengenali seluruh kata dalam suatu bahasa melakukan pengenalan untuk setiap unit bunyi pembentuk ucapan (fonem). tetapi tidak dapat mengenal kata yang berada di luar kosa kata yang pernah diajarkan. Sinyal ucapan (s(n)) pertama kali akan dilewatkan pada bagian Penganalisis Ucapan untuk mendapatlan besaran-besaran atau ciriciri yang mudah diolah pada tahap berikutnya. selanjutnya mencoba mencari kemungkinan kombinasi hasil ucapan yang paling dapat diterima. Diagram Blok Sistem Pengenal Ucapan Penganalisis sintaks biasanya melakukan transformasi sinyal ucapan dari domain waktu ke domain frekuensi.

2 Sistem Text to Speech 9 . Semakin besar korpus yang digunakan untuk melatih sistem. Pada mode ini. Artinya. Setiap contoh kata atau kalimat ajar tersebut akan menghasilkan pola tertentu yang akan dipelajari oleh sistem dan disimpan sebagai template atau referensi. Pada mode ini. Berdasarkan hasil perbandingan dengan template atau referensi. sistem yang sama dapat digunakan untuk bahasa apapun. Kedua adalah mode produksi atau pengenalan ucapan. 2. paling tidak harus dilatih dengan ratusan rekaman pembicara. sistem akan dilatih menggunakan sejumlah kata atau kalimat yang memenuhi suatu kriteria tertentu. Namun demikian.2. setiap kalimat yang ingin dikenali akan dianalisis polanya. modul klasifikasi pola serta pengambil keputusan akan mengidentifikasikan kata atau kalimat yang diucapkan tersebut. Korpus yang dimaksud adalah berupa rekaman ucapan yang heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis tertentu. kemampuan sistem untuk mengenali ucapan pada bahasa tertentu sangat tergantung dari template atau referensi yang diperoleh melalui proses belajar di dalam sistemnya itu sendiri. Sistem yang handal. Pada prinsipnya. Untuk melatih sistem Pengenal Ucapan agar dapat digunakan untuk suatu bahasa yang baru. maka diperlukan korpus untuk melatih sistem tersebut. teknik-teknik atau algoritma yang digunakan pada sistem Pengenal Ucapan tidak bersifat sensitif terhadap bahasa. Pertama adalah mode belajar.Sistem Speech Recognition biasanya dapat dioperasikan pada dua mode yang berbeda. akan dihasilkan sistem Speech Recognition yang cenderung lebih handal.

Pada dasarnya TTS adalah suatu sistem yang dapat mengubah text menjadi ucapan. 10 . Kode-kode fonem adalah kode yang merepresentasikan unit bunyi yang ingin diucapkan. serta 2) bagian Konverter Fonem ke Ucapan (Phoneme to Speech). Bagian Konverter Teks ke Fonem berfungsi untuk mengolah kalimat masukan dalam suatu bahasa tertentu yang berbentuk teks menjadi urutan kode-kode bunyi yang direpresentasikan dengan kode fonem. komponen-komponen pembentuk kedua sistem tersebut sama sekali berbeda. Artinya. yaitu : 1) bagian Konverter Teks ke Fonem (Text to Phoneme). Suatu sistem pensintesa ucapan atau Text to Speech pada prinsipnya terdiri dari dua sub sistem. Text to Speech atau TTS melakukan proses pendekatan implementasinya sama sekali berbeda.Secara fungsional. durasi serta pitch-nya. Pengucapan kata atau kalimat pada prinsipnya adalah urutan bunyi atau secara simbolik adalah urutan kode fonem.

NLP mempunyai aplikasi yang sangat luas. Kedua informasi ini dalam suatu sistem TTS biasanya dibangkitkan oleh modul pembangkit/model intonasi. Informasi durasi diperlukan untuk menentukan berapa lama suatu fonem diucapkan. tetapi harus juga mentranslasikan sintaks dari bahasa asal ke bahasa tujuannya. 2. Translator bahasa alami bukan hanya kamus yang menerjemahkan kata per kata.Setiap fonem harus dilengkapi dengan informasi durasi dan pitch. Berdasarkan kode-kode tersebut. Durasi dan pitch bersama-sama akan membentuk intonasi suatu ucapan. Sistem ini biasanya mempunyai masukan dan keluaram berupa bahasa tulisan (teks). Setiap bahasa memiliki aturan cara pembacaan dan cara pengucapan teks yang sangat spesifik. Bagian Konverter Fonem ke Ucapan akan menerima masukan kode-kode fonem serta pitch dan durasi yang telah dihasilkan oleh bagian sebelumnya. Beberapa diantara berbagai kategori aplikasi NLP adlah sebagai berikut : 1. beberapa TTS menggunakan penggabungan segmen bunyi yang berupa multi-phone.3 Sistem Natural Language Processing Teknologi Natural Language Processing (NLP) atau Pemrosesan Bahasa Alami adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan terhadap bahasa alami yang biasa digunakan oleh manusia.2. bagian ini akan menghasilkan bunyi atau sinyal ucapan yang sesuai dengan kalimat yang ingin diucapkan. Saat ini. yaitu translator dari satu bahasa alami ke bahasa alami lainnya. serta diphone concatenation. sedangkan informasi pitch diperlukan untuk menentukan tinggi rendahnya nada pengucapan suatu fonem. Ada beberapa alternatif teknik yang dapat digunakan untuk implementasi bagian konverter fonem ke ucapan. teknik kedua lebih banyak digunakan karena dapat menghasilkan ucapan dengan kualitas yang lebih alami. Hal ini menyebabkan implementasi unit konverter teks ke fonem menjadi sangat spesifik terhadap suatu bahasa (language dependent). Teknik diphone concatenation melakukan pembangkitan ucapan dengan cara menggabung-gabungkan segmen-segmen bunyi yang berupa diphone (dua fonem). Natural Language Translator. Untuk mencapai kualitas yang lebih tinggi. misalnya translator bahasa Inggris ke bahasa Indonesia. 11 . Dua teknik yang paling banyak digunakan adalah formant synthesizer. Bahasa Indonesia ke Bahasa Jawa dan sebagainya.

yaitu suatu sistem yang dapat ”membuat ringkasan” hal-hal yang penting dari suatu wacana yang diberikan. 3. yaitu translator yang mengubah perintah- perintah dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau komputer. misalnya. untuk menghapus semua file. Contoh : • • • System otomatis pelayanan melalui telepon Control suara pada peralatan elektronik Aplikasi peningkatan kemampuan berbahasa 12 .2. Speech based application Aplikasi yang melakukan pemrosesan dari bahasa lisan atau pengenalan suara. Translator bahasa alami ke bahasa buatan. Text Summarization. pengguna cukup memberikan perintah ”komputer. translator yang memungkinkan kita memberikan perintah bahasa alami kepada komputer. 2. tolong hapus semua file !” Translator akan mentranslasikan perintah bahasa alami tersebut menjadi perintah bahasa formal yang dipahami oleh computer. Sebagai contoh.*”. Text based application Aplikasi yang melakukan pemrosesan terhadap teks tertulis.3 Aplikasi Pengolahan Bahasa Alami 1. yaitu “dir *. pengguna sistem dapat memberikan perintah dengan bahasa sehari-hari. Contoh • • • • Mencari topic tertentu dari buku di perpustakaan Mencari isi dari suatu berita atau artikel Mencari isi dari email Menterjemahkan dokumen dari suatu bahasa ke bahasa lain 2. Dengan sistem seperti ini.

Berikut • Alat bantu membaca untuk tunanetra. Alat bantu membaca bagi tunanetra mempunyai masukan berupa teks tercetak (misalnya buku) dan mempunyai keluaran berupa ucapan dari teks tercetak yang diberikan. khususnya untuk Bahasa Indonesia. Aplikasi Alat Bantu Baca • Alat bantu bicara untuk tunawicara. Alat bantu membaca bagi tunawicara mempunyai masukan posisi tangan yang dideteksi oleh suatu sensor dan unit identifikasi. Gambar 4. orang tunanetra dapat membaca suatu buku atau dokumen. serta bagian TTS. Pada prinsipnya ada dua komponen utamanya. Rangkaian huruf yang diidentifikasikan akan disusun membentuk suatu kata yang pada akhirnya akan diumpankan pada bagian TTS.Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi Bahasa. jika teks yang ingin dibacakan sudah tersedia di dalam komputer. Dengan alat bantu ini. Bahkan. yaitu bagian “pengenal karakter” yang menggunakan teknologi OCR (Optical Character Recognition). dengan teknologi Text to Speech dapat langsung diucapkan. 13 .

TTS juga dapat 14 . TTS juga memungkinkan diintegrasikan dengan berbagai program aplikasi. berfungsi untuk mengenali rangkaian kata dari bahasa sumber menjadi teks dalam bahasa sumber. TTS dapat digunakan pada aplikasi telephony. Bagian pertama. Bagian ketiga berupa sistem TTS dalam bahasa tujuan. aplikasi-aplikasi multimedia atau aplikasi-aplikasi lainnya. seperti email. termasuk translator Bahasa Inggris ke Indonesia . Online translator terdiri dari 3 bagian. speech recognition. Online translator yang dimaksud disini adalah translator yang secara otomatis dapat menerjemahkan kalimat lisan dari suatu bahasa alami (misalnya Bahasa Inggris) menjadi ucapan hasil terjemahannya dalam bahasa alami lainnya (misalnya Bahasa Indonesia).• Online translator. Talking email atau aplikasi lainnya. Aplikasi seperti ini mungkin untuk dikembangkan. Bagian berikutnya adalah translator teks ke teks. • Aplikasi Telephony. seperti sistem informasi billing atau sistem informasi lainnya yang diucapkan secara lisan. web browser. Translator bahasa pun sudah banyak dikembangkan. karena teknologi speech recognition sudah banyak dikembangkan. Hasil bagian kedua ini adalah kalimat bahasa tujuan yang masih berupa teks.

 Email translator : alat yang akan menjawab masalah perbedaan bahasa.  World translator : suatu pengembangan dari word translator yang sudah ada.  Jupiter yang mampu memberikan informasi cuaca melalui telepon.digunakan untuk konversi dari SMS (Short Message System) ke ucapan sehingga pesan SMS dapat didengar. diharapkan dengan teknis ini hasil terjemahan bahasa akan menjadi lebih sempurna.kalimat didalam mail box. mengikuti kaidah tata bahasa. Dengan demikian memungkinkan untuk mendengar pesan SMS sambil melakukan aktivitas yang menyulitkan untuk membacanya. Terjemahan akan lebih cepat. seperti yang kita inginkan. karena email translator mampu menterjemahkan bahasa.  Web translator : suatu mesin aplikasi berbasis World Wide Web yang dapat menterjemahkan bahasa dalam suatu web site. seperti sedang mengendarai mobil. Dengan TTS tersebut. tapi perkalimatdengan melihat Subjek-PrediketObjek. Speech Recognition memungkinkan pencarian informasi secara lisan. page per page menjadi bahasa seperti yang kita inginkan.  Alvin yang mampu menjawab pertanyaan mengenai DOS  SEXPERT yang dirancang untuk perbincangan mengenai pendidikan seksual. memungkinkan pula untuk meneruskan pesan SMS ke system telepon biasa (PSTN). Email translator akan menterjemahkan kaimat. jika email yang kita terima tidak sesuai dengan bahasa kita sehari-hari. Contoh aplikasi NLP lainnya :  Eliza yang dibelkali pengetahuan psikologi. sehingga beberapa orang terdorong untuk mampu merubah sikap dan perilakunya. 15 . akurat bukan lagi dengan system menterjemahkan per kata. Web translator akan menterjemahkan  bahasa didalam semua link-link.

Fonetik dan Fonologi : berhubiungan dengan suara yang menghasilkan kata yang dapat dikenali. 3. Morfologi : yaitu pengetahuan tentang kata dan bentuknya dimanfaaatkan untuk membedakan satu kata dengan lainnya. Banyak para ahli Artificial Intelligence berpendapat bahwa bidang yang penting yang dapat dipecahkan oleh Artificial Intelligence adalah Natural Language Processing (Pengolahan Bahasa Alami). Bidang Pengetahuan Dalam Natural Language Secara singkat pengolahan bahasa alami (natural language processing) mengenal beberapa tingkat pengolahan yaitu : 1. 2. Sintaksis : yaitu pemahaman tentang urutan kata dalam pembentukan kalimat dan hubungan antar kata tersebut dalam proses perubahan bentuk darikalimat menjadi bentuk yang sistematis. Pada tingkat ini juga dapat dipisahkan antara kata dan elemen lain seperti tanda baca. kataBenda Predikat  kataKerja. Sebagai contoh : Kalimat  subjek. Sebagai contoh kata membangunkan : Bangun (kata dasar) Mem (prefix) Kan (suffix) 3. Meliputi proses pengaturan letak suatu kata dalam kalimat yangdapat dikenali. Bidang ini menjadi penting dalam proses aplikasi yang memakai metoda speech system.Dalam dunia kecerdasan buatan pengolahan bahasa alami merupakan aplikasi terbesar setelah sistem pakar. predikat Subjek  determinan. kataBanda 16 . Selain itu dapat pula dikenali bagian-bagian kalimat dalam sutu kalimat yang lebih besar.

Contoh: Ibu pergi ke pasar. Selain yang sudah disebutkan diatas masih ada lagi satu masalah yang cukup menantang dalam natural language yaitu ambiguitas atau makna ganda dari suatu kata atau kalimat. Discourse knowledge : melakukan pengenalan apakah suatu kalimat yang telah dikenali mempengaruhi kalimat selanjutnya. keterangan tempat atay aspek sementara dari informasi.4. World knowledge : mencakup arti sebuah kata secara umum dan apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu. Semantik : mempelajari ari suatu kata dan bagaimana arti kata-arti kata tersebut membentuk suatu arti kata dari kalimat yang utuh. Ia membeli makanan disana. Dari satu masukan yang sama dapat menjadi beberapa arti yang berbeda dan masing-masing dapat bernilai benar tergantung pada keperluan pemakai. 7. Penting untuk kata ganti orang. Contoh : Ayah datang (diucapkan dengan nada datar) Ayah datar! (diucapkan dengan nada tinggi) Ayah datang ? (diucapkan dengan tempo cepat) 6. Hal ini dapat terjadi pada hampir semua tingkatan pendekatan di atas. 5.1 Proses Sintaksis 17 . 3. Pragmatik : pengetahuan pada tingkatan ini berkaitan dengan masing-masing konteks yang berbeda tergantung pada situasi dan tujuan pembuatan system. Contoh : Ayahku datang membawa buah tangan.

Jika parsing dilakukan. Keterangan} DictKata = {Orang. hal ini akan membatasi pilihanpilihan dari semantic  Tidak selalu dimungkinkan untuk mengekstrak arti kalimat tanpa menggunakan fakta gramatikal Semua system menggunakan :  Representasi deklaratif. disebut parser.context Free Grammar (CFG) adalah representasi grammar dari chomsky hierarchi yang mudah dipahami dan diolah dalam bentuk program. Defininya adalah : G = (Vn. s. disebut grammar. Ayam. Kata_Kerja. Terbang. Makan. Proses sintaksis sangat berperan dalam pemahaman bahasa alami dikarenakan :  Proses semantic harus beroperasi pada pilihan-pilihan kalimat.2 Gramatika Grammar suatu bahasa dapat dilihat sebagai suatu aturan yang menentukan apakah suatu kumpulan kata dapat diterima sebagai kalimat oleh bahasa tersebut. p) Sebagai contoh dapat dilihatdari grammar G sederhana berikut : DictJenis = {Kata_Benda. Sebuah kalimat yang dapat dikenali bentuk dengan berdasarkan aturan-aturan yang ada yang biasa disebut grammar. dimana membandingkan grammar dengan kalimatkalimat masukan untuk membentuk struktur yang dianalisis. fakta sintaksis tentang bahasa  Prosedur. Frasa_Benda. telur. Frasa_kerja. 3. Tinggi} Dengan aturan : S  Frasa_Benda Frasa_Kerja Frasa_Benda  Kata_Benda Kata_Benda Frasa_Kerja  Kata_Kerja Keterangan 18 .Proses sintaksis merupakan langkah dimana kalimat masukan secara flat diubah kedalam struktur hirarkis yang berhubungan dengan unit-unit arti dalam kalimat.Vt. symbol awal dan aturan penulisan atau (rules). symbol terminal. Jika tidak ada tahap parsing sintaksis maka sistem semantic harus memutuskan atas pilihannya sendiri. Sebuah grammar G dapat dibentuk dari 4 tuple yaitu : symbol non terminal.

‘Sebuah kalimat terdiri atas kata benda (NP) diikuti kata kerja (VP)’.  ε menyatakan string kosong Simbol-simbol yang diperluas oleh aturan-aturan disebut nonterminal symbols. Ayam} Kata_Kerja  {Makan. 19 . Sedangkan kalimat keempat malah sama sekali tidak mungkin tidak dapat dimengerti maknanya. Seperti kalimat ketiga yang hanya benar apabila berada dalam konteks ‘orang memakai alat’ misalnya pesawat terbang.Kata_benda  {Orang. Telur. selain hanya akan menimbulkan tanda Tanya bagi orang yang membaca. Dari grammar kita dapat mempelajari bahasa dari segi struktur dan bukan dari segi makna bahasa itu sendiri. Terbang} Keterangan  {Tinggi} Dari grammar G dapat dibentuk kalimat : Orang Makan Ayam Ayam Terbang Tinggi Orang Terbang Tinggi Ayam Makan Orang Semua kalimat tersebut apabila dicari pembentukannya melalui grammar G dapat dikatakan benar akan tetapi harus diingat bahwa kalimat dengan grammar yang benar hanya berarti benar secara structural bukan berarti selalu benar dalam makna.  I menyatakan “atau/or’. sedangkan simbol-simbol yang berhubungan langsung dengan string yang ditemukan pada kalimat masukan disebut terminal symbols. Aturan pertama.

tipe ini paling sederhana dan mudah dipahami sifatnya.Gambar 1.3 Chomsky Hierarchy Of Generative Grammar Noam Chomsky menyusun grammar dalam urutan yang dia sebut tipe 0. Tipe 0 adalah bentuk yang paling bebas dan paling sulit dikenali. 1. Bottom-Up Parsing gramatika yang 20 . Grammar Untuk Bahasa Inggris 3. Grammar tipe 3 bernama finite state atau regular grammar. maka beberapa cara telah dikembangkan untuk dapat melakukan pengolahan bahasa alami dengan bentuk grammar tersebut. 3. Berikutnya adalah tipe 1 yang disebut context sensitive grammar. biasa disebut recursively enumerable set. Gramatika yang dipakai juga sangat berkaitan dengan proses parsing apa yang digunakan. Akan tetapi karena bentuk context free dan regular grammar tersebut yang paling dipahami perilaku dan pengolahannya. untuk mengenali bentuk ini biasa dipakai Turing Machine. Type 2 dari grammar yaitu context free grammar dinyatakan dengan aturan umum yaitu : <symbol1> → <symbol1>… <symbolk> dengan k ≥ 1 dan bagian kiri dari rule adalah single non terminal symbol. 2 dan 3. Secara umum dikatakan bahwa pemakaian context free grammar secara murni (tanpa tambahan metoda tertentu) adalah tidak cukup untuk pengolahan bahasa alami.4 Parsing Suatu proses menganalisa suatu kumpulan kata dengan memisahkan kata tsb dan menentukan struktur sintaksis dari tiap kata tsb.

Dalam leksikon disimpan daftar kata yang dapat dikenali sebagai symbol terminal dalam grammar dan informasi yang diperlukan untuk tiap kata tersebut untuk proses parsing yang bersangkutan. Hal lain yang juga berkaitan erat dengan proses parsing adalah kamus atau leksikon yang digunakan. proses parsing dapat dibagi menjadi dua bagian besar yaitu Top Down parsing dan Bottom Up parsing. Gambar 2. Pohon Analisis Untuk Sebuah Kalimat 3.5 Semantik Semantic analyzer mempunyai himpunan rule dalam basis pengetahuan untuk menginterprestasikan sebuah kalimat. Rule 2 : 21 . Rule 1 : IF determiner adalah bagian pertama dalam kalimat dan diikuti oleh noun THEN noun tersebut dianggap sebagai subyek.dipakai akan lebih banyak bercabang ke arah simbol non-terminal. Top Down parser memulai pemeriksaan dari simbol awal s dan mencoba untuk mencari bentuk simbol terminal berikutnya yang sesuai dengan jenis kata dari kalimat masukan. Cara sebaliknya diterapkan untuk Bottom Up parser yaitu mencari dari simbol-simbol terminal menuju ke arah pembentukan simbol awal s. Pendekatan dalam mengenali struktur suatu kalimat.

Mendefinisikan semantic dan arti sebenarnya adalah proses yang sulit karena hal ini tergantung pada maksud dalam kalimat dan juga adanya kemungkinan arti lain dalam kalimat. Semantic Grammar sebagai grammar utama dipilih dengan alasan dalam grammar ini sudah terkandung unsur semantic yang dapat membantu pembentukan semantic dari kalimat. tergantung pada letaknya dalam kalimat. Rule 3 : IF noun diikuti subyek dan verb THEN noun tersebut dianggap sebagai obyek Rule 4 : IF kalimat mempunyai bentuk subyek. lalu rule 2 menjelaskan bahwa plan flew. Pada bagian ini akan diterangkan beberapa pendekatan semantic yang biasa dilakukan pada suatu Natural Language system. dia makan hati karena ditinggal pergi pacarnya. maka artinya adalah yang pertama tetapi jika pada kalimat. berarti yang kedua. ver. Pendekatan yang dipakai adalah pendekatan Semantic Grammar yang dipadukan dengan Dictionary tambahan dan Template Grammar.bentuk tanya dan perintah. karena baru mendapat rejeki anak itu makan hati di restoran. Seperti misalnya ‘makan hati ‘dapat diartikan makan dengan lauk hati atau perasaan sedih yang ada pada hati seseorang. dimana data dilewatkan secara verbal. Natural Language Processing dapat dipakai sebagai front (bagian depan) pada sistem AI. Rule 3 dan 4 mengidentifikasikan home sebagai obyek. Apabila terdapat pada kalimat.6 Semantic Grammar 22 . 3. Kalimat 'A plane flew home' mentrigger rule 1 yang mengidentifikasi plane sebagai subyek. Selain itu karena format dari kalimat sudah dibatasi pada bentuk tertentu (representasi data tabel) maka grammar ini dapat diandalkan terutama untuk bentuk .IF verb diikuti subyek THEN verb menjelaskan tentang apa yang dikerjakan oleh subyek. obyek THEN subyek mengerjakan (verb) yang ada hubungannya dengan obyek.

Secara lengkap maka grammar di atas tadi berubah menjadi : 23 . Perlu diingat perubahan ini juga akan merubah kata yang lain misal ‘Chicago’ dari NP menjadi misalnya CITY-NAME. dipakai sekumpulan rule yang bukan hanya bersifat sintaksis tapi juga bersifat semantis dan pragmatis. Dapat dilihat pada contoh dengan domainsistem jadwal penerbangan pesawat udara : the flight to Chicago the 8 o’clock flight flight 457 to Chicago Grammar untuk sistem ini pada umumnya dikenali sebagai : NP → DET CNP CNP → N CNP → CNP PP CNP → PRE-MOD CNP NP → N NUMB (the flight) (flight) (flight to Chicago) (8 o’clock flight) (flight 457) Tetapi perlu diingat bahwa grammar tersebut masih bersifat umum.Pada Semantik Grammar. Hasil dari proses parsing dengan menggunakan grammar tersebut adalah langsung berupa representasi semantis dari kalimat yang diolah. masih memungkinkan terjadi kesalahan karena luasnya jangkauan grammar seperti : the city to Chicago the 8 o’clock city Untuk itu maka dilakukan pembatasan dengan jalan memberikan kategori leksikal baru pada suatu kata yang berdasar pada keperluan semantis. Dapat kita gambarkan bahwa pada : NP → DET CNP (the flight) FLIGHT-NP → DET FLIGHT-CNP CNP → N (flight) FLIGHT-CNP → FLIGHT-N diubah menjadi diubah menjadi Dengan demikian kita sudah melakukan pembatasan bahwa yang mungkin dibentuk untuk kata benda dari sistem adalah ‘the flight’ dan ‘flight’ tidak untuk yang lain.

dimana domain yang baru akan memerlukan aturan yang baru yang sesuai.FLIGHT-NP → DET FLIGHT-CNP FLIGHT-CNP → FLIGHT-N FLIGHT-CNP → FLIGHT-CNP FLIGHT-DEST FLIGHT-CNP → FLIGHT-CNP FLIGHT-SOURCE FLIGHT-CNP → FLIGHT-N FLIGHT-PART FLIGHT-CNP → FLIGHT-PRE-MOD FLIGHT-CNP FLIGHT-NP → FLIGHT-N NUMB CITY-NP → CITY-NAME CITY-NP → DET CITY-CNP CITY-CNP → CITY-N CITY-CNP → CITY-MOD CITY-CNP CITY-MOD-ARG Dari grammar dasar di atas dapat dibentuk grammar tambahan misalnya untuk pertanyaan TIME-QUERY → When does FLIGHT-CNP (When does flight to Chicago) Dengan pendekatan ini. Kekurangan dari pendekatan ini adalah domainsistem yang tidak begitu besar. interpretasi dari rule yang bersangkutan menjadi lebih mudah karena sebagian besar dari informasi semantic yang diperlukan dapat dilihat dari rule yang digunakan. Selain itu terjadi pembengkakan jumlah rule yang diperlukan. ATN (seperti pada gambar 3) menyerupai finite-state machine dimana klas label digabungkan pada garis berarah yang mendefinisikan transisi antara suatu keadaan. Garis berarah ini dapat diberi label (dalam bahasa Inggris) dengan 24 . Seperti pada contoh di atas kita harus memisahkan antara NP untuk ‘flight’ dan ‘Chicago’ menjadi FLIGHT-NP dan CITY-NAME. 3.7 Automated Transition Networks (ATN) Automated Transition Network (ATN) merupakan prosedur top-down parsing dimana bermacam-macam pengetahuan digabungkan ke sistem analisis sehingga dapat beroperasi lebih efisien. hal ini karena dengan langsung mengacu ke semantik maka banyak generalisasi linguistik yang harus diperinci lebih jauh.

- Kata-kata spesifik. seperti ‘noun’ Didorong ke jaringan lain untuk mengenali komponen lain pada suatu kalimat. 3. maka register DETERMINER diset ke DEFINITE lalu ke keadaan Q6 25 4. : Sebuah Jaringan ATN untuk Fragmen Bahasa Inggris Cara kerja ATN pada kalimat: ‘The long file has printed’ 1. Mulai pada keadaan S Masuk ke NP Kerjakan tes kategori untuk melihat jika ‘the’ merupakan determiner Tes sukses. seperti jaringan untuk mengenali prepositional phrase (PP) maka pada garis berarah ditanyakan noun phrase (NP) - Prosedur yang menjalankan tes pada input saat itu dan pada komponen kalimat yang telah diidentifikan - Prosedur-prosedur yang membangun struktur yang akan membentuk bagian akhir dari analisis Gambar 3. . seperti ‘in’ Kategori-kategori kata. 2.

6. Tes sukses sehingga ‘has’ diset ke register AUX dan lalu ke Q3. Pilihan terakhir terdapat pada Q1. maka NP dikeluarkan 14. Lanjut ke Q4. Tes sukses. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan verb. Masih tersisa input. 9. Tes sukses. sehingga kembali ke Q1. Karena input telah habis. Tes gagal Kerjakan tes kategori untuk melihat jika ‘file’ merupakan noun. Tidak ada lagi yang dikerjakan di Q7. sehingga register AUX diset ke NIL dan register V diset ke ‘has’. Lalu diperlukan backtracking. Tes sukses. Kerjakan tes kategori untuk melihat jika ‘printed’ merupakan verb. sehingga kembali ke keadaan Q1. 18. maka register ADJS ditambahkan ‘long’. Lanjut Q4 13. Tetap tinggal di Q6 Kerjakan tes kategori untuk melihat jika ‘file’ merupakan adjective. lalu keluar dan kembali ke struktur (NP(FILE(LONG)DEFINITE)). maka register V diset ke ‘printed’. Register AUX dan V tidak diset 15. Masuk ke PP Kerjakan tes kategori untuk melihat ‘has’ merupakan preposition. 16. dikarenakan kata ‘printed’ bukan determiner ataupun noun murni. maka Q4 merupakan keadaan terakhir.5. sehingga keluar 11. 7. 8. Tes gagal. dengan register SUBJ diset ke struktur yang dikembalikan dan register TYPE diset ke DCL 12. berarti analisis belum selesai. Masuk ke keadaan NP. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan auxiliary. Lalu keluar dan kembali ke struktur (S DCL (NP(FILE(LONG)DEFINITE)) HAS (VP PRINTED)) Struktur ini merupakan output dari analisis 26 . 17. Kerjakan tes kategori untuk melihat jika ‘long’ merupakan adjective Tes sukses. register NOUN diset ke ‘file’ dan lalu ke keadaan Q7. 10.

Bab III PENUTUP 1. Sandi Setiawan [1993:3]. Kesimpulan “Natual Language Processing (NLP) atau Pengolahan Bahasa Alami (PBA) merupakan salah satu bidang ilmu kecerdasan buatan (Artificial Intelligence) yang mempelajari komunikasi antara manusia dengan komputer”. Pengolahan bahasa alami terdiri dari tiga bagian utama yaitu: a. System Representasi Pengetahuan c. Parser b. Output Translator Kategori Aplikasi Pengolahan Bahasa Alami yaitu: 27 .

pengguna sistem dapat memberikan perintah dengan bahasa sehari-hari. yaitu suatu sistem yang dapat ”membuat ringkasan” hal-hal yang penting dari suatu wacana yang diberikan. Discourse knowledge 7. yaitu “dir *. World knowledge 2. Semantik 5. translator yang memungkinkan kita memberikan perintah bahasa alami kepada komputer. Translator bahasa alami ke bahasa buatan. misalnya. yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau komputer. Sintaksis 4. pengguna cukup memberikan perintah ”komputer. Fonetik dan Fonologi 2.*”. Aplikasi Pengolahan Bahasa Alami yaitu: 1. untuk menghapus semua file. Text Summarization.1. Sebagai contoh. Pragmatik 6. Natural Language Translator 2. tolong hapus semua file !” Translator akan mentranslasikan perintah bahasa alami tersebut menjadi perintah bahasa formal yang dipahami oleh computer. Daftar Pustaka 28 . Dengan sistem seperti ini. 3. Morfologi 3. Text based application 2. Speech based application Bidang Pengetahuan Dalam Bahasa Alami yaitu: 1.

pdf .edu/~kangedi/materi%20kuliah/Kecerdasan%20Buatan/Bab %205%20Natural%20Language%20Processing.pdf 3. http://mtg.id/focus/focus_file/Pidato%20Ilmiah%20pada %20Sidang%20Terbuka%20PMB%202004.itb.pdf 2. 29 . http://cobian.upf.lib.eepis-its. http://lecturer.1.ac.edu/files/publications/9d0455-ACM-MM-2005-JPGMahedero-PCanoAMartinez.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->