P. 1
Rev 01 Speech Prak 1 Matlab

Rev 01 Speech Prak 1 Matlab

|Views: 129|Likes:
Published by Ahmad Kahfi Santoso

More info:

Published by: Ahmad Kahfi Santoso on Jul 16, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as RTF, PDF, TXT or read online from Scribd
See more
See less

01/24/2013

pdf

text

original

Modul 1 Praktikum Pengolahan Informasi Wicara Perekaman dan Pengeditan

MODU

PROSES PEREKAMAN DAN PENGEDITAN SINYAL WICARA

TUJUAN Mahasiswa mampu melakukan proses perekaman dan pengeditan sinyal wicara dengan menggunakan perangkat lunak.

II.

DASAR TEORI 2.1. Pembangkitan Sinyal Wicara pada Manusia Speech (wicara) dihasilkan dari sebuah kerjasama antara (dengan vocal cords menghasilkan sebuah ) dan lungs (paru-paru), glottis

articulation tract (mouth/mulut dan nose cavity/rongga hidung). voiced sounds (suara ucapan), paru-paru lungs menekan udara bergetar, menginterupt udara melalui

Gambar 1 menunjukkan penampang melintang dari organ wicara manusia. Untuk melalui epiglottis, vocal cords aliran udara dan menghassilkan sebuah gelombang tekanan quasi-periodic.

Gambar 1. Organ wicara manusia

Tri Budi Santoso, Miftahul Huda

1

Pada saat rongga mulut dapat mengalami . akan menimbulkan radiasi sebuah gelombang suara yang mana merupakan sinyal wicara. Ini merupakan bagian dari sinyal voice (suara) yang mendefinisikan melody (melodi wicara). Sederetan impulse yang sama Variasi pada frekuensi pitch Gambar 2. suara sinyal wicara monotonous tetapi dalam kasus normal sebuah perubahan permanen pada frekuensi terjadi. Ketika kita berbicara dengan sebuah frekuensi pitch impulses dan frekuensi sinyal pitch frequency atau fundamental frequency. Kedua rongga beraksi sebagai resonators dengan karacteristik frekuensi resonansi masing-masing.Modul 1 Praktikum Pengolahan Informasi Wicara Perekaman dan Pengeditan Impuls tekanan pada umumnya disebut sebagai tekanan adalah dalam Gambar 2a sederetan impuls (fungsi tekanan suara) dihasikan oleh suara. Sederetan impuls dan pitch pada sinyal wicara Impuls pitch merangsang udara di dalam mulut. Variasi frekuensi pitch dapat dilihat seperti pada Gambar 2b. dan untuk suara tertentu (nasals) juga merangsang nasal cavity (rongga hidung). yang disebut perubahan besar. vocal cords Di untuk sebuah speech pitch konstan. Ketika rongga beresonansi. formant frequencies .

kita mampu untuk menghasilkan beragam pola ucapan suara yang berbeda. Tri Budi Santoso. Miftahul Huda 2 .

2. Bentuk Sinyal Wicara dalam Domain Waktu Sinyal wicara merupakan sinyal yang bervariasi lambat sebagai fungsi waktu. exitasi pada unvoiced sounds (suara tak vocal tract lebih menyerupai noise (derau).Modul 1 Praktikum Pengolahan Informasi Wicara Perekaman dan Pengeditan Di dalam kasus terucap). Tetapi bilamana diamati dalam durasi yang lebih panjang (> 1/5 detik) karakteristik sinyalnya berubah untuk merefleksikan suara ucapan yang keluar dari pembicara. Untuk sementara perbedaan bentuk dan posisi pada organ articulation diabaikan saja. Tri Budi Santoso. Gambar 3 menampilkan proses produksi suara-suara /a/. pembangkitan ucapan /a/ pembangkitan ucapan /f/ Gambar 3. Proses produksi suara 2. dalam hal ini ketika diamati pada durasi yang sangat pendek (5 sampai 100 mili detik) karakteristiknya masih stasioner. dan /f/. Miftahul Huda 3 .

Miftahul Huda 4 . Contoh sinyal wicara ucapan “Selamat Datang” Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan menampilkannya dalam tiga kondisi dasar. Tri Budi Santoso. yaitu sinyal wicara tidak diproduksi. Untuk memperoleh bentuk sinyal waktu diskrit.Modul 1 Praktikum Pengolahan Informasi Wicara V US Perekaman dan Pengeditan Gambar 4. sinyal waktu kontinyu harus dirubah menjadi bentuk waktu diskrit dan dilanjutkan dengan proses digitalisasi. 2. Untuk proses komputasi. berfibrasi. sinyal waktu kontinyu harus di-sampel. Proses Sampling Perhatikan sinyal sinus berikut ini: x( t ) = A c os ( ωt +φ) Sinyal tersebut merupakan (1) juga seringkali contoh sinyal waktu kontinyu. dan yang ketiga adalah secara periodik sehingga silence (S) atau keadaan tenang dimana unvoice (U) dimana voiced (V) dimana vocal cord tidak bervibrasi vocal cord menggerakkan udara ke kerongkongan melalui mekanisme akustik sampai keluar mulut dan menghasilkan sinyal wicara. Kita menggunakan terminologi sinyal analog untuk menyebutnya.3.

Blok diagram konversi sinyal kontinyu menjadi sinyal diskrit Ts = 1/fs x[n] = x[nTs] Sekuen x[n] didapakan setelah proses perubahan dari continues to discrete (C-to-D). Kondisi realnya secara hardware adalah menggunakan rangkaian sampling seperti Gambar 6 berikut ini.Modul 1 Praktikum Pengolahan Informasi Wicara Perekaman dan Pengeditan x(t) C-to-D Gambar 5. fs > 2x f i (2) Shannon harus sama dengan atau Jika sinyal informasi yang kita sample memiliki komponen frekuensi beragam. informasi N bit kode digital Sample & Quantization EncodingHold Gambar 7 . fs=1/Ts Sinyal input Sinyal output Gambar 6. maka sinyal informasi tersebut bisa dituliskan sebagai: i max tx )( Tri Budi Santoso. Blok diagram rangkaian ADC Persyaratan frekuensi sampling menurut teorema melebihi 2 kali frekuensi sinyal yang di sample. misalnya untuk sinyal wiacara memungkinkan untuk memiliki frekuensi dari 20 sampai 4000 Hz. Rangkaian Sampling Rangkaian sampling diatas merupakan sebuah ujung tombak dari sebuah analog to digital conversion (ADC). Miftahul Huda = i ∑ sin( = 1 2 π (3) ) f it 5 .

. fs=1/Ts yang juga dikenal sebagai (4) sampling rate Nyquist rate. Untuk microphone dan speaker aktif bias juga lengkap. sebaiknya dites dulu.1. yaitu III. speaker aktif dan digantikan dengan head set microphone. PERANGKAT YANG DIPERLUKAN 1 (satu) buah PC Multimedia lengkap sound card dan microphone Satu perangkat lunak Matlab IV. LANGKAH-LANGKAH PERCOBAAN 4. Penataan Perangkat Sebelum melakukan percobaan siswa harus melakukan penataan seperti pada Gambar berikut ini.Modul 1 Praktikum Pengolahan Informasi Wicara Perekaman dan Pengeditan Dan persyaratan untuk frekuensi smpling menjadi: fs > 2x fimax Frekuensi sampling seringkali dikatakan dengan terminology jumlah sample yang diambil setiap detik. Sebelum memulai praktikum. Penataan perangkat percobaan recording dan editing PC yang digunakan harus dilengkapi dengan peralatan multimedia seperti sound card. apakah seluruh perangkat multimedia sudah terintegrasi dengan PC. Microphone Sound Card PC Multimedia Matlab Speaker Gambar 8. .

Miftahul Huda 6 .Tri Budi Santoso.

coba aktifkan kembali Matlab. seperti pada pertemuan pertama saat mengenal Matlab Audio.’a. Tambahkan juga pada program bagaimana cara memainkan file *.wav’).3. y2=y1(1:10000). 4. Proses Pengeditan untuk Pemisah Vokal Apabila telah selesai berdiskusi dengan teman terdekat. Fs.wav').Modul 1 Praktikum Pengolahan Informasi Wicara 4. caranya adalah sebagai berikut: y1=wavread('aiueo.Fs. Tampilkan dengan perintah plot.wav. wavwrite(y1. Coba tampilkan sebagian saja dari seluruh sinyal. Buka file hasil rekaman “ aiueo. dan coba perhatikan dengan seksama durasi sinyal hasil dari proses perekaman tersebut.0*Fs. Aktifkan Matlab. t=length(y1). Simpan ke dalam suatu file a.Fs. y = wavrecord(5. cobalah untuk membuat perintah tambahan pada program diatas sehingga bisa membaca file *.wav yang sudah direkam. wavwrite(y. Siapkan microphone dan perangkat multimedia. 'double'). Buat program berikut ini untuk melakukan recording dengan Matlab clear all. mengujinya dengan melalui gambar dan mendengarkan suara yang Lakukan hal yang sama untuk vocal ’i’. Kalau mengalami kesulitan buka kembali catatan tentang Matlab Audio yang ada di bagian lain pada buku ini. dan jangan lupa dihasilkan. Semuanya juga harus . Fs = 8000.wav”. ’u’.wav hasil perekaman.wav') Untuk mengetahui apakah proses perekaman yang telah dilakukan berhasil. dan lanjtukan dengan langkah berikut ini. plot(y2) Sekarang coba buat program yang hanya membuat tampilan untuk vokal ’a’ saja. Untuk itu ikuti langkah berikut ini. ’e’ dan ’o’.2 Perekaman dengan Matlab Perekaman dan Pengeditan Praktikum Pengolahan Informasi Wicara dengan langkah pertama adalah melakukan proses recording (perekaman) suara.'aiueo.

wav. Tri Budi Santoso. Miftahul Huda 7 .disimpan dalam bentuk file *.

Amati Lakukan hal yang sama. dan voice.Fs) Rubah nilai frekuensi sampling menjadi Fs=10000. coba buat catatan tentang durasi perekaman masing-masing vokal yang telah dilakukan. 6000. dengan nilai Fs = 14000. 24000. sampling Fs=7000. 44000 Hz. y=wavread('aiueo. Perubahan Nilai Sampling Perekaman dan Pengeditan Coba panggil kembali file hasil perekaman dengan cara sebagai berikut.wav') wavplay(y. Berikan catatan nilai magnitudo tertinggi pada masing-masing vokal yang telah direkam. . Berikan analisa terhadap perubahan nilai yang dihasilkan. Dari hasil percobaan yang telah dilakukan.4. coba silence. Fs = 8000. dan 5000. clear all. Sampling Rate terhadap suara aiuoe.wav”. 16000. Coba rubah dengan menurunkan nilai kejadian apa yang dapat diamati pada sinyal suara tsb.Modul 1 Praktikum Pengolahan Informasi Wicara 4. perhatikan apa yang terjadi. ANALISA DATA DAN TUGAS Untuk grafik “ beri tanda mana yang termasuk katagori unvoice.

Tri Budi Santoso. Miftahul Huda 8 .

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->