Professional Documents
Culture Documents
Satrio Adi Rukmono NIM : 13506070 Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Jalan Ganesha 10, Bandung 40132 e-mail: r.satrioadi@gmail.com
Abstrak
Seperti halnya data gambar maupun video, data audio juga memerlukan kompresi untuk isu storage dan keperluan pengaksesan secara real time melalui jaringan komputer. Namun, untuk data audio tidak dapat digunakan teknik kompresi untuk data generik. Penggunaan algoritma demikian menyebabkan buruknya kualitas suara, rasio kompresi yang tidak terlalu besar (sekitar 87%), dan algoritma demikian tidak dirancang untuk keperluan pengaksesan secara real time. Mirip dengan kompresi gambar, ada dua macam teknik kompresi data audio, yaitu lossy dan lossless. Untuk konsumsi sehari-hari, teknik kompresi yang lossy lebih banyak digunakan karena rasio kompresi yang besar, dan penurunan kualitas data audio pun tidak dapat terlalu ditangkap oleh keterbatasan telinga manusia. Makalah ini membahas prinsip-prinsip dasar dalam kompresi data audio dan membandingkan beberapa teknik kompresi data audio. Kata kunci: kompresi, audio, multimedia
1. Pendahuluan
Seperti pada teknik kompresi pada umumnya, kompresi data audio, baik lossy maupun lossless, memanfaatkan adanya redundansi informasi dengan pengkodean, pengenalan pola, maupun prediksi linear seperti pada kompresi video. Pada kompresi lossless, hasil kompresi dapat dikembalikan seperti data asli tanpa ada perubahan, maka rasio kompresi pun tidak dapat terlalu besar untuk memastikan semua data dapat dikembalikan ke bentuk semula. Kompresi lossy pada data audio berdasarkan pada psikoakustik, sebagaimana kompresi lossy pada gambar yang berdasarkan pada redundansi psikovisual. Keduanya memanfaatkan keterbatasan indera manusia yang hanya dapat menangkap (perceive) kondisi lingkungannya dalam rentang tertentu, misalnya telinga manusia hanya dapat menangkap suara dengan frekuensi di antara 20Hz hingga 20000Hz.
dapat mencapai 35% pada data musik orkestra atau paduan suara yang tidak terlalu banyak noise. 2.1. Kegunaan kompresi lossless pada data audio Kompresi lossless utamanya digunakan untuk pengarsipan, dan penyuntingan. Untuk keperluan pengarsipan, tentu kualitas yang diinginkan adalah kualitas terbaik. Begitu juga dengan penyuntingan. Menyunting data yang terkompresi secara lossy menyebabkan turunnya kualitas suara pada setiap penyimpanan. Maka kompresi lossless selalu digunakan dalam sound engineering. Selain kedua kegunaan itu, kompresi lossless juga biasa digunakan oleh para audiophile, yaitu penggemar musik yang senang mendengarkan musik dengan kualitas tinggi dengan perangkat keras yang berkualitas tinggi pula. Data audio yang terkompresi secara lossless juga digunakan untuk menghasilkan data audio versi lossy untuk didistribusikan. Saat ini, dengan semakin murahnya media penyimpanan data digital dan bandwidth, kompresi lossless pun menjadi semakin populer di kalangan konsumen. 2.2. Prinsip dasar kompresi lossless pada data audio Ada dua tahap utama dalam kompresi lossless untuk data audio, yaitu prediction dan coding. Prediction memanfaatkan sample-sample sebelumnya untuk memprediksi sample berikutnya. Kemudian selisih antara sample hasil prediksi dengan sample
sebenarnya dikodekan (coding). Untuk setiap format, biasanya perbedaan hanya terdapat pada teknik prediction dan/atau coding. 2.3. Beberapa format kompresi lossless Format kompresi lossless untuk data audio yang paling tua adalah Shorten, sedagkan yang masih umum digunakan saat ini adalah Free Lossless Audio Codec, Apple Lossless, MPEG-4 ALS, Monkey's Audio, WavPack, dan True Audio. Yang akan dibandingkan di sini hanya Free Lossless Audio Codec dan MPEG-4 ALS. 2.3.1. Free Lossless Audio Codec (FLAC) Format FLAC (Xiph.Org Foundation) memanfaatkan tingginya korelasi antar sample pada data audio. FLAC menggunakan prediksi linear untuk mengkonversi sample menjadi deretan angka yang disebut residu, yang kemudian disimpan dengan Golomb-Rice coding. Rasio Kompresi Kompresi FLAC menghasilkan sebesar 50% hingga 60%. Tahapan Kompresi rasio kompresi
Prediction. Selanjutnya encoder mencari aproksimasi deskripsi matematis dari sinyal pada setiap blok. Ukuran deskripsi ini umumnya jauh lebih kecil daripada ukuran sinyal itu sendiri. Metode prediksi ini diketauhi oleh encoder maupun decoder sehingga pada hasil kompresi cukup disertakan parameter prediksi. Ada empat metode yang digunakan FLAC untuk prediction: Verbatim. Sinyal prediksi adalah nol, sehingga residu sama dengan sinyal yang sebenarnya (tidak ada kompresi). Constant. Metode ini digunakan jika dalam channel tertentu pada suatu blok terdapat digital silence atau nilai yang konstan. Encoding yang digunakan adalah run-length. Fixed linear prediction. FIR linear prediction. Residual coding. Prediktor tidak dapat mendeskripsikan sinyal dengan persis, oleh karena itu perlu disimpan selisih antara sinyal asli dengan sinyal hasil prediksi. Selisih ini disebut residu. Efektivitas prediksi dapat terlihat dari ukuran residu yang dibutuhkan. Residu ini dismipan dengan salah satu dari dua cara rice coding: menggunakan satu parameter untuk seluruh residu. Parameter ini didasarkan pada variansi nilai residu. Residu dibagi-bagi ke dalam beberapa bagian kontigu dengan panjang yang sama, dengan setiap bagian memiliki parameter sendiri yang ditentukan dari nilai rata-rata residu.
2.3.2. MPEG-4 ALS Operasi pada MPEG-4 Audio Lossless Coding (Moving Pictures Expert Group) mirip dengan FLAC. Perbedaannya antara lain untuk coding residu, ALS menggunakan Golomb-Rice atau Block Gilbert Moore Coding. MPEG-4 mendukung kombinasi lossy dengan lossless pada MPEG-4 SLS (Scalable to Lossless). Rasio Kompresi Kompresi MPEG-4 ALS menghasilkan kompresi sebesar 40% hingga 50%. Tahapan Kompresi Secara garis besar, tahapan kompresi pada MPEG-4 ALS mirip dengan FLAC. Perbedaan terdapat pada algoritma prediksi dan pengkodean residu yang digunakan. rasio
Gambar 1: LPC pada MPEG-4 ALS Mengenai LPC ini dibahas lebih lanjut pada subbab 3.2. Residual coding. Pada MPEG-4 ALS dapat digunakan algoritma Golomb-Rice Coding seperti pada FLAC atau Block Gilbert Moore Coding (BGMC). Pada BGMC, residu dibagi lagi menjadi dua kategori, yaitu yang berada di area tengah dari distribusi dan yang berada di luar area tersebut. Residu yang berada di luar kemudian dikurangi lagi dengan nilai residu maksimum agar semua residu berada di area tengah distribusi, kemudian dikodekan dengan rice coding.
3.3. Beberapa format kompresi lossy Untuk data audio secara umum, format yang sangat populer adalah MP3 yang merupakan bagian dari MPEG yang menangani layer audio (MPEG layer III), AAC yang merupakan pengembangan lebih lanjut, serta OGG. Untuk data speech, terdapat beberapa format seperti A-law/-law yang digunakan pada telepon, AMR pada GSM, AMR-WB untuk CDMA, dan sebagainya.
Referensi
[1] Xiph.Org Foundation. "FLAC Format". http://flac.sourceforge.net/format.html (tanggal akses: 4 Mei 2009) [2] Liebchen, Tilman. Introduction to MPEG-4 Audio Lossless Coding. 2003. [3] Harada, Noboru. MPEG-4 ALS and Archiving Format. 2007. [4] Nejdl, Rusty. "Audio Compression Techniques".
http://musik.ringofsaturn.com/compress.php (tanggal akses: 21 April 2009) [5] Raissi, Rassol. The Theory Behind Mp3. 2002.