P. 1
Kompresi Data Audio

Kompresi Data Audio

|Views: 57|Likes:
Published by Hakiki Fauzi

More info:

Published by: Hakiki Fauzi on Oct 19, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/08/2013

pdf

text

original

Kompresi Data Audio

Satrio Adi Rukmono – NIM : 13506070 Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Jalan Ganesha 10, Bandung 40132 e-mail: r.satrioadi@gmail.com

Abstrak
Seperti halnya data gambar maupun video, data audio juga memerlukan kompresi untuk isu storage dan keperluan pengaksesan secara real time melalui jaringan komputer. Namun, untuk data audio tidak dapat digunakan teknik kompresi untuk data generik. Penggunaan algoritma demikian menyebabkan buruknya kualitas suara, rasio kompresi yang tidak terlalu besar (sekitar 87%), dan algoritma demikian tidak dirancang untuk keperluan pengaksesan secara real time. Mirip dengan kompresi gambar, ada dua macam teknik kompresi data audio, yaitu lossy dan lossless. Untuk konsumsi sehari-hari, teknik kompresi yang lossy lebih banyak digunakan karena rasio kompresi yang besar, dan penurunan kualitas data audio pun tidak dapat terlalu ditangkap oleh keterbatasan telinga manusia. Makalah ini membahas prinsip-prinsip dasar dalam kompresi data audio dan membandingkan beberapa teknik kompresi data audio. Kata kunci: kompresi, audio, multimedia

1. Pendahuluan
Seperti pada teknik kompresi pada umumnya, kompresi data audio, baik lossy maupun lossless, memanfaatkan adanya redundansi informasi dengan pengkodean, pengenalan pola, maupun prediksi linear seperti pada kompresi video. Pada kompresi lossless, hasil kompresi dapat dikembalikan seperti data asli tanpa ada perubahan, maka rasio kompresi pun tidak dapat terlalu besar untuk memastikan semua data dapat dikembalikan ke bentuk semula. Kompresi lossy pada data audio berdasarkan pada psikoakustik, sebagaimana kompresi lossy pada gambar yang berdasarkan pada redundansi psikovisual. Keduanya memanfaatkan keterbatasan indera manusia yang hanya dapat menangkap (perceive) kondisi lingkungannya dalam rentang tertentu, misalnya telinga manusia hanya dapat menangkap suara dengan frekuensi di antara 20Hz hingga 20000Hz.

dapat mencapai 35% pada data musik orkestra atau paduan suara yang tidak terlalu banyak noise. 2.1. Kegunaan kompresi lossless pada data audio Kompresi lossless utamanya digunakan untuk pengarsipan, dan penyuntingan. Untuk keperluan pengarsipan, tentu kualitas yang diinginkan adalah kualitas terbaik. Begitu juga dengan penyuntingan. Menyunting data yang terkompresi secara lossy menyebabkan turunnya kualitas suara pada setiap penyimpanan. Maka kompresi lossless selalu digunakan dalam sound engineering. Selain kedua kegunaan itu, kompresi lossless juga biasa digunakan oleh para audiophile, yaitu penggemar musik yang senang mendengarkan musik dengan kualitas tinggi dengan perangkat keras yang berkualitas tinggi pula. Data audio yang terkompresi secara lossless juga digunakan untuk menghasilkan data audio versi lossy untuk didistribusikan. Saat ini, dengan semakin murahnya media penyimpanan data digital dan bandwidth, kompresi lossless pun menjadi semakin populer di kalangan konsumen. 2.2. Prinsip dasar kompresi lossless pada data audio Ada dua tahap utama dalam kompresi lossless untuk data audio, yaitu prediction dan coding. Prediction memanfaatkan sample-sample sebelumnya untuk memprediksi sample berikutnya. Kemudian selisih antara sample hasil prediksi dengan sample

2. Kompresi Data Audio, Lossless
Kompresi lossless pada data audio berarti bahwa hasil kompresi dari data tersebut dapat di-dekompres untuk menghasilkan data yang sama persis dengan data asli, tanpa ada penurunan kualitas sama sekali. Kompresi lossless untuk data audio agak mirip dengan algoritma kompresi lossless generik, dengan rasio kompresi sekitar 50% hingga 60%, meskipun

Efektivitas prediksi dapat terlihat dari ukuran residu yang dibutuhkan. Perbedaan terdapat pada algoritma prediksi dan pengkodean residu yang digunakan. Ukuran blok dapat berbeda-beda. Free Lossless Audio Codec (FLAC) Format FLAC (Xiph. tahapan kompresi pada MPEG-4 ALS mirip dengan FLAC. Parameter ini didasarkan pada variansi nilai residu. ◦ Left-side. Kedua metode terakhir adalah yang paling efisien pada kebanyakan kasus. Perbedaannya antara lain untuk coding residu. menyimpan rata-rata sinyal kedua channel sebagai mid channel dan selisih antara channel kiri dengan kanan sebagai side channel. karakteristik sinyal audio akan terlalu bervariasi sehingga sulit menemukan predictor yang optimal. ◦ Residu dibagi-bagi ke dalam beberapa bagian kontigu dengan panjang yang sama. dan True Audio. Residu ini dismipan dengan salah satu dari dua cara rice coding: ◦ menggunakan satu parameter untuk seluruh residu. Apple Lossless. Prediktor tidak dapat mendeskripsikan sinyal dengan persis. Untuk setiap format. 2. Jika ukuran blok terlalu kecil. maka dibutuhkan banyak frame sehingga banyak bit akan terbuang untuk menyimpan frame header. coding (LPC) untuk melakukan . Ada empat metode yang digunakan FLAC untuk prediction: ◦ Verbatim.3. • • Blocking. MPEG-4 ALS menggunakan linear predictive prediksi. Monkey's Audio. oleh karena itu perlu disimpan selisih antara sinyal asli dengan sinyal hasil prediksi. MPEG-4 ALS Operasi pada MPEG-4 Audio Lossless Coding (Moving Pictures Expert Group) mirip dengan FLAC. seringkali banyak korelasi antara channel kiri dan kanan. Interchannel Decorrelation. Beberapa format kompresi lossless Format kompresi lossless untuk data audio yang paling tua adalah Shorten. Encoding yang digunakan adalah run-length. ◦ Right-side. Ukuran blok ini mempengaruhi rasio kompresi secara langsung. ◦ FIR linear prediction. Rasio Kompresi Kompresi MPEG-4 ALS menghasilkan kompresi sebesar 40% hingga 50%. Selanjutnya encoder mencari aproksimasi deskripsi matematis dari sinyal pada setiap blok. Yang akan dibandingkan di sini hanya Free Lossless Audio Codec dan MPEG-4 ALS. Metode ini digunakan jika dalam channel tertentu pada suatu blok terdapat digital silence atau nilai yang konstan.sebenarnya dikodekan (coding). dengan setiap bagian memiliki parameter sendiri yang ditentukan dari nilai rata-rata residu. sedagkan yang masih umum digunakan saat ini adalah Free Lossless Audio Codec. Sinyal prediksi adalah nol. sehingga residu sama dengan sinyal yang sebenarnya (tidak ada kompresi). Tahapan Kompresi Secara garis besar. bergantung pada beberapa faktor termasuk sample rate.1. biasanya perbedaan hanya terdapat pada teknik prediction dan/atau coding. ◦ Fixed linear prediction. Metode prediksi ini diketauhi oleh encoder maupun decoder sehingga pada hasil kompresi cukup disertakan parameter prediksi.Org Foundation) memanfaatkan tingginya korelasi antar sample pada data audio. ◦ Mid-side. Dengan demikian terdapat beberapa metode penyimpanan channel ke dalam blok sebagai berikut: ◦ Independent. Blok dalam FLAC mengacu pada deretan sample yang merentang pada beberapa channel.2. MPEG-4 mendukung kombinasi lossy dengan lossless pada MPEG-4 SLS (Scalable to Lossless). 2. kedua channel dikodekan terpisah. menyimpan channel kanan dan side channel.3. rasio • • Prediction. Untuk data stereo. Residual coding. Tahapan Kompresi rasio kompresi • Prediction. Jika terlalu besar. Ukuran deskripsi ini umumnya jauh lebih kecil daripada ukuran sinyal itu sendiri. yang kemudian disimpan dengan Golomb-Rice coding. ◦ Constant. Selisih ini disebut residu. 2. FLAC menggunakan prediksi linear untuk mengkonversi sample menjadi deretan angka yang disebut residu. ALS menggunakan Golomb-Rice atau Block Gilbert Moore Coding. MPEG-4 ALS. FLAC membatasi ukuran blok antara 16 hingga 65535 sample per blok. WavPack. menyimpan channel kiri dan side channel. Rasio Kompresi Kompresi FLAC menghasilkan sebesar 50% hingga 60%.3.

yang disimpan adalah selisih dengan sample sebelumnya. Selain itu. serta OGG. maka bagian suara tersebut tidak perlu dikodekan. yang berkaitan dengan daya tangkap telinga manusia terhadap suara. 2003. pada kompresi lossy untuk data audio akan terjadi penurunan kualitas jika hasil kompresi dicoba untuk di-dekompresi. Namun masih ada beberapa teknik dasar lainnya dalam kompresi lossy untuk data audio. AAC yang merupakan pengembangan lebih lanjut. MPEG. Lossy Sesuai namanya. yaitu: • 3. Residual coding. Kompresi Data Audio. video streaming. Introduction to MPEG-4 Audio Lossless Coding. kompresi lossy pada data audio memanfaatkan psikoakustik.2. "Audio Compression Techniques". AMR pada GSM. "FLAC Format". [4] Nejdl. oleh karena itu noise 'disembunyikan' di area frekuensi tinggi ini dengan volume kecil. pada CELP selisih antara suara original dengan model analitis juga disimpan dalam bentuk yang terkompresi juga.1. yaitu menghapus sample-sample yang hening (tidak ada suara) seperti jeda antar paragraf pada sebuah pidato ataupun keheningan sejenak pada beberapa bagian dari lagu. Data audio dibandingkan dengan model ini. [3] Harada. Kualitas suara yang dibangkitkan buruk sehingga tidak digunakan lagi pada saat ini. Teknik ini sangat sederhana. MPEG-4 ALS and Archiving Format.2. Rusty.net/format. sedikit penurunan kualitas dapat berpengaruh secara beruntun pada proses engineering.• Voc File Compression. 3. • • 3. televisi digital. Referensi [1] Xiph. Kompresi ini digunakan konsumen audio. Kegunaan kompresi lossy pada data audio Kompresi lossy pada data audio sangat banyak digunakan. sedangkan untuk sample-sample berikutnya. 2007. AMR-WB untuk CDMA.3. terdapat beberapa format seperti A-law/µ-law yang digunakan pada telepon. • Gambar 1: LPC pada MPEG-4 ALS Mengenai LPC ini dibahas lebih lanjut pada subbab 3. Noboru. Penurunan kualitas ini disebut dengan compression artefacts. baik secara langsung (misalnya pada mp3 player) maupun secara tidak langsung (terkandung dalam DVD video. sample pertama disimpan secara utuh. Pada BGMC. 3. Telinga manusia hanya dapat menangkap suara dengan frekuensi di antara 20Hz hingga 20000Hz. format yang sangat populer adalah MP3 yang merupakan bagian dari MPEG yang menangani layer audio (MPEG layer III). Teknik inilah yang memanfaatkan teori psikoakustik. CELP merupakan pengembangan lebih lanjut. yang umumnya tidak terlalu besar. LPC merupakan teknik kompresi kuno yang digunakan untuk suara manusia (speech). Sinyal dengan frekuensi tinggi hanya dapat didengar manusia jika memiliki volume yang besar. Prinsip dasar kompresi lossy pada data audio Utamanya. ADPCM. dengan model analitis yang lebih kompleks untuk menghasilkan rasio kompresi yang lebih besar dan kualitas suara yang lebih baik. Pada MPEG-4 ALS dapat digunakan algoritma Golomb-Rice Coding seperti pada FLAC atau Block Gilbert Moore Coding (BGMC). Untuk data speech. Tilman. yang masih berhubungan dengan psikoakustik adalah noise shaping. dan sebagainya. . oleh sebab itu produksi data audio tidak menggunakan kompresi lossy. Sedikit mirip dengan kompresi lossless. Pada LPC terdapat sebuah model analitis dari pita suara manusia. sebab dengan rasio kompresi yang sangat tinggi (5% hingga 20%) kualitas suara masih cukup baik. Code Excited Linear Predictor (CELP). Sederhananya. http://flac. residu dibagi lagi menjadi dua kategori. kemudian dikodekan dengan rice coding. Residu yang berada di luar kemudian dikurangi lagi dengan nilai residu maksimum agar semua residu berada di area tengah distribusi. Linear Predictive Coding (LPC). kemudian yang disimpan hanyalah parameter untuk membangkitkan suara yang mirip menggunakan model tersebut. yaitu yang berada di area tengah dari distribusi dan yang berada di luar area tersebut. Jika suara tidak dapat didengar telinga manusia.html (tanggal akses: 4 Mei 2009) [2] Liebchen.Org Foundation.sourceforge. Beberapa format kompresi lossy Untuk data audio secara umum. dan sebagainya). Di tangan audio engineer.

ringofsaturn. The Theory Behind Mp3. .php (tanggal akses: 21 April 2009) [5] Raissi. Rassol.com/compress.http://musik. 2002.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->