Professional Documents
Culture Documents
By : Eka Juliantara
Pengertian multimedia
Kelebihan Multimedia
Kelebihan dari multimedia adalah menarik indra dan menarik minat, karena
merupakan gabungan antara pandangan,suara dan gerakan.
Text
Audio Image
Multimedia
Video Animation
a. Teks
Bentuk data multimedia yang paling mudah disimpan dan dikendalikan
adalah teks. Teks dapat membentuk kata, surat atau narasi dalam multimedia
yang menyajikan bahasa. Kebutuhan teks bergantung kepada penggunaan
aplikasi multimedia.
b. Image (grafik)
Alasan untuk menggunakan gambar dalam presentasi atau publikasi
multimedia adalah karena lebih menarik perhatian dan dapat mengurangi
kebosanan dibandingkan dengan teks. Gambar dapat meringkas menyajikan
data yang kompleks dengan cara yang baru dan lebih berguna. Gambar juga
dapat berfungsi sebagai ikon, yang bila dipadukan dengan teks, merupakan
opsi yang bisa dipilih.
c. Bunyi (audio)
PC multimedia tanpa bunyi hanya disebut unimedia, bukan multimedia.
Bunyi dapat ditambahkan dalam multimedia melalui suara, musik dan efek-
efek suara. Seperti halnya grafis, dapat membeli ataupun menciptakan sendiri.
d. Video
Video menyediakan sumberdaya yang kaya dan hidup bagi aplikasi
multimedia.
e. Animasi
Dalam multimedia, animasi merupakan penggunaan komputer untuk
menciptakan gerak pada layer.
f. Virtual Reality
Virtual reality merupakan penggunaan multimedia untuk penerapan secara
langsung.
NTSC System
NTSC (National Television System Committee) merupakan sistem milik Amerika
Serikat dengan lebar layar 525 baris, digunakan di negara Kanada, Greenland, Mexico,
Kuba, Jepang, Philipina, Puerto Rico dan beberapa negara di Amerika Selatan.
Resolution : NTSC 640 X 480
NTSC DV 720 X 480
NTSC WideScreen 720 X 480
NTSC D1 720 X 486
NTSC Square Pix 720 X 540
Frame Rate : 30 fps
Software Multimedia
1. Viewing: Untuk melihat hasil pemgolahan multimedia (Winamp, power DVD)
2. Capturing : Untuk mendapatkan hasil rekaman yang didapat melalui device
multimedia. (software scanner, capture, camdig)
3. Editing : Untuk mengolah bahan multimedia menjadi senuah sajian (adobe)
4. Authoring : Software Multimedia untuk keperluan interaktif (director, flash)
2. Resolusi gambar ntsc adalah 720×480 sedangkan PAL adalah 720×576, yang berarti
pada PAL gambar sedikit lebih besar atau „tinggi‟ daripada NTSC
KEKURANGAN:
1 Apa dampak dari perbedaan fps dan resolusi? salah satunya adalah bila Anda
melakukan „backup‟ atau transfer data ke media lain misalnya ke hardisk untuk
melakukan editing, maka waktu untuk editing dan rendering data dari handycam NTSC
akan relatif lebih lama untuk diproses karena lebih banyaknya data yang ada (+- 20%)
apabila dibandingkan dengan PAL system.
2 Bila Anda hendak menggabungkan hasil shooting dari handycam NTSC dengan hasil
shooting handycam PAL, maka banyak software editing video mengalami kesulitan
untuk bekerja dengan 2 color system dan resolusi yang berbeda tersebut, sehingga
muncul peringatan ataupun error. Dalam hal ini, biasanya salah satu format color system
harus di-convert terlebih dahulu sehingga kedua video memiliki color system yang sama
(nstc yang diconvert ke pal, atau sebaliknya)
KELEBIHAN:
1 kelebihan menggunakan video camcorder berformat NTSC adalah tingginya FPS, yang
menyebabkan lebih banyak jumlah gambar yang tertangkap, dan hal ini sangat
bermanfaat bagi para penggemar video shooting atau movie maker yang membutuhkan
efek ‟slow motion‟. Sehingga dengan video kamera NTSC, diperoleh hasil perlambatan
yang lebih smooth karena data gambar tersedia lebih banyak, lain halnya dengan PAL,
yang bila diperlambat akan lebih blurry karena kemampuan tangkap gambar 25 gambar
per detik
2. Gambar yang dihasilkan bila di-play ke televisi langsung, juga tampak sedikit lebih
smooth bagi mereka yang dapat membedakannya, juga dikarenakan fps yang lebih tinggi
dari PAL.
3. yang ketiga, bila data video perlu di-backup ke vcd atau dvd video dan dikirimkan ke
relasi di luar negeri yang negaranya menganut color system NTSC, maka tidak ada
kesulitan dengan hal ini. catatan: tv kita biasanya diset menjadi auto color system,
sehingga otomatis switch antara pal (stasiun tv) dan ntsc (dvd movie)
Konsep dasar video
Digital video adalah jenis sistem video recording yang bekerja menggunakan
sistem digital dibandingkan dengan analog dalam hal representasi videonya. Biasanya
digital video direkam dalam tape, kemudian didistribusikan melalui optical disc, misalnya
VCD dan DVD. Salah satu alat yang dapat digunakan untuk menghasilkan video digital
adalah camcorder, yang digunakan untuk merekam gambar-gambar video dan audio,
sehingga sebuah camcorder akan terdiri dari camera dan recorder.
Sebuah video terdiri dari beberapa element yang dapat diuraikan sebagai berikut:
1. Frame Rate
Ketika serangkaian gambar mati yang bersambung dimainkan dengan cepat dan
dilihat oleh mata manusia, maka gambar-gambar tersebut akan terlihat seperti
sebuah pergerakan yang halus. Jumlah gambar yang terlihat setiap detik disebut
dengan frame rate. Diperlukan frame rate minimal sebesar 10 fps (frame per
second) untuk menghasilkan pergerakan gambar yang halus. Film-film yang
dilihat di gedung bioskop adalah film yang diproyeksikan dengan frame rate
sebesar 24 fps, sedangkan video yang dilihat pada televisi memiliki frame rate
sebesar 30 fps (tepatnya 29.97 fps). Frame rate digunakan sebagai format standar
NTSC, PAL dan SECAM yang berlaku pada negara-negara didunia.
2. Aspect Ratio
Pixel aspect ratio menjelaskan tentang ratio atau perbandingan antara lebar
dengan tinggi dari sebuah Pixel dalam sebuah gambar. Frame aspect ratio
menggambarkan perbandingan lebar dengan tinggi pada dimensi frame dari
sebuah gambar. Sebagai contoh, D1 NTSC memiliki pixel aspect ratio 0.9 (0.9
lebar dari 1 unit tinggi) dan memiliki pula pixel aspect ratio 4:3 (4 unit lebar dari
3 unit tinggi). Beberapa format video menggunakan frame aspect ratio yang sama
tetapi memakai pixel aspect ratio yang berbeda. Sebagai contoh, beberapa format
NTSC digital menghasilkan sebuah 4:3 frame aspect ratio dengan square pixel
(1.0 pixel aspect ratio) dan dengan resolusi 640 x 480. sedangkan D1 NTSC
menghasilkan frame aspect ratio yang sama yaitu 4:3 tetapi menggunakan
rectangular pixel (0.9 pixel aspect ratio) dengan resolusi 720 x 486. Pixel yang
dihasilkan oleh format D1 akan selalu bersifat rectangular atau bidang persegi,
akan berorientasi vertikal dalam format NTSC dan akan berorientasi horisontal
dalam format PAL. Jika menampilkan rectangular pixel dalam sebuah monitor
square pixel tanpa alterasi maka gambar yang bergerak akan berubah bentuk atau
mengalami distorsi. Contohnya lingkaran akan berubah menjadi oval. Tetapi
bagaimanapun juga apabila ditampilkan pada monitor broadcast, gambar gerak
akan ditampilkan secara benar.
Lebar dan tinggi frame video disebut dengan frame size, yang menggunakan
satuan piksel, misalnya video dengan ukuran frame 640×480 piksel. Dalam dunia
video digital, frame size disebut juga dengan resolusi. Semakin tinggi resolusi
gambar maka semakin besar pula informasi yang dimuat, berarti akan semakin
besar pula kebutuhan memory untuk membaca informasi tersebut. Misalnya untuk
format PAL D1/DV berukuran 720×576 piksel, format NTSC DV 720×480 piksel
dan format PAL VCD/VHS (MPEG-1) berukuran 352×288 piksel sedangkan
format NTSC VCD berukuran 320×240 piksel.
4. Level Bit
Dalam dunia komputer, satuan bit merupakan unit terkecil dalam penyimpanan
informasi. Level bit atau Bit depth menyatakan jumlah atau banyaknya bit yang
disimpan untuk mendeskripsikan warna suatu piksel. Sebuah gambar yang
memiliki 8 bit per piksel dapat menampilkan 256 warna, sedangkan gambar
dengan 24 bit dapat menampilkan warna sebanyak 16 juta warna. Komputer (PC)
menggunakan 24 bit RGB sedang sinyal video menggunakan standar 16 bit YUV
sehingga memiliki jangkauan warna yang terbatas. Untuk itu perlu berhati-hati
apabila membuat video untuk ditayangkan di TV, karena tampilan warna di layar
monitor PC berbeda dengan tampilan di layar TV. Penentuan bit depth ini
tergantung pada sudut pemisah antara gambar yang diterima oleh kedua mata.
Sebagai contoh, pada layar datar, persepsi kedalaman suatu benda berdasarkan
subyek benda yang tampak.
5. Laju Bit
Laju bit disebut juga dengan nama laju data. Laju bit menentukan jumlah data
yang ditampilkan saat video dimainkan. Laju data ini dinyatakan dalam satuan
bps (bit per second). Laju data berkaitan erat dengan pemakaian dan pemilihan
codec (metode kompresi video). Beberapa codec menghendaki laju data tertentu,
misalnya MPEG-2 yang digunakan dalam format DVD dapat menggunakan laju
bit maksimum 9800 kbps atau 9,8 Mbps, sedangkan format VCD hanya mampu
menggunakan laju bit 1,15 Mbps.
Sama halnya dengan file suara dan gambar, teknik kompresi dari video
menghasilkan banyak format file video bermunculan. Berikut adalah formati file video
yang lazim digunakan:
3. Format ini tidak menspesifikasikan bagaimana video atau audio harus di encode,
tetapi sebagai gantinya menspesifikasikan struktur video/audio stream. Berarti
ASF dapat diencode dengan codec apapun.
5. Beberapa contoh format ASF lain adalah WMA dan WMV dari Microsoft.
4. Software: QuickTime
5. Memiliki beberapa track yang terdiri dari auido, video, images, dan text sehingga
masing-masing track dapat terdiri dari file-file yang terpisah.
Reference software
6. MPEG-2 digunakan untuk broadcast, siaran untuk direct-satelit dan cable tv.
DivX
2. DivX bersifat closed source sedangkan untuk versi open sourcenya adalah XviD
yang mampu berjalan juga di Linux.
3. WMV merupakan gabungan dari AVI dan WMA yang terkompres, dapat
berekstensi wmv, avi, atau asf.
Secara sederhana, video dapat diilustrasikan sebagai setumpuk gambar dengan ukuran
frame yang sama dimana gambar-gambar tersebut ditampilkan secara berurutan dengan
frekuensi pemunculan tertentu. Sehingga video memiliki tiga dimensi yaitu dua dimensi
spatial (horizontal dan vertikal) dan satu dimensi waktu. Di dalam video sendiri terdapat
dua hal yang dapat dikompresi yaitu frame (still image). Terdapat dua hal penting yang
dapat dimanfaatkan untuk melakukan kompresi video yaitu redundancy spatial (warna
dalam still image) dan redundancy temporal (perubahan antar frame). Penghilangan
redundancy spatial (spatial / intraframe compression) dilakukan dengan mengambil
keuntungan dari fakta bahwa mata manusia tidak terlalu dapat membedakan warna
dibandingkan dengan brightness, sehingga image dalam video bisa dikompresi (teknik ini
sama dengan teknik kompresi lossy color reduction pada image). Penghilangan
redundancy temporal (temporal / interframe compression) dilakukan dengan
mengirimkan dan mengenkode frame yang berubah saja sedangkan data yang sama masih
disimpan.
H.264 (MPEG-4 Part 10) atau lebih dikenal dengan Advance Video Coding (AVC)
merupakan sebuah codec video digital yang memiliki keunggulan dalam rasio kompresi
(tingkat kompresi yang tinggi) dengan memanfaatkan metoda blok transformasi adaptif
yang efektif. H.264 dikembangkan oleh ITU-T Video Coding Expert Group (VCEG)
bersama-sama dengan ISO/IEC Moving Picture Expert Group (MPEG) yang dinamakan
Joint Video Team (JVC) pada tahun 2003. Tujuan pengembangan H.264/AVC adalah
untuk membuat suatu standar video digital yang dapat menghasilkan kualitas video yang
baik pada bitrate yang lebih kecil dibandingkan dengan standar video digital sebelumnya
(MPEG-2, H.263, maupun MPEG-4 Part 2) tanpa harus melakukan perubahan yang
kompleks dan dapat diimplementasikan dengan biaya yang murah. Tujuan lain dari
pengembangan H.264 adalah dapat digunakan dalam berbagai macam aplikasi seperti
video broadcast, DVB strorage, RTP/IP packet networks, dan ITU-T
multimedia telephony systems. Standar pengkodean H.264/AVC disusun atas dua
lapis konsep (gambar 2.3) yaitu video coding layer (VCL), yang bertujuan untuk
efisiensi konten video, dan network abstraction layer (NAL), yang memformat keluaran
video dari VCL dan memberi informasi header dengan tepat untuk diteruskan ke
transport layer atau media penyimpanan. Pictures). Picture (frame) yang merupakan
bagian dari GOP adalah primary coding unit dari video sequence. Merepresentasikan
nilai luminance (Y) dan 2 chrominance (Cb dan Cr). Dalam pengkodean H.264/AVC
menggunakan format 4:2:0, yaitu komponen chrominance memiliki porsi setengah dari
komponen luminance. Sedangkan macroblock dikenal sebagai basic coding unit pada
algoritma MPEG.16x16 pixel segment dalam sebuah frame. Macroblock mencakup
area segi empat dengan ukuran 16x16 pixel untuk komponen luminance(Y) dan
8x8 pixel setiap 2 komponen chrominance (Cb dan Cr). Block adalah coding unit
terkecil pada algoritma MPEG. 8x8 pixel atau 4x4 pixel dapat berupa salah satu
dari luminance(Y), red chrominance(Cr),atau blue chrominance(Cb). Sejumlah
makroblok, disebut sebagai slice, diproses untuk dikodekan. Slice dibedakan
menjadi lima tipe I-,P-,B-,SI-dan SP-slice. Urutannya dari kiri-kanan, atas bawah.
Penting untuk error handling. Bila terjadi error maka di-skip ke slice berikutnya.
H.264/AVC CODEC
Deblocking filter merupakan elemen baru dalam standar kompresi video MPEG.
Dalamvstandar MPEG sebelum MPEG4/H.264 (MPEG1, MPEG2, MPEG4/H.261,
MPEG4/H.263), elemen ini tidak dijumpai. Fungsi utama dari deblocking filter adalah
untuk mengurangi distorsi blocking pada setiap decoded macroblock. Pada encoder,
deblocking filter diaplikasikan setelah inverse transform dan sebelum proses rekonstruksi
dan penyimpanan macroblock untuk prediksi berikutnya. Sementara, pada decoder,
aplikasi deblocking filter dilakukan setelah inverse transform dan sebelum proses
rekonstruksi dan penampilan macroblock Deblocking filter digunakan untuk
memperbaiki kualitas gambar yang pada intinya adalah menghaluskan (mengurangi) efek
blocking yang biasa terjadi pada video digital. Deblocking filter diaplikasikan dalam
setiap 4x4 block maupun 16x16 macroblock sehingga menghasilkan kualitas video yang
lebih baik. Filter ini memiliki dua keuntungan yaitu :
a. Sisi-sisi dari block dan macroblock lebih halus sehingga meningkatkan kualitas dari
Profile didefinisikan sebagai suatu set perangkat atau algoritma pengkodean yang
digunakan untuk menghasilkan bitstream yang sesuai, sedangkan level bertujuan untuk
membatasi nilai dari parameter-parameter algoritma yang digunakan. H.264/AVC
mendefinisikan tiga macam profile: baseline profile (untuk video conference dan aplikasi
wireless), main profile (digunakan untuk layanan broadcast) dan extended profile
(digunakan dalam aplikasi streaming).
Setiap level memiliki batas atas nilai dari ukuran gambar (dalam makroblock), rata-rata
waktu proses decode (dalam makroblock perdetik), ukuran multipicture buffer, bitrate
video, dan ukuran buffer video.
H.261 :
CODING UNTUK VIDEO CONFERENCING
H.261 :
CODING UNTUK VIDEO CONFERENCING
Versi terakhir : reference model eight (RM8) sebagai basis H.261 saat ini
Parameter coding dari video terkompres di multiplex dan digabung dengan audio,
data dan end-to-end signaling untuk transmisi
Transmission buffer mengontrol bit rate
Dalam CIF dan QCIF , blok DCT digrupkan kedalam macroblock : empat
luminance dan dua blok chrominance Cb dan Cr yang sesuai
Mode coding inter/intra untuk blok luminance dan chrominance pada area yang
sama
Penggunaan satu motion vector baik untuk blok luminance dan chrominance
coding yang efisien untuk sejumlah besar blok DCT 8 x 8 yang diharapkan tanpa
coded information dalam interframe coding code VLC untuk coded block
patern (CBP) dan macroblock addressing
untuk membawa informasi tambahan yang sesuai untuk GOB, macroblock atau
layer yang lebih tinggi (format gambar, temporal references, tipe macroblock,
index quantiser, dll)
sebuah MB
PREDICTION
Komponen horizontal dan vertikal dari motion vector mempunyai harga integer
tidak melebihi ą 15 pixels/frame
KEPUTUSAN MC/NO_MC
menjustifikasi keuntungan
KEPUTUSAN INTER/INTRA
Scene cuts atau dalam hal „violent motion‟ interframe prediction mungkin tidak
akan lebih kecil daripada intraframe (intraframe dapat dikodekan dengan bit rate
yang lebih kecil)
FORCED UPDATING
TIPE-TIPE MACROBLOCK
Inter coded : interframe coded macroblock tanpa motion vector atau dengan
motion vector 0
MC coded : motion compensated MB, dimana MC-error cukup signifikan dan
perlu dikodekan DCT
MC not coded : motion compensated error MB, dimana motion compensated error
tidak signifikan tidak perlu DCT coded
Not-coded : jika semua enam blok pada suatu macroblock, tanpa motion
compensation mempunyai energi yang tidak signifikan, maka tidak dikodekan
MB seperti ini disebut “Skipped”, “Not-coded” atau “Fixed” (Fixed MB tidak
ditransmisikan dan pada decoder di-copy dari frame sebelumnya)
TIPE-TIPE MACROBLOCK
Karena ukuran step kuantisasi ditentukan pada awal setiap GOB atau baris dari GOB
- Inter coded + Q
- MC coded + Q
- Intra + Q
ADDRESSING MACROBLOCK
Jika semua komponen terkuantisasi suatu blok dari enam blok pada sebuah MB
nol, blok tersebut dideklarasikan sebagai not coded
Jika semua enam blok not coded MB dideklarasikan not coded MB atau
Skipped
else
Kecuali semua enam blok nol (fixed MB) tidak dikodekan, 63 lainnya
diidentifikasi dalam 63 pola berbeda
ADDRESSING MACROBLOCK
Dengan urutan pengkodean Y0, Y1, Y2, Y3, Cb dan Cr informasi pola blok atau
pattern number didefiniskan:
Jika MB intracoded (atau intra+Q) informasi pola tidak ditransmisikan (pada intra
frame coded MB, semua block mempunyai energi yang signifikan tentu coded)
Setelah tipe macroblock diidentifikasi dan dikodekan VLC, posisinya dalam GOB
harus ditentukan
Setiap blok dari enam blok MB yang dipilih di-transform kodekan dengan 2D-
DCT
Ratio antara koefisien terkuantisasi terhadap ukuran step kuantisasi (index) yang
dikodekan
Pada 2D-VLC karena range index : -127 s/d +127 dan range run: 0 s/d 63
Disain Huffman code untuk sejumlah besar simbol ini tidak praktis (suatu
codeword dapat mempunyai panjang samapi 200 bit!)
Event-event yang paling sering muncul dan simbol ESCAPE dikodekan VLC
(Huffman code) seperti biasa
Event dengan probabilitas rendah diidentifikasi dengan fixed length run dan index
yang „ditambahkan‟ pada code ESCAPE
event yang jarang dengan 6 bit run (0-63) dan 8 bit index
DC./Intra index dikuantisasi secara linier dengan ukuran step 8 dan tanpa dead
zone
LOOP FILTER
Pada bit rate rendah ukuran step kuantisasi besar banyak koefisien DCT nol
gambar rekonstruksi tampak blocky
Jika posisi area blocky berubah dari satu frame ke frame lainnya tampak
seperti noise frekuensi tinggi mosquito noise
Distorsi ini dapat dikurangi dengan loop filter (low pass filter)
Loop filter mengakibatkan blurring effect hanya diaktifkan untuk blok dengan
motion
Loop filter hanya didefinisikan pada H.261 (tidak ada video codec lain yang
menggunakannya) dan diaktifkan untuk semua 6 blok DCT dari sebuah
macroblock
Filtering diaplikasikan untuk rate coding < 6 x 64 kbit/s (386 kbit/s) dan di-switch
of untuk rate > 386 kbit/s
RATE CONTROL
Bit rate hasil algortima coding DCT-based berfluktuasi bergantung pada natur
video (kecepatan gerak objek, ukuran, texture, dll)
Tujuan dari rate controller adalah untuk mendapatkan bit rate konstan untuk
transmisi melalui jaringan circuit switched
Metoda umum untuk kontrol bit rate adalah dengan memonitor pendudukan
buffer dan merubah step kuantisasi sesuai dengan kepenuhan buffer
Step kuantisasi dikalkulasi sebagai fungsi linier dari isi buffer :
p p x 64 kbit/s
H.264 (MPEG 4)
H.264 (MPEG-4 Part 10) atau lebih dikenal dengan Advance Video Coding (AVC)
merupakan sebuah codec video digital yang memiliki keunggulan dalam rasio kompresi
(tingkat kompresi yang tinggi) dengan memanfaatkan metoda blok transformasi adaptif yang
efektif. H.264 dikembangkan oleh ITU-T Video Coding Expert Group (VCEG) bersama-
sama dengan ISO/IEC Moving Picture Expert Group (MPEG) yang dinamakan Joint Video
Team (JVC). Tujuan pengembangan H.264/AVC adalah untuk membuat suatu standar video
digital yang dapat menghasilkan kualitas video yang baik pada bitrate yang lebih kecil
dibandingkan dengan standar video digital sebelumnya (MPEG-2, H.263, maupun MPEG-4
Part 2) tanpa harus melakukan perubahan yang kompleks dan dapat diimplementasikan
dengan biaya yang murah. Tujuan lain dari pengembangan H.264 adalah dapat digunakan
dalam berbagai macam aplikasi seperti video broadcast, DVB strorage, RTP/IP packet
networks, dan ITU-T multimedia telephony systems.
Struktur video
a.Video Sequence, diawali dengan sequence header, berisi satu group gambar atau lebih,
diakhiri dengan kode end-of-sequence
b.GOP (Group of Pictures), sebuah header dan rangkaian satu gambar atau lebih
c.Picture, primary coding unit dari video sequence. Merepresentasikan nilai luminance (Y) n
2 chrominance (Cb dan Cr)
d.Slice, satu atau lebih macroblock. Urutannya dari kiri-kanan, atas-bawah. Penting untuk
error handling. Bila terjadi error maka akan di-skip ke slice berikutnya.
e.Macroblock, basic coding unit pada algoritma MPEG.16x16 pixel segment dalam sebuah
frame. Macroblock terdiri dari 4 luminance, 1 Cr, dan 1 Cb.
f.Block, coding unit terkecil pada algoritma MPEG. 8x8 pixel,dapat berupa salah satu dari
luminance rec chrominance,atau blue chrominance.
b. Mendukung B- picture
b. Mendukung B-picture
Setiap level memiliki batas atas nilai dari ukuran gambar (dalam macroblock), rata-rata
waktu proses decode (dalam macroblock perdetik), ukuran multipicture buffer, bitrate video
dan ukuran buffer video.
Kompresi intraframe
Memanfaatkan redudansi spasial yang terdapat dalam suatu frame. Ada beberapa metode
kompresi intraframe yaitu:
a) Sub Sampling
Hal ini merupakan dasar dari kebanyakan kompresi images/video, metode ini mengupayakan
untuk mengurangi jumlah bit untuk merepresentasikan suatu image. Subsampling dapat
dilakukan dengan dua cara. Pertama, dengan mengambil piksel-piksel pada baris dan kolom
ganjil saja. Kedua, dengan mengambil rata-rata dari sekolompok piksel dan menggunakan
nilai tersebut sebagai ganti kelompok piksel. Cara ini lebih kompleks, tetapi menghasilkan
kualitas yang lebih baik.
Metode ini dilakukan dengan mengurangi jumlah bit yang digunakan untuk
merepresentasikan suatu piksel misalnya dari 16 bit/piksel diturunkan menjadi 8 bit/piksel.
Dengan konsekuensi akan menurunkan kualitas video dibandingkan video sebelumnya.
c) Transform Coding
Metode yang lain digunakan dalam kompresi intraframe adalah mentransformasikan data
dari domain ruang ke dalam domain frekuensi. Cara ini menghasilkan data yang lebih mudah
diproses untuk kompresi lebih lanjut.Transformasi yang popular digunakan misalnya:
Discrete cosine transform (DCT ) dan Wavelet. Proses transformasi dan kuantisasi yang
bersifat lossy, serta pengkodean yang bersifat lossless. Disini digunakan Discrete Cosinus
Trasnform (DCT). Kemudian dilanjutkan dengan kuantisasi yang mana digunakan untuk
memotong hasil transformasi. Proses selanjutnya dalam pengkodean dengan menggunakan
run legth encoding (RLE) dan variabel length coding (VLC).
Prinsip dasarnya yaitu untuk melakukan proses transformasi dari domain ruang ke domain
frekuensi. Dengan menggunakan transformasi ini maka data vital akan terkumpul pada
frekuensi DC. Dengan adanya transformasi ini sangatlah menguntungkan untuk kompresi
data, karena pada domain frekuensi inilah diperoleh sifat-sifat yang mendukung serangkaian
proses selanjutnya. Masukan proses DCT berupa matriks data dua dimensi N x N. Persamaan
blok matrik berukuran N x N adalah :
Dan pada proses dekomposisi untuk mentransformasikan kembali data dari domain frekuensi
ke domain ruang menggunakan Inverse Discrite Cosine Trasnsform (IDCT).
d) Kuantisasi
Prinsip dasar dari kuantisasi yaitu bertujuan untuk mengurangi jumlah bit yang diperlukan
untuk menyimpan suatu nilai dengan cara membaginya dengan nilai yang ditentukan dalam
matrik kuantisasi. H.264 menggunakan skalar kuantisasi.Ada 52 kuantisasi step standar yang
digunakan di H264 yang ditandai dengan kuantisasi parameter(QP).setiap kuantisasi step
berhubungan dengan kuantisasi parameter (QP).
b. Ditranformasikan dengan
c. Proses kuantisasi
Blok alur kuantisasi :
e) RLE
RLE (Run length encoding) adalah proses serangkaian simbol yang berurutan dikodekan
menjadi suatu kode yang yang terdiri dari symbol tersebut dan jumlah perulangannya. Hasil
dari proses transformasi yang dikuantisasi cenderung nol untuk frekuensi tinggi. Untuk
melakukan RLE secara efektif, keluaran proses kuantisasi tadi dibaca secara linier dari
frekuensi rendah sampai tinggi. Cara yang digunakan adalah cara zig-zag dimulai dari
koefisien DC (0.0) kemudian koefisien DC (0.1) dan seterusnya.
f) Entropy coding
Proses mengkodekan tiap piksel tertentu yang mempunyai panjang yang berbeda. Teknik
algoritmik yang digunakan berbeda antara proses pengkodean satu dengan yang lainya.
H.264 menggunakan CABAC (Context-based Adaptive Binary Arithmetic Coding) atau
CAVLC (Context Based Adaptive Variable Length Coding).
f.1. CABAC
Context-based Adaptive Binary Aritmethic Coding (CABAC) adalah suatu bentuk coding
yang merupakan pengembangan dari aritmethic coding. CABAC terdiri atas 3 bagian coding
yaitu binarization, context modeling, binary aritmethic.blok diagram CABAC sebagai
berikut:
f.1.1. Binarization
pengurangan alphabet dilakukan oleh binarization untuk tiap non binary element
menghasilkan suatu intemediate unik codeword biner untuk unsur sintaksis yang ditentukan
yang disebut bin string.
Context modeling digunakan untuk membersihkan interface antara modeling dan model.
Setiap distribusi model akan diberi symbol yang kemudian didalam langkah coding
selanjutnya, memandu coding engine to generate suatu urutan bit sebagai code pada symbol
menurut distribusi model.
Binary aritmethic coding adalah berdasarkan pada prinsip pengulangan interval [lower,
upper) yang melibatkan operasi perkalian dasar dan juga berdasar pada arithmethic
coding.dengan aturan:
Lower` = lower+width*low/maxfreq
Width` = width*symb_width/maxfreq
Kompresi interframe
Kompresi yang mana menggunakan redudansi temporal yang terdapat dalam sekelompok
frame yang diantaranya yaitu :
a) Subsampling
Yaitu dengan cara mengurangi laju frame data video. Pengurangan itu dilakukan dengan
hanya menggunakan frame tertentu saja.
b) Difference coding
Metode ini, frame dibagi menjadi beberapa block yang tidak tumpang tindih. Tiap blok
tersebut dibandingkan dengan block yang bersesuaian pada frame yang sebelumnya. Hanya
block yang mengalami perubahan signifikan saja yang disimpan.
c) Motion Compensation
Metode ini juga mengunakan pembagian block yang sama namun block tersebut
dibandingkan dengan frame yang sebelumnya, hingga ditemukan blok yang paling mirip.
Perbedaaan lokasi antara block tersebut dengan blok yang mirip pada frame yang sebelumnya
disebut vektor gerak (motion vector). Metode ini efektif karena hanya vektor gerak saja yang
disimpan atau ditrasmisikan.
VIDEO STREAMING
Streaming adalah sebuah teknologi untuk memaninkan file video atau audio
secara langsung ataupun dengan pre-recorder dari sebuah mesin server (web server).
Dengan kata lain, file video ataupun audio yang terletak dalam sebuah server dapat secara
langsung dijalankan pada UE sesaat setelah ada permintaan dari user, sehingga proses
running aplikasi yang didownload berupa waktu yang lama dapat dihindari tanpa harus
melakukan proses penyimpanan terlebih dahulu. Saat file video atau audio di stream,
akan berbentuk sebuah buffer di komputer client, dan data video - audio tersebut akan
bulai di download ke dalam buffer yang telah terbentuk pada mesin client. Dalam waktu
sepersekian detik, buffer telah terisi penuh dan secara otomatis file videoaudio dijalankan
oleh sistem. Sistem akan membaca informasi dari buffer dan tetap melakukan proses
download file, sehingga proses streaming tetap berlangsung ke mesin i.
Video atau audio dapat diencode untuk keperluan komunikasi secara real time atau dapat
juga di pre-encoded dan disimpan dalam format CD-DVD untuk dijalankan pada saat
dibutuhkan. Salah satu aplikasi yang membutuhkan real time encoding adalah
videophone dan video conferencing. Sedangkan aplikasi yang membutuhkan pre-encoded
antara lain DVD, VCD, yang dikenal dengan penyimpanan secara local atau Video on
Demand (VoD), yang penyimpanannya dilakukan secara remote di server yang dikenal
dengan video streaming.
Transfer Video via File Download dan Transfer Video via Streaming
Sebuah file video yang akan ditampilkan di user dapat menggunakan dua metode transfer
file. Pertama, dengan mendownload file video tersebut dan yang kedua dengan
melakukan proses streaming. Kedua metode ini memiliki keunggulan dan kekurangannya
masing-masing. Sebuah file video yang diambil dari server dengan cara download tidak
dapaat ditampilkan dalam sebuah file video tersebut selesai tersalin ke buffer. Metode ini
memerlukan media penyimpanan yang cukup besar dan waktu yang diperlukan untuk
proses download cukup lama karena file video biasanya berukuran besar. Metode kedua
yang dapat digunakan adalah proses streaming. Metode ini berusaha untuk mengatasi
masalah yang terdapat dalam metode download. Ide dasar dari video streaming ini adalah
membagi paket video menjadi beberapa bagian, mentransmisikan paket data tersebut,
kemudian penerima (receiver) dapat mendecode dan memainkan potongan paket video
tersebut tanpa harus menunggu keseluruhan file selesai terkirim ke mesin penerima.