You are on page 1of 33

SEJARAH MULTIMEDIA

By : Eka Juliantara

 Istilah multimedia berawal dari teater, bukan computer. Pertunjukan yang


memanfaatkan lebih dari satu medium seringkali disebut pertunjukan
multimedia.
 Sistem multimedia dimulai pada akhir 1980-an dengan diperkenalkannya
Hypercard oleh Apple pada tahun 1987 dan pengumuman oleh IBM pada
tahun 1989 mengenai perangkat lunak audio visual connection(AVC) dan
video adhapter card ps/2
 Pada tahun 1994 diperkerkirakan ada lebih dari 700 produk dan sistem
multimedia dipasaran.
 Multimedia memungkinkan pemakai komputer untuk mendapatkan output
dalam bentuk yang jauh lebih kaya dari pada media table dan grafik
konvensional. pemakai dapat melihat gambar tiga dimensi, foto, video
bergerak atau animasi dan mendengar suara stereo, perekaman suara atau alat
musik.
 Beberapa sistem multimedia bersifat interaktif, memungkinkan pemakai
memilih output dengan mouse atau kemampuan layar sentuh untuk
mendapatkan dan menjalankan aplikasi itu.

Pengertian multimedia

 Multi-banyak, Media-sarana berkomunikasi untuk melewatkan informasi.


 Suatu sistem yang terdiri dari perangkat keras, perangkat lunak dan alat – alat lain
seperti televisi, monitor video dan sistem piringan optik atau sistem stereo yang
dimaksudkan untuk menghasilkan penyajian audio visual yang utuh.

Beberapa pakar mengartikan multimedia sebagai berikut :


1. Multimedia secara umum merupakan kombinasi 3 element yaitu suara,gambar
dan teks (Mc Cormick,1996)
2. Multimedia adalah kombinasi dari paling sedikit 2 media input atau output dari
data,media ini dapat audio (suara, musik), animasi, video, teks, grafik, dan
gambar (Turban dkk, 2002)
3. Multimedia merupakan alat yang dapat menciptakan prestasi yang dinamis dan
intraktif yang mengkombinasikan teks grafik, animasi, audio dan gambar video
(Robin dan Linda, 2001)
4. Multimedia adalah pemanfaatan computer untuk membuat dan menggabungkan
teks, grafik, audio, gambar bergerak (video dan animasi) dengan menggabungkan
link dan tool yang memungkinkan pemakai melakukan navigasi, berintraksi,
berkreasi dan berkomunikasi (Hofstetter, 2001)

“ Multimedia adalah pemanfaatan komputer untuk membuat dan menggabungkan teks,


grafik, audio, gambar bergerak (video dan animasi) dengan menggabungkan link dan tool
yang memungkinkan pemakai melakukan navigasi, berinteraksi, berkreasi, dan
berkomunikasi “

Kelebihan Multimedia

Dari berbagai media informasi, multimedia memilki suatu kelebihan tersendiri


yang tidak dapat digantikan oleh penyajian media informasi lainya.

Kelebihan dari multimedia adalah menarik indra dan menarik minat, karena
merupakan gabungan antara pandangan,suara dan gerakan.

Lembaga riset dan penerbitan komputer yaitu Computer Technology Research


(CTR) menyatakan bahwa orang hanya mampu mengingat 20 % dari yang dilihat dan
30 % dari yang didengar. Tetapi orang mengingat 50 % dari yang dilihat dan didengar
dan 80 % dari yang dilihat, didengar dan dilakukan sekaligus.
Komponen Multimedia

Menurut James A. Senn, multimedia terbagi dalam beberapa element-element


multimedia, seperti yang rerlihat dalam gambar dibawah ini :

Text

Audio Image

Multimedia

Video Animation

a. Teks
Bentuk data multimedia yang paling mudah disimpan dan dikendalikan
adalah teks. Teks dapat membentuk kata, surat atau narasi dalam multimedia
yang menyajikan bahasa. Kebutuhan teks bergantung kepada penggunaan
aplikasi multimedia.
b. Image (grafik)
Alasan untuk menggunakan gambar dalam presentasi atau publikasi
multimedia adalah karena lebih menarik perhatian dan dapat mengurangi
kebosanan dibandingkan dengan teks. Gambar dapat meringkas menyajikan
data yang kompleks dengan cara yang baru dan lebih berguna. Gambar juga
dapat berfungsi sebagai ikon, yang bila dipadukan dengan teks, merupakan
opsi yang bisa dipilih.

c. Bunyi (audio)
PC multimedia tanpa bunyi hanya disebut unimedia, bukan multimedia.
Bunyi dapat ditambahkan dalam multimedia melalui suara, musik dan efek-
efek suara. Seperti halnya grafis, dapat membeli ataupun menciptakan sendiri.
d. Video
Video menyediakan sumberdaya yang kaya dan hidup bagi aplikasi
multimedia.

e. Animasi
Dalam multimedia, animasi merupakan penggunaan komputer untuk
menciptakan gerak pada layer.
f. Virtual Reality
Virtual reality merupakan penggunaan multimedia untuk penerapan secara
langsung.

NTSC System
NTSC (National Television System Committee) merupakan sistem milik Amerika
Serikat dengan lebar layar 525 baris, digunakan di negara Kanada, Greenland, Mexico,
Kuba, Jepang, Philipina, Puerto Rico dan beberapa negara di Amerika Selatan.
Resolution : NTSC 640 X 480
NTSC DV 720 X 480
NTSC WideScreen 720 X 480
NTSC D1 720 X 486
NTSC Square Pix 720 X 540
Frame Rate : 30 fps

PAL dan SECAM System


Banyak negara yang menggunakan kedua sistem ini yakni PAL (Phase Alternating
Line) atau SECAM (Sequential Color and Memory). Kedua sistem ini memiliki lebar
layar 625 baris
Resolution : PAL D1/DV : 720 X 576
PAL D1/DV Square Pix : 768 X 576
PAL D1/DV WideScreen : 720 X 576
Frame Rate : 25 fps
HDTV
HDTV (High Definition Television) adalah standar internasional baru untuk dunia
televisi. HDTV dapat digunakan dalam 1.125 baris.
Resolution 1280 X 720
Frame Rate 29.9 Fps

Software Multimedia
1. Viewing: Untuk melihat hasil pemgolahan multimedia (Winamp, power DVD)
2. Capturing : Untuk mendapatkan hasil rekaman yang didapat melalui device
multimedia. (software scanner, capture, camdig)
3. Editing : Untuk mengolah bahan multimedia menjadi senuah sajian (adobe)
4. Authoring : Software Multimedia untuk keperluan interaktif (director, flash)

PERBEDAAN NTSC dengan PAL


1. FPS atau frame per second yang lebih tinggi dari PAL, dimana pada pal system, fps-
nya adalah 25fps, yang berarti dalam 1 detik video kamera merekam 25 gambar,
sedangkan pada NTSC menggunakan fps 29,97.

2. Resolusi gambar ntsc adalah 720×480 sedangkan PAL adalah 720×576, yang berarti
pada PAL gambar sedikit lebih besar atau „tinggi‟ daripada NTSC

KEKURANGAN:
1 Apa dampak dari perbedaan fps dan resolusi? salah satunya adalah bila Anda
melakukan „backup‟ atau transfer data ke media lain misalnya ke hardisk untuk
melakukan editing, maka waktu untuk editing dan rendering data dari handycam NTSC
akan relatif lebih lama untuk diproses karena lebih banyaknya data yang ada (+- 20%)
apabila dibandingkan dengan PAL system.
2 Bila Anda hendak menggabungkan hasil shooting dari handycam NTSC dengan hasil
shooting handycam PAL, maka banyak software editing video mengalami kesulitan
untuk bekerja dengan 2 color system dan resolusi yang berbeda tersebut, sehingga
muncul peringatan ataupun error. Dalam hal ini, biasanya salah satu format color system
harus di-convert terlebih dahulu sehingga kedua video memiliki color system yang sama
(nstc yang diconvert ke pal, atau sebaliknya)

3 Kesulitan untuk menjual kembali, dikarenakan banyak orang tidak menginginkan


handycam dengan color system NTSC, karena dianggap format „asing‟ yang memang
biasanya barang bawaan dari luar negeri, dan tanpa disertai garansi.

KELEBIHAN:
1 kelebihan menggunakan video camcorder berformat NTSC adalah tingginya FPS, yang
menyebabkan lebih banyak jumlah gambar yang tertangkap, dan hal ini sangat
bermanfaat bagi para penggemar video shooting atau movie maker yang membutuhkan
efek ‟slow motion‟. Sehingga dengan video kamera NTSC, diperoleh hasil perlambatan
yang lebih smooth karena data gambar tersedia lebih banyak, lain halnya dengan PAL,
yang bila diperlambat akan lebih blurry karena kemampuan tangkap gambar 25 gambar
per detik

2. Gambar yang dihasilkan bila di-play ke televisi langsung, juga tampak sedikit lebih
smooth bagi mereka yang dapat membedakannya, juga dikarenakan fps yang lebih tinggi
dari PAL.

3. yang ketiga, bila data video perlu di-backup ke vcd atau dvd video dan dikirimkan ke
relasi di luar negeri yang negaranya menganut color system NTSC, maka tidak ada
kesulitan dengan hal ini. catatan: tv kita biasanya diset menjadi auto color system,
sehingga otomatis switch antara pal (stasiun tv) dan ntsc (dvd movie)
Konsep dasar video

Digital video adalah jenis sistem video recording yang bekerja menggunakan
sistem digital dibandingkan dengan analog dalam hal representasi videonya. Biasanya
digital video direkam dalam tape, kemudian didistribusikan melalui optical disc, misalnya
VCD dan DVD. Salah satu alat yang dapat digunakan untuk menghasilkan video digital
adalah camcorder, yang digunakan untuk merekam gambar-gambar video dan audio,
sehingga sebuah camcorder akan terdiri dari camera dan recorder.

Sebuah video terdiri dari beberapa element yang dapat diuraikan sebagai berikut:

1. Frame Rate

Ketika serangkaian gambar mati yang bersambung dimainkan dengan cepat dan
dilihat oleh mata manusia, maka gambar-gambar tersebut akan terlihat seperti
sebuah pergerakan yang halus. Jumlah gambar yang terlihat setiap detik disebut
dengan frame rate. Diperlukan frame rate minimal sebesar 10 fps (frame per
second) untuk menghasilkan pergerakan gambar yang halus. Film-film yang
dilihat di gedung bioskop adalah film yang diproyeksikan dengan frame rate
sebesar 24 fps, sedangkan video yang dilihat pada televisi memiliki frame rate
sebesar 30 fps (tepatnya 29.97 fps). Frame rate digunakan sebagai format standar
NTSC, PAL dan SECAM yang berlaku pada negara-negara didunia.

2. Aspect Ratio

Pixel aspect ratio menjelaskan tentang ratio atau perbandingan antara lebar
dengan tinggi dari sebuah Pixel dalam sebuah gambar. Frame aspect ratio
menggambarkan perbandingan lebar dengan tinggi pada dimensi frame dari
sebuah gambar. Sebagai contoh, D1 NTSC memiliki pixel aspect ratio 0.9 (0.9
lebar dari 1 unit tinggi) dan memiliki pula pixel aspect ratio 4:3 (4 unit lebar dari
3 unit tinggi). Beberapa format video menggunakan frame aspect ratio yang sama
tetapi memakai pixel aspect ratio yang berbeda. Sebagai contoh, beberapa format
NTSC digital menghasilkan sebuah 4:3 frame aspect ratio dengan square pixel
(1.0 pixel aspect ratio) dan dengan resolusi 640 x 480. sedangkan D1 NTSC
menghasilkan frame aspect ratio yang sama yaitu 4:3 tetapi menggunakan
rectangular pixel (0.9 pixel aspect ratio) dengan resolusi 720 x 486. Pixel yang
dihasilkan oleh format D1 akan selalu bersifat rectangular atau bidang persegi,
akan berorientasi vertikal dalam format NTSC dan akan berorientasi horisontal
dalam format PAL. Jika menampilkan rectangular pixel dalam sebuah monitor
square pixel tanpa alterasi maka gambar yang bergerak akan berubah bentuk atau
mengalami distorsi. Contohnya lingkaran akan berubah menjadi oval. Tetapi
bagaimanapun juga apabila ditampilkan pada monitor broadcast, gambar gerak
akan ditampilkan secara benar.

3. Resolusi Spasial dan Frame Size

Lebar dan tinggi frame video disebut dengan frame size, yang menggunakan
satuan piksel, misalnya video dengan ukuran frame 640×480 piksel. Dalam dunia
video digital, frame size disebut juga dengan resolusi. Semakin tinggi resolusi
gambar maka semakin besar pula informasi yang dimuat, berarti akan semakin
besar pula kebutuhan memory untuk membaca informasi tersebut. Misalnya untuk
format PAL D1/DV berukuran 720×576 piksel, format NTSC DV 720×480 piksel
dan format PAL VCD/VHS (MPEG-1) berukuran 352×288 piksel sedangkan
format NTSC VCD berukuran 320×240 piksel.

4. Level Bit

Dalam dunia komputer, satuan bit merupakan unit terkecil dalam penyimpanan
informasi. Level bit atau Bit depth menyatakan jumlah atau banyaknya bit yang
disimpan untuk mendeskripsikan warna suatu piksel. Sebuah gambar yang
memiliki 8 bit per piksel dapat menampilkan 256 warna, sedangkan gambar
dengan 24 bit dapat menampilkan warna sebanyak 16 juta warna. Komputer (PC)
menggunakan 24 bit RGB sedang sinyal video menggunakan standar 16 bit YUV
sehingga memiliki jangkauan warna yang terbatas. Untuk itu perlu berhati-hati
apabila membuat video untuk ditayangkan di TV, karena tampilan warna di layar
monitor PC berbeda dengan tampilan di layar TV. Penentuan bit depth ini
tergantung pada sudut pemisah antara gambar yang diterima oleh kedua mata.
Sebagai contoh, pada layar datar, persepsi kedalaman suatu benda berdasarkan
subyek benda yang tampak.

5. Laju Bit

Laju bit disebut juga dengan nama laju data. Laju bit menentukan jumlah data
yang ditampilkan saat video dimainkan. Laju data ini dinyatakan dalam satuan
bps (bit per second). Laju data berkaitan erat dengan pemakaian dan pemilihan
codec (metode kompresi video). Beberapa codec menghendaki laju data tertentu,
misalnya MPEG-2 yang digunakan dalam format DVD dapat menggunakan laju
bit maksimum 9800 kbps atau 9,8 Mbps, sedangkan format VCD hanya mampu
menggunakan laju bit 1,15 Mbps.

Sama halnya dengan file suara dan gambar, teknik kompresi dari video
menghasilkan banyak format file video bermunculan. Berikut adalah formati file video
yang lazim digunakan:

ASF (Advanced System Format)

1. Dibuat oleh Microsoft sebagai standar audio/video streaming format


2. Bagian dari Windows Media framework

3. Format ini tidak menspesifikasikan bagaimana video atau audio harus di encode,
tetapi sebagai gantinya menspesifikasikan struktur video/audio stream. Berarti
ASF dapat diencode dengan codec apapun.

4. Dapat memainkan audio/video dari streaming media server, HTTP server,


maupun lokal.

5. Beberapa contoh format ASF lain adalah WMA dan WMV dari Microsoft.

6. Dapat berisi metadata seperti layaknya ID3 pada MP3

7. ASF memiliki MIME “type application/vnd.ms-asf” atau “video/x-ms-asf”.

8. Software : Windows Media Player

MOV (Quick Time)

1. Dibuat oleh Apple

2. Bersifat lintas platform.

3. Banyak digunakan untuk transmisi data di Internet.

4. Software: QuickTime

5. Memiliki beberapa track yang terdiri dari auido, video, images, dan text sehingga
masing-masing track dapat terdiri dari file-file yang terpisah.

MPEG (Motion Picture Expert Group)

1. Merupakan file terkompresi lossy.

2. MPEG-1 untuk format VCD dengan audio berformat MP3.

3. MPEG-1 terdiri dari beberapa bagian:

Synchronization and multiplexing of video and audio.

Compression codec for non-interlaced video signals.

Compression codec for perceptual coding of audio signals.

MP1 or MPEG-1 Part 3 Layer 1 (MPEG-1 Audio Layer 1)


MP2 or MPEG-1 Part 3 Layer 2 (MPEG-1 Audio Layer 2)

MP3 or MPEG-1 Part 3 Layer 3 (MPEG-1 Audio Layer 3)

Procedures for testing conformance.

Reference software

4. MPEG-1 beresoluasi 352×240.

5. MPEG-1 hanya mensupport progressive scan video.

6. MPEG-2 digunakan untuk broadcast, siaran untuk direct-satelit dan cable tv.

7. MPEG-2 support interlaced format.

8. MPEG-2 digunakan dalam/pada HDTV dan DVD video disc.

9. MPEG-4 digunakan untuk streaming, CD distribution, videophone dan broadcast


television.

10. MPEG-4 mendukung digital rights management.

DivX

1. Salah satu video codec yang diciptakan oleh DivX Inc.

2. Terkenal dengan ukuran filenya yang kecil karena menggunakan

MPEG4 Part 2 compression.

1. Versi pertamanya yaitu versi 3.11 diberi nama “DivX ;-)”

2. DivX bersifat closed source sedangkan untuk versi open sourcenya adalah XviD
yang mampu berjalan juga di Linux.

Windows Media Video (WMV)

1. Codec milik Microsoft yang berbasis pada MPEG4 part 2

2. Software: Windows Media Player, Mplayer, FFmpeg.

3. WMV merupakan gabungan dari AVI dan WMA yang terkompres, dapat
berekstensi wmv, avi, atau asf.
Secara sederhana, video dapat diilustrasikan sebagai setumpuk gambar dengan ukuran
frame yang sama dimana gambar-gambar tersebut ditampilkan secara berurutan dengan
frekuensi pemunculan tertentu. Sehingga video memiliki tiga dimensi yaitu dua dimensi
spatial (horizontal dan vertikal) dan satu dimensi waktu. Di dalam video sendiri terdapat
dua hal yang dapat dikompresi yaitu frame (still image). Terdapat dua hal penting yang
dapat dimanfaatkan untuk melakukan kompresi video yaitu redundancy spatial (warna
dalam still image) dan redundancy temporal (perubahan antar frame). Penghilangan
redundancy spatial (spatial / intraframe compression) dilakukan dengan mengambil
keuntungan dari fakta bahwa mata manusia tidak terlalu dapat membedakan warna
dibandingkan dengan brightness, sehingga image dalam video bisa dikompresi (teknik ini
sama dengan teknik kompresi lossy color reduction pada image). Penghilangan
redundancy temporal (temporal / interframe compression) dilakukan dengan
mengirimkan dan mengenkode frame yang berubah saja sedangkan data yang sama masih
disimpan.

Standar Pengkodean H.264/AVC

H.264 (MPEG-4 Part 10) atau lebih dikenal dengan Advance Video Coding (AVC)
merupakan sebuah codec video digital yang memiliki keunggulan dalam rasio kompresi
(tingkat kompresi yang tinggi) dengan memanfaatkan metoda blok transformasi adaptif
yang efektif. H.264 dikembangkan oleh ITU-T Video Coding Expert Group (VCEG)
bersama-sama dengan ISO/IEC Moving Picture Expert Group (MPEG) yang dinamakan
Joint Video Team (JVC) pada tahun 2003. Tujuan pengembangan H.264/AVC adalah
untuk membuat suatu standar video digital yang dapat menghasilkan kualitas video yang
baik pada bitrate yang lebih kecil dibandingkan dengan standar video digital sebelumnya
(MPEG-2, H.263, maupun MPEG-4 Part 2) tanpa harus melakukan perubahan yang
kompleks dan dapat diimplementasikan dengan biaya yang murah. Tujuan lain dari
pengembangan H.264 adalah dapat digunakan dalam berbagai macam aplikasi seperti
video broadcast, DVB strorage, RTP/IP packet networks, dan ITU-T
multimedia telephony systems. Standar pengkodean H.264/AVC disusun atas dua
lapis konsep (gambar 2.3) yaitu video coding layer (VCL), yang bertujuan untuk
efisiensi konten video, dan network abstraction layer (NAL), yang memformat keluaran
video dari VCL dan memberi informasi header dengan tepat untuk diteruskan ke
transport layer atau media penyimpanan. Pictures). Picture (frame) yang merupakan
bagian dari GOP adalah primary coding unit dari video sequence. Merepresentasikan
nilai luminance (Y) dan 2 chrominance (Cb dan Cr). Dalam pengkodean H.264/AVC
menggunakan format 4:2:0, yaitu komponen chrominance memiliki porsi setengah dari
komponen luminance. Sedangkan macroblock dikenal sebagai basic coding unit pada
algoritma MPEG.16x16 pixel segment dalam sebuah frame. Macroblock mencakup
area segi empat dengan ukuran 16x16 pixel untuk komponen luminance(Y) dan
8x8 pixel setiap 2 komponen chrominance (Cb dan Cr). Block adalah coding unit
terkecil pada algoritma MPEG. 8x8 pixel atau 4x4 pixel dapat berupa salah satu
dari luminance(Y), red chrominance(Cr),atau blue chrominance(Cb). Sejumlah
makroblok, disebut sebagai slice, diproses untuk dikodekan. Slice dibedakan
menjadi lima tipe I-,P-,B-,SI-dan SP-slice. Urutannya dari kiri-kanan, atas bawah.

Penting untuk error handling. Bila terjadi error maka di-skip ke slice berikutnya.

H.264/AVC CODEC

Seperti pada standar pengkodean sebelumnya (seperti H.263 dan MPEG-1,2),


H.264/AVC merupakan standar pengkodean yang berbasiskan pada hybrid video
coding. Gambar di bawah ini menunjukkan blok diagram encoder dan decoder
H.264/AVC.
Citra masukan dibagi menjadi makroblok (macroblocks). Setiap makroblok terdiri dari
tiga komponen Y, Cr dan Cb. Komponen Y disebut sebagai luminance yang
merepresentasikan tingkat kecerahan (brightness). Sedangkan Cb dan Cr disebut sebagai
chrominance yang merupakan representasi intensitas warna dari keabuan hingga merah
dan biru. Suatu makroblok terdiri dari satu blok 16x16 piksel komponen luminance dan
dua blok 8x8 piksel komponen chrominance. Sejumlah makroblok, disebut sebagai slice,
diproses untuk dikodekan. Slice dibedakan menjadi lima tipe I-,P-,B-,SI-dan SP-slice.
Pada I-slice, semua makroblok dikodekan dengan mode intra. P-slice, semua makroblok
diprediksikan menggunakan motion compensated prediction dengan satu frame referensi,
untuk B-slice menggunakan dua frame referensi. SI-dan SP-slice merupakan slice khusus
yang tidak ada pada standar pengkodean sebelumnya. SP-slice dikodekan sedemikian
hingga efisien untuk pertukaran antara aliran video yang berbeda. Sedangkan SI-slice
dikodekan untuk perbaikan kesalahan ketika menggunakan intra prediction. Pada proses
decoding H.264/AVC , entropy decoder mendekodekan koefisien kuantisasi dan data
gerakan yang digunakan untuk motion compensated prediction. Seperti pada proses
encoding, sinyal prediksi dihasilkan dari intraframe atau motion compensated prediction,
yang ditambahkan dengan invers koefisien transformasi. Setelah deblocking filter,
makroblok telah selesai didekodekan dan disimpan di memori untuk prediksi berikutnya.
Deblocking filter

Deblocking filter merupakan elemen baru dalam standar kompresi video MPEG.
Dalamvstandar MPEG sebelum MPEG4/H.264 (MPEG1, MPEG2, MPEG4/H.261,
MPEG4/H.263), elemen ini tidak dijumpai. Fungsi utama dari deblocking filter adalah
untuk mengurangi distorsi blocking pada setiap decoded macroblock. Pada encoder,
deblocking filter diaplikasikan setelah inverse transform dan sebelum proses rekonstruksi
dan penyimpanan macroblock untuk prediksi berikutnya. Sementara, pada decoder,
aplikasi deblocking filter dilakukan setelah inverse transform dan sebelum proses
rekonstruksi dan penampilan macroblock Deblocking filter digunakan untuk
memperbaiki kualitas gambar yang pada intinya adalah menghaluskan (mengurangi) efek
blocking yang biasa terjadi pada video digital. Deblocking filter diaplikasikan dalam
setiap 4x4 block maupun 16x16 macroblock sehingga menghasilkan kualitas video yang
lebih baik. Filter ini memiliki dua keuntungan yaitu :

a. Sisi-sisi dari block dan macroblock lebih halus sehingga meningkatkan kualitas dari

gambar yang didecode.

b. Macroblock yang difilter digunakan untuk prediksi motion-compensated dari frame


berikutnya (pada encoder), yang menghasilkan “residu” yang lebih sedikit pada saat
proses prediksi

Profiles and Levels

Profile didefinisikan sebagai suatu set perangkat atau algoritma pengkodean yang
digunakan untuk menghasilkan bitstream yang sesuai, sedangkan level bertujuan untuk
membatasi nilai dari parameter-parameter algoritma yang digunakan. H.264/AVC
mendefinisikan tiga macam profile: baseline profile (untuk video conference dan aplikasi
wireless), main profile (digunakan untuk layanan broadcast) dan extended profile
(digunakan dalam aplikasi streaming).
Setiap level memiliki batas atas nilai dari ukuran gambar (dalam makroblock), rata-rata
waktu proses decode (dalam makroblock perdetik), ukuran multipicture buffer, bitrate
video, dan ukuran buffer video.
H.261 :
CODING UNTUK VIDEO CONFERENCING

 Standar H.261 : video coding/decoding untuk transmisi digital melalui ISDN


dengan rate p x 64 kbit/s (p = 1-30)

 Ditujukan untuk kebutuhan: videophone, videoconferencing dan service audio-


visual lainnya

 Struktur coding seperti codec generic (lihat kuliah lalu)

 interframe DCT-based coding

 Interframe prediction pertama-tama dilakukan dalam domain pixe

 prediction error ditransformasikan ke dalam frekuensi domain

 kuantisasi untuk reduksi bandwidth

 Motion compensation dapat dilaksanakan pada tahap prediksi (optional)

H.261 :
CODING UNTUK VIDEO CONFERENCING

 Teknik dikembangkan supaya codec efisien dan cocok untuk


komunikasi/transmisi

 Rekomendasi menspesifikasikan apa yang diharapkan dari decoder

 tidak memberi informasi bagaimana mendisainnya (informasi lebih

sedikit mengenai decoder

 disain oleh manufacturer  memenuhi syntax bitstream standar

 Reference model adalah software-based codec untuk mempelajari elemen inti


sebagai basis untuk spesifikasi disain hardware yang fleksibel

 Versi terakhir : reference model eight (RM8) sebagai basis H.261 saat ini

STRUKTUR DAN FORMAT VIDEO

 Preprocessor mengkonversikan video CCIR-601 (output kamera) ke format lain

 Parameter coding dari video terkompres di multiplex dan digabung dengan audio,
data dan end-to-end signaling untuk transmisi
 Transmission buffer mengontrol bit rate

 dengan mengubah ukuran step quantiser

 reduksi frame rate

 Dalam CIF dan QCIF , blok DCT digrupkan kedalam macroblock : empat
luminance dan dua blok chrominance Cb dan Cr yang sesuai

 Macroblok digroupkan ke dalam layer  Groups of Blocks (GOB)

 Frame CIF : 12 GOB

 Frame QCIF : 3 GOB

BLOCK, MACROBLOCK & GOB untuk CIF & QCIF

Tujuan membentuk macroblock dan layer:

 Mode coding inter/intra untuk blok luminance dan chrominance pada area yang
sama

 Penggunaan satu motion vector baik untuk blok luminance dan chrominance

 coding yang efisien untuk sejumlah besar blok DCT 8 x 8 yang diharapkan tanpa
coded information dalam interframe coding  code VLC untuk coded block
patern (CBP) dan macroblock addressing

 memungkinkan sinkronisasi dibangun kembali jika bit-bit terkorupsi 


penyisipan start code pada header GOB  error transmisi hanya menyebabkan
degradasi pada sebagian gambar

 untuk membawa informasi tambahan yang sesuai untuk GOB, macroblock atau
layer yang lebih tinggi (format gambar, temporal references, tipe macroblock,
index quantiser, dll)

CODING ELEMENT ENCODER H.261

 COMP Comparator untuk menentukan mode coding inter/intra untuk

sebuah MB

 Th Threshold, untuk memperluas range kuantisasi


 T Transform coding blok 8 x 8 pixels
 T-1 Inverse transform
 Q Quantisastion untuk koefisien DC
 Q-1 Inverse quantisation
 P Picture memory dengan motion compensated
 F Loop filter
 p Flag untuk inter/intra
 t Flag untuk transmitted atau tidak
 q Quantisation index untuk koefisien transform
 qz Quantiser indication
 v Informasi motion vector
 f Switching on/off loop filter

PREDICTION

 Prediction adalah inter-picture (dapat dengan motion compensation  pada


H.261 optional)

 Decoder menerima satu motion vector per macroblock

 Komponen horizontal dan vertikal dari motion vector mempunyai harga integer
tidak melebihi ą 15 pixels/frame

 Motion estimation hanya didasarkan pada pixel-pixel luminance

 vector digunakan untuk motion compensation untuk semua blok (4)

luminance pada macroblock

 Komponen motion vector untuk blok chrominance (2) : setengah

komponen motion vector untuk luminance (integer)

 Untuk transmisi motion vector, perbedaannya dikodekan VLC (1-D)

 perbedaan diantara motion vector yang berurutan dalam satu baris

GOB (untuk macroblock pertama pada GOB, initial vector diset 0)

KEPUTUSAN MC/NO_MC

 Tidak semua macroblock pada sebuah gambar harus motion compensated

 Tergantung seberapa besar motion compensated prediction dapat mereduksi


prediction error
 Jika motion compensated error kecil, tetapi tidak secara signifikan lebih kecil
daripada non-motion compensated error

 pilih non motion compensated

(overhead MC tidak dapat

menjustifikasi keuntungan

KEPUTUSAN INTER/INTRA

 Scene cuts atau dalam hal „violent motion‟ interframe prediction mungkin tidak
akan lebih kecil daripada intraframe (intraframe dapat dikodekan dengan bit rate
yang lebih kecil)

 Gambar dengan code intraframe mempunyai ketahanan terhadap channel error


yang lebih baik

Kadang-kadang lebih menguntungkan mengkodekan macroblock secara intraframe


daripada interframe, alasan:

FORCED UPDATING

 Intraframe coded MB meningkatkan ketahanan codec H.261 terhadap channel


error

 Dalam kasus keputusan inter/intra macroblock tidak menghasilkan mode intra


yang dipilih  beberapa frame dalam macroblock dipaksa untuk dikodekan
secara intra

 Rekomendasi menspesifikasikan sebuah macroblock harus diupdate paling sedikit


setiap 132 frame

 untuk CIF dengan 396 macroblock perframe: rata-rata 3 MB dari tiap

frame dikodekan intraframe (memberikan pengaruh yang sangat

besar pada kualitas gambar)

TIPE-TIPE MACROBLOCK

Pada H.261 ada delapan tipe macroblock berbeda:

 Inter coded : interframe coded macroblock tanpa motion vector atau dengan
motion vector 0
 MC coded : motion compensated MB, dimana MC-error cukup signifikan dan
perlu dikodekan DCT

 MC not coded : motion compensated error MB, dimana motion compensated error
tidak signifikan  tidak perlu DCT coded

 Intra : intraframe coded macroblock

 Not-coded : jika semua enam blok pada suatu macroblock, tanpa motion
compensation mempunyai energi yang tidak signifikan, maka tidak dikodekan 
MB seperti ini disebut “Skipped”, “Not-coded” atau “Fixed” (Fixed MB tidak
ditransmisikan dan pada decoder di-copy dari frame sebelumnya)

TIPE-TIPE MACROBLOCK

Karena ukuran step kuantisasi ditentukan pada awal setiap GOB atau baris dari GOB

 ukuran step kuantisasi harus ditransmisikan ke penerima

 MB pertama harus diidentifikasi :

tipe macroblock baru:

- Inter coded + Q

- MC coded + Q

- Intra + Q

DECISION TREE UNTUK TIPE MACROBLOCK

ADDRESSING MACROBLOCK

 Jika semua komponen terkuantisasi suatu blok dari enam blok pada sebuah MB
nol, blok tersebut dideklarasikan sebagai not coded

 Jika semua enam blok not coded MB  dideklarasikan not coded MB atau
Skipped

else

 MB dideklarasikan coded C dikodekan VLC:


- Codeword pendek : inter code MB

- Codeword panjang : intra+Q

 MB mempunyai enam blok (4 luminnace dan 2 chrominace)

 ada 26 = 64 kombinasi berbeda blok coded/non-coded

 Kecuali semua enam blok nol (fixed MB) tidak dikodekan, 63 lainnya
diidentifikasi dalam 63 pola berbeda

 coded block pattern (CBP)

ADDRESSING MACROBLOCK

 Coded Block Pattern (CBP) : indikasi coded/non-coded blok pada macroblock

 Dengan urutan pengkodean Y0, Y1, Y2, Y3, Cb dan Cr informasi pola blok atau
pattern number didefiniskan:

Pattern_number = 32Y0 + 16Y1 + 8Y2 + 4Y3 + 2Cb + Cr

dimana : coded block dialokasikan “1”

non-coded block dialokasikan “0”

 Jika MB intracoded (atau intra+Q) informasi pola tidak ditransmisikan (pada intra
frame coded MB, semua block mempunyai energi yang signifikan  tentu coded)

CONTOH CODED BLOCK PATTERN

Contoh pola bit untuk mengindikasikan blok-blok coded/not-coded pada sebuah MB


(hitam coded, putih not coded)

RELATIVE ADDRESSING DARI CODED MB

 Setelah tipe macroblock diidentifikasi dan dikodekan VLC, posisinya dalam GOB
harus ditentukan

 Overhead informasi untuk addressing posisi coded MB akan minimum jika


merupakan address relatif satu terhadap lainnya
 Address relatif direpresentasikan dengan runlength, yang merupakan jumlah fixed
MB sebelum Coded MB berikutnya

 Relatif address selanjutnya dikodekan VLC

KUANTISASI DAN CODING

 Setiap blok dari enam blok MB yang dipilih di-transform kodekan dengan 2D-
DCT

 Koefisien DCT dari tiap blok kemudian dikuantisasi dan dikodekan

 Dua tipe quantiser:

- Tanpa dead zone  untuk koefisien DC dari intra-MB (standar H.261

menggunakan ukuran step fixed 8)

- Dengan dead zone  koefisien AC dan koefisien DC dari interframe

coded (MC atau NO-MC)

 Threshold, th mungkin ditambahkan pada quantiser scale  dead zone ditambah


 koefisien nol lebih banyak untuk kompresi yang efisien

 Informasi threshold dikirim ke penerima

 Ratio antara koefisien terkuantisasi terhadap ukuran step kuantisasi (index) yang
dikodekan

KUANTISASI DAN CODING

Quantiser uniform dengan threshold

VARIABLE LENGTH CODING DUA-DIMENSI

 Untuk transmisi index kuantisasi  urutan zigzag digunakan yang meningkatkan


efisiensi „penangkapan‟ komponen tidak nol

 2D-VLC diadopsi, dilaksanakan dalam dua tahap

 tahap 1: event dibangkitkan untuk tiap non-zero index (event = kombinasi


index magnitude dan jumlah nol (run) sebelum index)

ZIGZAG SCANNING DAN PEMBANGKITAN RUN-INDEX

contoh coder mempunyai step quantiser q = 16 dengan level threshold = q

VARIABLE LENGTH CODING DUA-DIMENSI

 Pada 2D-VLC karena range index : -127 s/d +127 dan range run: 0 s/d 63

 ada 2 x 128 x 64 = 16384 kemungkinan event

 Disain Huffman code untuk sejumlah besar simbol ini tidak praktis (suatu
codeword dapat mempunyai panjang samapi 200 bit!)

 Gunakan modifikasi Huffman code  semua simbol dengan probabilitas kecil


digrupkan bersama dan diidentifikasi dengan simbol ESCAPE

 Simbol ESCAPE mempunyai probabilitas = jumlah semua simbol yang


merepresentasikannya

 Event-event yang paling sering muncul dan simbol ESCAPE dikodekan VLC
(Huffman code) seperti biasa

 Event dengan probabilitas rendah diidentifikasi dengan fixed length run dan index
yang „ditambahkan‟ pada code ESCAPE

VARIABLE LENGTH CODING DUA-DIMENSI

 Kode EOB juga satu simbol yang dikodekan VLC (2 bit)

 Pada H.261: ESCAPE = 6 bit (“000001”)

 event yang jarang dengan 6 bit run (0-63) dan 8 bit index

(-127 - +127) memerlukan 20 bit

 DC./Intra index dikuantisasi secara linier dengan ukuran step 8 dan tanpa dead
zone

 hasilnya dikodekan dengan resolusi 8 bit


 Gambar di bawah memperlihatkan tabel 2D-VLC untuk harga index positif
diturunkan dari statistik coding deretan test image “Claire”

Contoh: RUN & INDEX FREQ dan HASIL TABEL 2D-VLC

LOOP FILTER

 Pada bit rate rendah  ukuran step kuantisasi besar  banyak koefisien DCT nol
 gambar rekonstruksi tampak blocky

 Jika posisi area blocky berubah dari satu frame ke frame lainnya  tampak
seperti noise frekuensi tinggi  mosquito noise

 Distorsi ini dapat dikurangi dengan loop filter (low pass filter)

 Loop filter diintrodusir setelah motion compensator untuk meningkatkan prediksi

 Loop filter mengakibatkan blurring effect  hanya diaktifkan untuk blok dengan
motion

 Loop filter hanya didefinisikan pada H.261 (tidak ada video codec lain yang
menggunakannya) dan diaktifkan untuk semua 6 blok DCT dari sebuah
macroblock

 Filtering diaplikasikan untuk rate coding < 6 x 64 kbit/s (386 kbit/s) dan di-switch
of untuk rate > 386 kbit/s

RATE CONTROL

 Bit rate hasil algortima coding DCT-based berfluktuasi bergantung pada natur
video (kecepatan gerak objek, ukuran, texture, dll)

 Tujuan dari rate controller adalah untuk mendapatkan bit rate konstan untuk
transmisi melalui jaringan circuit switched

 Buffer transmisi biasanya diperlukan untuk smoothing fluktuasi bit rate

 Metoda umum untuk kontrol bit rate adalah dengan memonitor pendudukan
buffer dan merubah step kuantisasi sesuai dengan kepenuhan buffer
 Step kuantisasi dikalkulasi sebagai fungsi linier dari isi buffer :

p  p x 64 kbit/s

H.264 (MPEG 4)

H.264 (MPEG-4 Part 10) atau lebih dikenal dengan Advance Video Coding (AVC)
merupakan sebuah codec video digital yang memiliki keunggulan dalam rasio kompresi
(tingkat kompresi yang tinggi) dengan memanfaatkan metoda blok transformasi adaptif yang
efektif. H.264 dikembangkan oleh ITU-T Video Coding Expert Group (VCEG) bersama-
sama dengan ISO/IEC Moving Picture Expert Group (MPEG) yang dinamakan Joint Video
Team (JVC). Tujuan pengembangan H.264/AVC adalah untuk membuat suatu standar video
digital yang dapat menghasilkan kualitas video yang baik pada bitrate yang lebih kecil
dibandingkan dengan standar video digital sebelumnya (MPEG-2, H.263, maupun MPEG-4
Part 2) tanpa harus melakukan perubahan yang kompleks dan dapat diimplementasikan
dengan biaya yang murah. Tujuan lain dari pengembangan H.264 adalah dapat digunakan
dalam berbagai macam aplikasi seperti video broadcast, DVB strorage, RTP/IP packet
networks, dan ITU-T multimedia telephony systems.

Struktur video

Serupa dengan MPEG-4 (karena dikembangkan berdasarkan MPEG-4) H.264 memiliki


beberapa bagian yaitu GOP, slice, macroblock dan block. Hanya saja terdapat beberapa
perbedaan yang merupakan penyempurnaan dari MPEG-4 yang salah satunya adalah ukuran
blok yang lebih kecil yaitu 4x4.
Berikut beberapa pengertian dari istilah di atas :

a.Video Sequence, diawali dengan sequence header, berisi satu group gambar atau lebih,
diakhiri dengan kode end-of-sequence

b.GOP (Group of Pictures), sebuah header dan rangkaian satu gambar atau lebih

c.Picture, primary coding unit dari video sequence. Merepresentasikan nilai luminance (Y) n
2 chrominance (Cb dan Cr)

d.Slice, satu atau lebih macroblock. Urutannya dari kiri-kanan, atas-bawah. Penting untuk
error handling. Bila terjadi error maka akan di-skip ke slice berikutnya.

e.Macroblock, basic coding unit pada algoritma MPEG.16x16 pixel segment dalam sebuah
frame. Macroblock terdiri dari 4 luminance, 1 Cr, dan 1 Cb.

f.Block, coding unit terkecil pada algoritma MPEG. 8x8 pixel,dapat berupa salah satu dari
luminance rec chrominance,atau blue chrominance.

Profile dan level

H.264/AVC memiliki tiga profile, yaitu :

1. Baseline profile (untuk video conference dan aplikasi wireless)

a. Hanya mendukung I-picture dan P-picture (tidak mendukung Bpicture)

b. Mendukung in-loop deblocking filter


c. ¼ sample motion-compensation

d. Mendukung ukuran block sampai dengan 4x4

e. Mendukung adaptive frame/field

f. CAVLC (VLC-based entropy coding)

2. Main profile (digunakan untuk layanan broadcast)

a. Mendukung semua fitur baseline-profile kecuali penambahan fitur error resilience

b. Mendukung B- picture

c. CABAC (context-adaptive binary arithmetic coding)

d. Mendukung interlaced picture

e. Menggunakan MB-level pada saat pergantian frame/field

f. Prediksi P-picture dan B-picture secara adaptive

3 Extended Profile (digunakan dalam aplikasi streaming)

a. Mendukung semua fitur baseline-profile

b. Mendukung B-picture

c. Mendukung error resilience

d. Mendukung pergantian frame/field dengan SP/SI

Setiap level memiliki batas atas nilai dari ukuran gambar (dalam macroblock), rata-rata
waktu proses decode (dalam macroblock perdetik), ukuran multipicture buffer, bitrate video
dan ukuran buffer video.

Kompresi intraframe

Memanfaatkan redudansi spasial yang terdapat dalam suatu frame. Ada beberapa metode
kompresi intraframe yaitu:

a) Sub Sampling

Hal ini merupakan dasar dari kebanyakan kompresi images/video, metode ini mengupayakan
untuk mengurangi jumlah bit untuk merepresentasikan suatu image. Subsampling dapat
dilakukan dengan dua cara. Pertama, dengan mengambil piksel-piksel pada baris dan kolom
ganjil saja. Kedua, dengan mengambil rata-rata dari sekolompok piksel dan menggunakan
nilai tersebut sebagai ganti kelompok piksel. Cara ini lebih kompleks, tetapi menghasilkan
kualitas yang lebih baik.

b) Pengurangan Kedalaman Bit

Metode ini dilakukan dengan mengurangi jumlah bit yang digunakan untuk
merepresentasikan suatu piksel misalnya dari 16 bit/piksel diturunkan menjadi 8 bit/piksel.
Dengan konsekuensi akan menurunkan kualitas video dibandingkan video sebelumnya.

c) Transform Coding

Metode yang lain digunakan dalam kompresi intraframe adalah mentransformasikan data
dari domain ruang ke dalam domain frekuensi. Cara ini menghasilkan data yang lebih mudah
diproses untuk kompresi lebih lanjut.Transformasi yang popular digunakan misalnya:
Discrete cosine transform (DCT ) dan Wavelet. Proses transformasi dan kuantisasi yang
bersifat lossy, serta pengkodean yang bersifat lossless. Disini digunakan Discrete Cosinus
Trasnform (DCT). Kemudian dilanjutkan dengan kuantisasi yang mana digunakan untuk
memotong hasil transformasi. Proses selanjutnya dalam pengkodean dengan menggunakan
run legth encoding (RLE) dan variabel length coding (VLC).

Prinsip dasarnya yaitu untuk melakukan proses transformasi dari domain ruang ke domain
frekuensi. Dengan menggunakan transformasi ini maka data vital akan terkumpul pada
frekuensi DC. Dengan adanya transformasi ini sangatlah menguntungkan untuk kompresi
data, karena pada domain frekuensi inilah diperoleh sifat-sifat yang mendukung serangkaian
proses selanjutnya. Masukan proses DCT berupa matriks data dua dimensi N x N. Persamaan
blok matrik berukuran N x N adalah :

Dan pada proses dekomposisi untuk mentransformasikan kembali data dari domain frekuensi
ke domain ruang menggunakan Inverse Discrite Cosine Trasnsform (IDCT).
d) Kuantisasi

Prinsip dasar dari kuantisasi yaitu bertujuan untuk mengurangi jumlah bit yang diperlukan
untuk menyimpan suatu nilai dengan cara membaginya dengan nilai yang ditentukan dalam
matrik kuantisasi. H.264 menggunakan skalar kuantisasi.Ada 52 kuantisasi step standar yang
digunakan di H264 yang ditandai dengan kuantisasi parameter(QP).setiap kuantisasi step
berhubungan dengan kuantisasi parameter (QP).

Proses kuantisasi pada encoding :

a. Input 4x4 blok,misal X

b. Ditranformasikan dengan

c. Proses kuantisasi
Blok alur kuantisasi :

e) RLE

RLE (Run length encoding) adalah proses serangkaian simbol yang berurutan dikodekan
menjadi suatu kode yang yang terdiri dari symbol tersebut dan jumlah perulangannya. Hasil
dari proses transformasi yang dikuantisasi cenderung nol untuk frekuensi tinggi. Untuk
melakukan RLE secara efektif, keluaran proses kuantisasi tadi dibaca secara linier dari
frekuensi rendah sampai tinggi. Cara yang digunakan adalah cara zig-zag dimulai dari
koefisien DC (0.0) kemudian koefisien DC (0.1) dan seterusnya.

f) Entropy coding

Proses mengkodekan tiap piksel tertentu yang mempunyai panjang yang berbeda. Teknik
algoritmik yang digunakan berbeda antara proses pengkodean satu dengan yang lainya.
H.264 menggunakan CABAC (Context-based Adaptive Binary Arithmetic Coding) atau
CAVLC (Context Based Adaptive Variable Length Coding).
f.1. CABAC

Context-based Adaptive Binary Aritmethic Coding (CABAC) adalah suatu bentuk coding
yang merupakan pengembangan dari aritmethic coding. CABAC terdiri atas 3 bagian coding
yaitu binarization, context modeling, binary aritmethic.blok diagram CABAC sebagai
berikut:

f.1.1. Binarization

pengurangan alphabet dilakukan oleh binarization untuk tiap non binary element
menghasilkan suatu intemediate unik codeword biner untuk unsur sintaksis yang ditentukan
yang disebut bin string.

f.2.2. Context modeling

Context modeling digunakan untuk membersihkan interface antara modeling dan model.
Setiap distribusi model akan diberi symbol yang kemudian didalam langkah coding
selanjutnya, memandu coding engine to generate suatu urutan bit sebagai code pada symbol
menurut distribusi model.

f.2.3. Binary Arimethic Coding

Binary aritmethic coding adalah berdasarkan pada prinsip pengulangan interval [lower,
upper) yang melibatkan operasi perkalian dasar dan juga berdasar pada arithmethic
coding.dengan aturan:

Lower` = lower+width*low/maxfreq

Width` = width*symb_width/maxfreq

Upper` = lower` + width`

= lower + width * (low + symb_width)/maxfreq

= lower + width * up/maxfre


dengan :

width = upper – lower (interval lama)

width`= upper` - lower` (interval baru)

symb_width = up – low (model frequency)

Kompresi interframe

Kompresi yang mana menggunakan redudansi temporal yang terdapat dalam sekelompok
frame yang diantaranya yaitu :

a) Subsampling

Yaitu dengan cara mengurangi laju frame data video. Pengurangan itu dilakukan dengan
hanya menggunakan frame tertentu saja.

b) Difference coding

Metode ini, frame dibagi menjadi beberapa block yang tidak tumpang tindih. Tiap blok
tersebut dibandingkan dengan block yang bersesuaian pada frame yang sebelumnya. Hanya
block yang mengalami perubahan signifikan saja yang disimpan.

c) Motion Compensation

Metode ini juga mengunakan pembagian block yang sama namun block tersebut
dibandingkan dengan frame yang sebelumnya, hingga ditemukan blok yang paling mirip.
Perbedaaan lokasi antara block tersebut dengan blok yang mirip pada frame yang sebelumnya
disebut vektor gerak (motion vector). Metode ini efektif karena hanya vektor gerak saja yang
disimpan atau ditrasmisikan.
VIDEO STREAMING

Streaming adalah sebuah teknologi untuk memaninkan file video atau audio
secara langsung ataupun dengan pre-recorder dari sebuah mesin server (web server).
Dengan kata lain, file video ataupun audio yang terletak dalam sebuah server dapat secara
langsung dijalankan pada UE sesaat setelah ada permintaan dari user, sehingga proses
running aplikasi yang didownload berupa waktu yang lama dapat dihindari tanpa harus
melakukan proses penyimpanan terlebih dahulu. Saat file video atau audio di stream,
akan berbentuk sebuah buffer di komputer client, dan data video - audio tersebut akan
bulai di download ke dalam buffer yang telah terbentuk pada mesin client. Dalam waktu
sepersekian detik, buffer telah terisi penuh dan secara otomatis file videoaudio dijalankan
oleh sistem. Sistem akan membaca informasi dari buffer dan tetap melakukan proses
download file, sehingga proses streaming tetap berlangsung ke mesin i.

Real Time Encoding dan Pre-encoded (stored) Video atau Audio

Video atau audio dapat diencode untuk keperluan komunikasi secara real time atau dapat
juga di pre-encoded dan disimpan dalam format CD-DVD untuk dijalankan pada saat
dibutuhkan. Salah satu aplikasi yang membutuhkan real time encoding adalah
videophone dan video conferencing. Sedangkan aplikasi yang membutuhkan pre-encoded
antara lain DVD, VCD, yang dikenal dengan penyimpanan secara local atau Video on
Demand (VoD), yang penyimpanannya dilakukan secara remote di server yang dikenal
dengan video streaming.

Transfer Video via File Download dan Transfer Video via Streaming

Sebuah file video yang akan ditampilkan di user dapat menggunakan dua metode transfer
file. Pertama, dengan mendownload file video tersebut dan yang kedua dengan
melakukan proses streaming. Kedua metode ini memiliki keunggulan dan kekurangannya
masing-masing. Sebuah file video yang diambil dari server dengan cara download tidak
dapaat ditampilkan dalam sebuah file video tersebut selesai tersalin ke buffer. Metode ini
memerlukan media penyimpanan yang cukup besar dan waktu yang diperlukan untuk
proses download cukup lama karena file video biasanya berukuran besar. Metode kedua
yang dapat digunakan adalah proses streaming. Metode ini berusaha untuk mengatasi
masalah yang terdapat dalam metode download. Ide dasar dari video streaming ini adalah
membagi paket video menjadi beberapa bagian, mentransmisikan paket data tersebut,
kemudian penerima (receiver) dapat mendecode dan memainkan potongan paket video
tersebut tanpa harus menunggu keseluruhan file selesai terkirim ke mesin penerima.

You might also like