You are on page 1of 16

Nama : Aditya Bonavasius P.

NIM : 21070111130061 ASCII The American Standard Code for Information Interchange (ASCII) adalah skema pengkodean karakter yang berdasarkan abjad Inggris. Kode ASCII mewakili teks dalam komputer, peralatan komunikasi, dan perangkat lain yang menggunakan teks. Skema pengkodean karakter yang paling modern didasarkan pada ASCII, meskipun skema pengkodean lainnya mendukung karakter lebih banyak daripada ASCII.

ASCII dikembangkan dari kode telegraf. Penggunaan komersial pertama adalah sebagai kode teleprinter tujuh-bit yang dipromosikan oleh layanan data Bell. Bekerja pada standar ASCII mulai pada tanggal 6 Oktober 1960, dengan pertemuan pertama (ASA) subkomite American Standar Association X3.2. Edisi pertama dari standar tersebut diterbitkan selama tahun 1963, revisi besar selama tahun 1967, dan pembaharuan terbaru selama tahun 1986. Jika dibandingkan dengan kode telegraf sebelumnya, kode Bell dan ASCII yang diajukan berguna untuk penyusunan yang lebih nyaman, yaitu pengejaan dari daftar dan menambah fitur untuk perangkat selain teleprinter. ASCII mencakup definisi untuk 128 karakter: 33 non-cetak karakter kontrol (kebanyakan sekarang tidak digunakan lagi) yang akan mempengaruhi bagaimana teks dan ruang diproses dan 95 karakter yang dapat dicetak, termasuk ruang yang dianggap sebagai grafis tak terlihat. ASCII adalah pengkodean karakter yang paling umum digunakan di World Wide Web(WWW) sampai Desember 2007, ketika dilampaui oleh UTF-8. Sejarah ASCII

Bagan kode AS ASCII 1968 terstruktur dengan dua kolom karakter kontrol, kolom dengan karakter khusus, kolom dengan angka, dan empat kolom surat. The American Standard Code for Information Interchange (ASCII) dikembangkan di bawah naungan sebuah komite dari American Standards Association, yang disebut komite X3, oleh subkomite yang X3.2 (kemudian X3L2), dan kemudian oleh kelompok subkomite kerja X3.2.4. ASA menjadi the United States of America Standards Institute atau USASI dan akhirnya American National Standards Institute.

Subkomite X3.2 dirancang ASCII berdasarkan sistem pengkodean teleprinter sebelumnya. Seperti pengkodean karakter lainnya, ASCII menetapkan korespondensi antara pola bit digital dan simbol karakter (yaitu grafem dan karakter kontrol). Hal ini memungkinkan perangkat digital untuk berkomunikasi satu sama lain dan untuk memproses, menyimpan, dan mengkomunikasikan karakter berorientasi informasi seperti bahasa tulisan. Sebelum ASCII dikembangkan, pengkodean yang digunakan termasuk 26 karakter alfabet, 10 digit angka, dan 11-25 simbol grafis khusus. Untuk menyertakan semua ini, dan karakter kontrol kompatibel dengan Comit Consultatif International Tlphonique et Tlgraphique standar, Fieldata, dan EBCDIC awal, lebih dari 64 kode yang diperlukan untuk ASCII. Komite ini diperdebatkan karena kemungkinan fungsi tombol shift (seperti kode Baudot), yang akan memungkinkan lebih dari 64 kode untuk diwakili oleh enam bit. Dalam kode yang bergeser, beberapa kode karakter menentukan pilihan antara pilihan untuk kode karakter berikut. Hal ini memungkinkan pengkodean yang bersamaan, namun kurang dapat dipercaya untuk transmisi data, kesalahan dalam transmisi kode pergeseran biasanya membuat bagian panjang transmisi terbaca. Komite standar memutuskan untuk membuat kode tidak bergeser, dan ASCII memerlukan setidaknya kode tujuh bit. Komite ini dianggap sebagai kode delapan-bit, karena delapan bit (oktet) akan memungkinkan pola dua empat-bit secara efisien mengkodekan dua digit dengan desimal berkode biner. Namun, akan mengharuskan semua transmisi data untuk mengirim delapan bit ketika tujuh cukup bisa. Komite memilih untuk menggunakan kode tujuh bit untuk meminimalkan biaya yang berkaitan dengan transmisi data. Sejak pita berlubang pada saat itu bisa merekam delapan bit dalam satu posisi, juga memungkinkan untuk sedikit paritas untuk pengecekan error jika diinginkan. Delapanbit mesin (dengan oktet dengan tipe data asli) yang tidak menggunakan paritas pengecekan biasanya mengatur bit kedelapan menuju 0. Kode itu sendiri berpola sehingga kode kontrol sebagian besar sama, dan semua kode grafis bersama-sama, untuk memudahan identifikasi. Dua kolom pertama (32 posisi) yang disediakan untuk karakter kontrol "ruang" karakter harus ada sebelum grafis untuk dibuat untuk menyortir lebih mudah, sehingga menjadi posisi 20hex, karena alasan yang sama, tanda-tanda khusus yang biasanya digunakan sebagai pemisah ditempatkan sebelum angka. Komite memutuskan bahwa penting untuk mendukung kasus 64karakter alfabet, dan memilih untuk pola ASCII sehingga dapat dikurangi dengan mudah untuk satu set 64-karakter yang dapat digunakan kode grafis huruf bawah. Karena itu tidak disisipkan dengan huruf besar . Untuk menjaga pilihan yang tersedia

untuk huruf kecil dan grafis lain, kode-kode khusus dan angka diatur sebelum huruf, dan huruf "A" ditempatkan di posisi 41hex agar sesuai dengan rancangan standar Inggris yang sesuai. Angka 0 -9 diatur sehingga sesuai dengan nilai-nilai dalam biner yang diawali dengan 011, membuat konversi dengan kode-biner desimal langsung. Banyak karakter non-alfanumerik diposisikan untuk sesuai dengan posisi mereka bergeser pada mesin ketik. Jadi #, $ dan% ditempatkan untuk sesuai dengan 3, 4 dan 5 pada kolom yang berdekatan. Tanda kurung tidak bisa sesuai dengan 9 dan 0, namun, karena tempat yang sesuai ke 0 diambil oleh karakter spasi. Karena mesin ketik Eropa menempatkan tanda kurung dengan 8 dan 9, posisi-posisi yang sesuai dipilih untuk kurung. Simbol @ tidak digunakan di benua Eropa dan panitia diharapkan akan digantikan oleh beraksen dalam variasi Perancis, jadi @ ditempatkan di posisi sebelah 40hex huruf A. Kode kontrol penting untuk transmisi data adalah awal pesan (SOM), akhir alamat (EOA), akhir pesan (EOM), akhir transmisi (EOT), "siapa kamu?" (WRU), "engkau?" (RU), sebuah kontrol perangkat cadangan (DC0), sinkron idle (SYNC), dan mengakui (ACK). Ini diposisikan untuk memaksimalkan jarak Hamming antara pola bit mereka. Dengan karakter khusus lain dan kode kontrol diisi, ASCII diterbitkan sebagai ASA X3.4-1963, meninggalkan 28 posisi kode tanpa arti yang ditetapkan, disediakan untuk standarisasi masa depan, dan satu unassigned kode kontrol. Ada beberapa perdebatan di waktu apakah harus ada karakter kontrol lebih daripada alfabet huruf kecil. Keraguan tidak berlangsung lama selama Mei 1963, Partai CCITT Bekerja pada Alphabet Telegraph Baru diusulkan untuk menetapkan karakter huruf kecil ke kolom 6 dan 7, dan Organisasi Standardisasi TC 97 SC 2 Internasional terpilih selama bulan Oktober untuk memasukkan perubahan ke dalam rancangan standar tersebut. Kelompok tugas X3.2.4 memilih persetujuan untuk perubahan ke ASCII pada Mei 1963 pertemuannya. Mencari huruf kecil dalam kolom 6 dan 7 menyebabkan karakter berbeda dalam pola bit dari huruf besar oleh satu bit, yang disederhanakan case-insensitive pencocokan karakter dan pembangunan keyboard dan printer. Komite X3 membuat perubahan lainnya, termasuk karakter baru lainnya (brace dan karakter garis vertikal), mengubah nama beberapa karakter kontrol (SOM menjadi awal header (SOH)) dan memindahkan atau menghapus orang lain (RU telah dihapus). ASCII kemudian diperbaharui USASI X3.4-1967, maka USASI X3.4-1968, ANSI X3.4-1977, dan akhirnya ANSI X3.4-1986 (dua yang pertama kadang-kadang retronamed ANSI X3.4-1967 , dan ANSI X3.4-1968). Komite X3 juga dibahas bagaimana ASCII harus dikirim (paling signifikan bit

pertama), dan bagaimana harus direkam pada tape berlubang. Mereka mengusulkan sebuah standar 9-jalur untuk pita magnetik, dan berusaha untuk menangani beberapa bentuk format kartu punched. ASCII itu sendiri pertama kali digunakan secara komersial selama 1963 sebagai kode teleprinter tujuh-bit untuk American Telephone & Telegraph TWX (eXchange teletypewriter) jaringan. TWX awalnya menggunakan kode Baudot sebelumnya limabit, yang juga digunakan oleh sistem Telex teleprinter bersaing. Bob Bemer memperkenalkan fitur seperti urutan escape. Inggris Rekannya Hugh Ross McGregor membantu mempopulerkan karya ini, menurut Bemer, "begitu banyak sehingga kode yang dijadikan ASCII pertama kali disebut Kode Bemer-Ross dalam Eropa "Karena pekerjaan yang luas pada ASCII, Bemer telah dipanggil " bapak ASCII ". Pada tanggal 11 Maret 1968, Presiden AS Lyndon B. Johnson mengamanatkan bahwa semua komputer yang dibeli oleh pemerintah Amerika Serikat ASCII dukungan federal, yang menyatakan: Saya juga menyetujui rekomendasi dari Menteri Perdagangan mengenai standar untuk merekam Standard Kode untuk Informasi Interchange pada pita magnetik dan pita kertas ketika mereka digunakan dalam operasi komputer. Semua komputer dan konfigurasi peralatan terkait dibawa ke dalam persediaan Pemerintah Federal dan setelah tanggal 1 Juli 1969, harus memiliki kemampuan untuk menggunakan Standard Kode untuk Informasi Interchange dan format yang ditentukan oleh pita magnetik dan standar pita kertas ketika media ini digunakan. Badan Internasional lainnya telah meratifikasi pengkodean karakter seperti ISO / IEC 646 yang identik atau hampir identik dengan ASCII, dengan ekstensi untuk karakter luar abjad Inggris dan simbol yang digunakan di luar Amerika Serikat, seperti simbol untuk Poundsterling Inggris itu ( ). Hampir setiap negara membutuhkan versi yang disesuaikan ASCII, karena ASCII cocok kebutuhan hanya Amerika Serikat dan beberapa negara lainnya. Misalnya, Kanada memiliki versi sendiri yang mendukung karakter Perancis. Pengkodean disesuaikan lainnya termasuk ISCII (India), VISCII (Vietnam), dan YUSCII (Yugoslavia). Meskipun pengkodean kadang-kadang disebut sebagai ASCII, ASCII benar didefinisikan secara ketat hanya oleh standar ANSI. ASCII dimasukkan ke dalam karakter Unicode ditetapkan sebagai 128 simbol pertama, sehingga karakter ASCII memiliki kode numerik yang sama di kedua set. Hal ini memungkinkan UTF-8 menjadi kompatibel dengan ASCII, keuntungan yang signifikan.

Karakter Kontrol ASCII ASCII menyimpan 32 kode pertama (nomor 0-31 desimal) untuk karakter kontrol: Kode awalnya ditujukan bukan untuk mewakili informasi yang dapat dicetak, melainkan untuk perangkat kontrol (seperti printer) yang menggunakan ASCII, atau untuk memberikan meta-informasi tentang data stream seperti yang disimpan pada pita magnetik. Sebagai contoh, karakter 10 merupakan "garis pakan" fungsi (yang menyebabkan printer untuk memajukan kertas), dan karakter 8 mewakili "backspace". RFC 2822 mengacu mengontrol karakter yang tidak termasuk carriage return, line feed atau ruang putih sebagai non-spasi karakter kontrol. Kecuali untuk karakter kontrol yang meresepkan dasar garis berorientasi format, ASCII tidak mendefinisikan mekanisme apapun untuk menggambarkan struktur atau tampilan teks dalam dokumen. Lain skema, seperti bahasa markup, halaman alamat dan tata letak dokumen dan format. Standar ASCII asli yang digunakan frasa deskriptif hanya singkat untuk tiap karakter kontrol. Ambiguitas ini disebabkan kadang-kadang disengaja (di mana karakter akan digunakan sedikit berbeda pada link terminal dari pada aliran data) dan kadang-kadang disengaja (seperti apa "hapus" artinya). Mungkin perangkat tunggal paling berpengaruh pada interpretasi dari karakter ini adalah Teletype Model 33 ASR seri, yang merupakan terminal pencetakan dengan pita kertas pilihan yang tersedia pembaca / punch. Pita kertas adalah media yang sangat populer untuk penyimpanan jangka panjang program melalui tahun 1980-an, lebih murah dan dalam beberapa hal kurang rapuh dari pita magnetik. Secara khusus, Model Teletype tugas mesin 33 untuk kode 17 (Control-Q, DC1, juga dikenal sebagai XON), 19 (Control-S, DC3, juga dikenal sebagai XOFF), dan 127 (Hapus) menjadi standar de facto. Karena keytop untuk tombol O juga menunjukkan simbol panah kiri (dari ASCII1963, yang memiliki karakter ini bukan garis bawah), penggunaan patuh kode 15 (Control-O, Shift In) ditafsirkan sebagai "menghapus karakter sebelumnya" juga diadopsi oleh banyak sistem time sharing awal tetapi akhirnya menjadi terabaikan. Penggunaan Control-S (XOFF, singkatan untuk mengirimkan off) sebagai sinyal "handshaking" memperingatkan pengirim untuk menghentikan penularan karena overflow yang akan datang, dan Control-Q (XON, "mengirimkan pada") untuk melanjutkan pengiriman, tetap ada untuk hari ini dalam banyak sistem sebagai teknik kontrol keluaran manual. Pada beberapa sistem Control-S mempertahankan maknanya tetapi Control-Q digantikan oleh kedua Control-S untuk melanjutkan output. Kode 127 secara resmi bernama "hapus" tapi label Teletype adalah "rubout". Karena

standar asli tidak memberikan interpretasi rinci untuk kode kontrol yang paling, interpretasi dari kode ini bervariasi. Arti Teletype asli, dan maksud dari standar adalah untuk membuat karakter diabaikan, sama seperti NUL (semua nol). Ini berguna khusus untuk pita kertas, karena meninju pola bit semua yang di atas tanda yang ada akan melenyapkan itu. Tape dirancang untuk menjadi "diedit tangan" bahkan bisa diproduksi dengan spasi dari NULs tambahan (pita kosong) sehingga blok karakter bisa "digosok keluar" dan kemudian pengganti dimasukkan ke dalam ruang kosong. Sebagai terminal video mulai menggantikan yang dicetak, nilai dari karakter "rubout" hilang. Desember sistem, misalnya, ditafsirkan "Hapus" berarti "menghapus karakter sebelum kursor" dan penafsiran ini juga menjadi umum dalam sistem Unix. Kebanyakan sistem lain yang digunakan "Backspace" untuk makna tersebut dan digunakan "Hapus" berarti "menghapus karakter pada kursor". Itu interpretasi yang terakhir adalah yang paling umum sekarang. Banyak dari kode kontrol telah diberi makna yang cukup berbeda dari yang aslinya. Karakter "melarikan diri" (ESC, kode 27), misalnya, awalnya dimaksudkan untuk memungkinkan pengiriman karakter kontrol lainnya sebagai literal bukan memohon, artinya ini adalah arti yang sama "melarikan diri" yang dihadapi dalam pengkodean URL, string bahasa C, dan sistem lain di mana karakter tertentu memiliki makna disimpan. Seiring waktu makna ini telah dikooptasi dan telah akhirnya telah berubah. Dalam penggunaan modern, ESC dikirim ke terminal biasanya menunjukkan awal dari sebuah urutan perintah, biasanya dalam bentuk "kode melarikan diri ANSI" yang disebut (atau, lebih baik, sebuah "Control Introducer Sequence") dimulai dengan ESC diikuti oleh karakter "[" (kiri braket). Sebuah ESC dikirim dari terminal yang paling sering digunakan sebagai karakter out-of-band digunakan untuk mengakhiri operasi, seperti dalam TECO dan editor teks vi. Dalam antarmuka pengguna grafis (GUI) dan sistem windowing, ESC umumnya menyebabkan aplikasi untuk membatalkan operasi saat ini atau untuk keluar (menghentikan) sama sekali. Ambiguitas yang melekat pada karakter kontrol banyak dikombinasikan dengan penggunaan sejarah mereka, menciptakan masalah ketika mentransfer file "teks biasa" antara sistem. Contoh terbaik dari hal ini adalah masalah newline pada berbagai sistem operasi. Mesin teletype yang diperlukan baris teks diakhiri dengan kedua "Kembali Carriage" dan "feed Line". Yang pertama mengembalikan kereta cetak ke awal baris dan kemajuan kedua ke baris berikutnya tanpa memindahkan gerbong. Namun, membutuhkan dua karakter untuk menandai akhir baris memperkenalkan kompleksitas yang tidak perlu dan pertanyaan tentang bagaimana menafsirkan setiap karakter ketika ditemui saja. Untuk menyederhanakan masalah, file teks biasa on line sistem penggunaan Unix dan Amiga feed sendiri untuk baris yang berbeda. Demikian pula,

sistem Macintosh yang lebih tua, antara lain, gunakan tombol kembali hanya dalam file teks biasa. Berbagai IBM sistem operasi yang digunakan kedua karakter untuk menandai akhir baris untuk kompatibilitas dengan mesin Teletype. Ini standar de facto disalin ke CP / M dan kemudian ke MS-DOS dan akhirnya ke dalam Microsoft Windows. Transmisi teks melalui Internet, untuk protokol sebagai E-mail dan World Wide Web, menggunakan kedua karakter. Beberapa sistem operasi seperti pra-VMS sistem operasi DEC, bersama dengan CP / M, panjang file dilacak hanya dalam satuan blok disk dan digunakan Control-Z (SUB) untuk menandai akhir dari teks yang sebenarnya dalam file. Untuk alasan ini, EOF, atau end-of-file, digunakan bahasa sehari-hari dan konvensional sebagai singkatan tiga huruf (TLA) untuk Control-Z bukan Pengganti. Untuk berbagai alasan, kode akhir-teks, ETX alias Control-C, adalah tidak pantas dan menggunakan Z sebagai kode kontrol untuk mengakhiri sebuah file analog dengan itu mengakhiri alfabet, alat bantu mnemonic sangat nyaman. String ASCII diakhiri dengan karakter null dikenal sebagai ASCIZ, ASCIIZ atau null-dihentikan string.

Binary

Oct Dec Hex Abbr [a] [b]

[c]

Name

000 0000 000 0 000 0001 001 1 000 0010 002 2 000 0011 003 3 000 0100 004 4 000 0101 005 5 000 0110 006 6 000 0111 007 7 000 1000 010 8

00 NUL ^@ \0 Null character 01 SOH ^A 02 STX ^B 03 ETX ^C 04 EOT ^D 05 ENQ ^E 06 ACK ^F 07 BEL ^G \a 08 BS Start of Header Start of Text End of Text End of Transmission Enquiry Acknowledgment Bell

^H \b Backspace

000 1001 011 9

09 HT

^I

\t

Horizontal Tab

000 1010 012 10 0A LF 000 1011 013 11 0B VT 000 1100 014 12 0C FF 000 1101 015 13 0D CR 000 1110 016 14 0E SO 000 1111 017 15 0F SI

^J \n Line feed ^K \v Vertical Tab ^L \f ^M \r ^N ^O Form feed Carriage return[g] Shift Out Shift In Data Link Escape Device Control 1 (oft. XON) Device Control 2 Device Control 3 (oft. XOFF) Device Control 4 Negative Acknowledgement Synchronous idle End of Transmission Block Cancel End of Medium

001 0000 020 16 10 DLE ^P 001 0001 021 17 11 DC1 ^Q 001 0010 022 18 12 DC2 ^R 001 0011 023 19 13 DC3 ^S 001 0100 024 20 14 DC4 ^T 001 0101 025 21 15 NAK ^U 001 0110 026 22 16 SYN ^V 001 0111 027 23 17 ETB ^W 001 1000 030 24 18 CAN ^X 001 1001 031 25 19 EM ^Y

001 1010 032 26 1A SUB ^Z 001 1011 033 27 1B ESC ^[ 001 1100 034 28 1C FS 001 1101 035 29 1D GS 001 1110 036 30 1E RS 001 1111 037 31 1F US ^\ ^] ^^[j] ^_

Substitute \e[h] Escape[i] File Separator Group Separator Record Separator Unit Separator Delete[k][e]

111 1111 177 127 7F DEL ^?

^ Karakter Unicode dari daerah U 2400 ke U 2421 dicadangkan untuk mewakili karakter kontrol jika diperlukan untuk mencetak atau menampilkan karakter Unicode bukan untuk meminta karakter Unicode melakukan fungsi yang ditujukan. Beberapa browser tidak dapat menampilkan ini dengan benar. ^ Caret notasi sering digunakan untuk mewakili karakter kontrol pada terminal. Pada terminal teks yang paling, menekan tombol Ctrl saat mengetik karakter kedua akan mengetik karakter kontrol. Kadang-kadang tombol shift tidak diperlukan, misalnya ^ @ mungkin typable hanya dengan Ctrl dan 2. ^ Kode Luput Karakter dalam bahasa pemrograman C dan bahasa lainnya banyak dipengaruhi olehnya, seperti Java dan Perl (meskipun tidak semua implementasi selalu mendukung semua kode escape). ^ Karakter Backspace juga dapat dimasukkan dengan menekan tombol Backspace pada beberapa sistem. ^ Ab Ambiguitas Backspace adalah karena terminal awal dirancang dengan asumsi penggunaan utama dari keyboard adalah dengan manual memukul pita kertas sementara tidak terhubung ke komputer. Untuk menghapus karakter sebelumnya, orang harus membuat cadangan punch pita kertas, yang untuk alasan mekanik dan kesederhanaan adalah sebuah tombol pada pukulan sendiri dan bukan keyboard, kemudian ketik karakter rubout. Oleh karena itu mereka menempatkan rubout memproduksi kunci di lokasi yang digunakan pada mesin ketik untuk backspace. Ketika sistem yang digunakan terminal ini dan menyediakan pengeditan baris perintah, mereka harus menggunakan "rubout" kode untuk melakukan backspace, dan sering tidak menafsirkan

karakter backspace (mungkin echo "^ H" untuk backspace). Terminal lain tidak dirancang untuk pita kertas yang dibuat kuncinya pada Backspace memproduksi lokasi, dan sistem ini dirancang untuk digunakan bahwa karakter untuk kembali. Karena kode hapus sering menghasilkan efek backspace, ini produsen terminal juga dipaksa untuk membuat sesuatu produk Hapus kunci selain karakter Hapus. ^ Karakter Tab juga dapat dimasukkan dengan menekan tombol Tab pada kebanyakan sistem. Karakter ^ Kembali Carriage juga dapat dimasukkan dengan menekan Enter atau Return kunci pada kebanyakan sistem. ^ Urutan escape '\ e' bukan bagian dari ISO C dan banyak spesifikasi bahasa lainnya. Namun, dapat dipahami dengan compiler beberapa. ^ Karakter Luput juga dapat dimasukkan dengan menekan tombol Esc pada beberapa sistem. ^ ^ ^ Cara Ctrl + ^ (menekan tombol "Ctrl" dan tombol tanda sisipan). ^ Karakter Hapus kadang-kadang dapat dimasukkan dengan menekan tombol Backspace pada beberapa sistem. Karakter ASCII yang Dapat Dicetak Kode 20hex untuk 7Ehex yang dikenal sebagai karakter yang dapat dicetak, mewakili huruf, angka, tanda baca, dan sedikit simbol lain-lain. Ada 95 karakter yang dapat dicetak secara total. Kode 20hex, karakter spasi, menunjukkan ruang antara kata-kata, seperti yang dihasilkan oleh space bar-dari keyboard. Karena karakter spasi dianggap sebagai tak terlihat grafis (bukan karakter kontrol) dan dengan demikian biasanya tidak terlihat, itu diwakili di sini oleh karakter Unicode U 2.420 ""; karakter Unicode U 2.422 " "dan U 2423" "juga tersedia untuk digunakan representasi terlihat dari ruang yang diperlukan. Kode 7Fhex sesuai dengan non-printable karakter "Hapus" (DEL) kontrol dan karena itu dihilangkan dari tabel ini, itu tercakup dalam grafik bagian sebelumnya. Versi sebelumnya dari ASCII digunakan panah-bukan tanda sisipan (5Ehex) dan panah kiri bukan garis bawah (5Fhex).

Binary

Oct Dec Hex Glyph Binary

Oct Dec Hex Glyph Binary

Oct Dec Hex Glyph

010 0000 040 32

20

100 0000 100 64

40

110 0000 140 96

60

010 0001 041 33

21

100 0001 101 65

41

110 0001 141 97

61

010 0010 042 34

22

"

100 0010 102 66

42

110 0010 142 98

62

010 0011 043 35

23

100 0011 103 67

43

110 0011 143 99

63

010 0100 044 36

24

100 0100 104 68

44

110 0100 144 100 64

010 0101 045 37

25

100 0101 105 69

45

110 0101 145 101 65

010 0110 046 38

26

&

100 0110 106 70

46

110 0110 146 102 66

010 0111 047 39

27

'

100 0111 107 71

47

110 0111 147 103 67

010 1000 050 40

28

100 1000 110 72

48

110 1000 150 104 68

010 1001 051 41

29

100 1001 111 73

49

110 1001 151 105 69

010 1010 052 42

2A *

100 1010 112 74

4A J

110 1010 152 106 6A j

010 1011 053 43

2B

100 1011 113 75

4B

110 1011 153 107 6B

010 1100 054 44

2C

100 1100 114 76

4C

110 1100 154 108 6C

010 1101 055 45

2D -

100 1101 115 77

4D M

110 1101 155 109 6D m

010 1110 056 46

2E

100 1110 116 78

4E

110 1110 156 110 6E

010 1111 057 47

2F

100 1111 117 79

4F

110 1111 157 111 6F

011 0000 060 48

30

101 0000 120 80

50

111 0000 160 112 70

011 0001 061 49

31

101 0001 121 81

51

111 0001 161 113 71

011 0010 062 50

32

101 0010 122 82

52

111 0010 162 114 72

011 0011 063 51

33

101 0011 123 83

53

111 0011 163 115 73

011 0100 064 52

34

101 0100 124 84

54

111 0100 164 116 74

011 0101 065 53

35

101 0101 125 85

55

111 0101 165 117 75

011 0110 066 54

36

101 0110 126 86

56

111 0110 166 118 76

011 0111 067 55

37

101 0111 127 87

57

111 0111 167 119 77

011 1000 070 56

38

101 1000 130 88

58

111 1000 170 120 78

011 1001 071 57

39

101 1001 131 89

59

111 1001 171 121 79

011 1010 072 58

3A :

101 1010 132 90

5A Z

111 1010 172 122 7A z

011 1011 073 59

3B

101 1011 133 91

5B

111 1011 173 123 7B

011 1100 074 60

3C

<

101 1100 134 92

5C

111 1100 174 124 7C

011 1101 075 61

3D =

101 1101 135 93

5D ]

111 1101 175 125 7D }

011 1110 076 62

3E

>

101 1110 136 94

5E

111 1110 176 126 7E

011 1111 077 63

3F

101 1111 137 95

5F

Alias Sebuah RFC pada Juni 1992 dan Internet Assigned Numbers Authority mengakui alias case-insensitive berikut untuk ASCII agar sesuai untuk digunakan di Internet: ANSI_X3.4-1968 (nama kanonik) iso-ir-6 ANSI_X3.4-1986 ISO_646.irv: 1991 ASCII (dengan ASCII-7 dan ASCII-8 varian) ISO646-AS US-ASCII (pilihan nama MIME) us IBM367 cp367 csASCII Dari itu semua, IANA mendorong penggunaan nama "US-ASCII" untuk penggunaan internet ASCII. Orang sering menemukan ini pada parameter opsional "charset" di header Content-Type dari beberapa pesan MIME, dalam elemen setara "meta" dari beberapa dokumen HTML, dan di bagian pengkodean deklarasi prolog dari beberapa dokumen XML.

Varian/Jenis Dikarenakan teknologi komputer menyebar ke seluruh dunia, badan standar dan perusahaan yang berbeda mengembangkan banyak variasi ASCII untuk memfasilitasi ekspresi non-Inggris bahasa yang digunakan Romawi berbasis huruf. Satu kelas bisa beberapa variasi sebagai "ekstensi ASCII", meskipun penyalahgunaan beberapa istilah untuk mewakili semua varian, termasuk yang tidak mempertahankan yang ASCII

karakter-peta di kisaran 7-bit. Para PETSCII kode Commodore International digunakan untuk 8-bit sistem mereka mungkin unik di antara pasca-1970 kode pada yang berbasis ASCII-1963, bukan yang lebih umum ASCII-1967, seperti yang ditemukan pada komputer ZX Spectrum. Komputer Atari dan Galaksija juga menggunakan varian ASCII.

Ketidaksesuaian VS Interoperabilitas Dari awal perkembangannya, ASCII ini dimaksudkan untuk menjadi hanya salah satu varian nasional beberapa standar kode karakter internasional, akhirnya diterbitkan sebagai ISO / IEC 646 (1972), yang akan berbagi karakter paling umum tetapi menetapkan lain lokal berguna karakter untuk beberapa poin kode dicadangkan untuk penggunaan "nasional." Namun, empat tahun yang lalu antara publikasi ASCII-1963 dan penerimaan pertama ISO dari rekomendasi internasional selama tahun 1967 menyebabkan pilihan ASCII untuk karakter penggunaan nasional tampaknya menjadi de facto standar untuk dunia, menyebabkan kebingungan dan ketidakcocokan di negaranegara lain pun mulai membuat tugas mereka sendiri untuk titik-titik kode. ISO / IEC 646, seperti ASCII, adalah set karakter 7-bit. Ini tidak membuat kode tambahan yang tersedia, sehingga poin kode yang sama dikodekan karakter yang berbeda di berbagai negara. Kode escape didefinisikan untuk menunjukkan varian nasional diterapkan untuk sepotong teks, tapi mereka jarang digunakan, jadi sering tidak mungkin untuk mengetahui apa varian untuk bekerja dengan dan karena itu karakter yang diwakili kode, dan secara umum teks-pengolahan sistem bisa mengatasi hanya satu varian saja. Karena karakter braket dan bertali dari ASCII ditugaskan untuk "nasional penggunaan" titik kode yang digunakan untuk huruf beraksen dalam varian nasional lainnya dari ISO / IEC 646, sebuah, Jerman, Perancis, atau Swedia dll pemrogram menggunakan varian nasional mereka dari ISO / IEC 646, bukan ASCII, harus menulis, dan dengan demikian membaca, sesuatu seperti ai = 'on'; daripada {A [i] = '\ n';}

Trigraphs C diciptakan untuk memecahkan masalah ini untuk ANSI C, meskipun pengenalan dan implementasi tidak konsisten dalam kompiler terbatas penggunaannya. Akhirnya, sebagai 8 -, 16 -, dan 32-bit komputer mulai menggantikan 18 - dan 36-bit komputer sebagai norma, itu menjadi umum untuk menggunakan 8-bit byte untuk menyimpan setiap karakter dalam memori, memberikan kesempatan bagi diperpanjang , 8-bit, keluarga ASCII, dengan 128 karakter tambahan menyediakan ruang untuk menghindari sebagian besar ambiguitas yang telah diperlukan dalam 7-bit kode. Sebagai contoh, IBM mengembangkan 8-bit kode halaman, seperti halaman, kode 437 yang menggantikan kontrol karakter dengan simbol grafis seperti wajah smiley, dan dipetakan karakter grafis tambahan untuk 128 posisi atas. Sistem operasi seperti DOS didukung ini kode-halaman, dan produsen PC IBM mendukung mereka dalam perangkat keras. Digital Equipment Corporation mengembangkan Character Set Multinasional (DEC-MCS) untuk digunakan di terminal VT220 populer. Delapan-bit standar seperti ISO / IEC 8859 (berasal dari DEC-MCS) dan Mac OS Romawi dikembangkan sebagai ekstensi sebenarnya dari ASCII, meninggalkan karakter-pemetaan utuh asli, tetapi menambahkan definisi karakter tambahan setelah 128 pertama (yaitu, 7 -bit) karakter. Representasi diaktifkan dari karakter yang digunakan dalam lebih luas bahasa. Karena ada beberapa bersaing 8-bit kode standar, mereka terus menderita tidak kompatibel dan keterbatasan. Namun, ISO-8859-1 (Latin 1), varian dengan Windows-1252 (sering disalahartikan sebagai ISO-8859-1), dan ASCII 7-bit asli tetap pengkodean karakter yang paling umum digunakan saat ini.

Unicode Unicode dan ISO / IEC 10646 Universal Character Set (UCS) memiliki karakter array yang jauh lebih luas, dan berbagai bentuk mereka pengkodean telah mulai menggantikan ISO / IEC 8859 dan ASCII pesat di banyak lingkungan. Sementara ASCII terbatas pada 128 karakter, Unicode dan dukungan UCS karakter lebih dengan memisahkan konsep identifikasi unik (menggunakan bilangan asli disebut poin kode) dan pengkodean (untuk 8 -, 16 - atau 32-bit format biner, yang disebut UTF-8 , UTF-16 dan UTF-32). Untuk memungkinkan kompatibilitas ke belakang, 128 ASCII dan 256 ISO-8859-1 (Latin 1) karakter ditugaskan poin kode Unicode / UCS yang sama dengan kode mereka dalam standar sebelumnya. Oleh karena itu, ASCII dapat dianggap sebagai skema pengkodean 7-bit untuk subset sangat kecil dari Unicode / UCS, dan, sebaliknya,

pengkodean UTF-8 adalah bentuk biner yang kompatibel dengan ASCII untuk poin kode di bawah 128, yang berarti ASCII semua UTF berlaku -8. Bentuk pengkodean ASCII lainnya menyerupai dalam cara mereka mewakili 128 karakter pertama dari Unicode, tetapi menggunakan 16 atau 32 bit per karakter, sehingga mereka membutuhkan konversi untuk kompatibilitas. (sama dengan UCS-2 kompatibel dengan UTF-16).

Orde/Urutan Orde/urutan kode ASCII disebut juga orde/urutan ASCIIbetical. Penyatuan data ini kadang dilakukan dalam rangka bukan "standar" urutan abjad (menyusun urutan). Penyimpangan utama dalam rangka ASCII adalah: Semua huruf besar muncul sebelum huruf kecil, misalnya, "Z" sebelum "a" Angka dan tanda baca banyak muncul sebelum huruf, misalnya, "4" adalah sebelum "satu" Perintah menengah yang dapat dengan mudah diimplementasikan mengubah huruf besar menjadi huruf kecil sebelum membandingkan nilai-nilai ASCII.

You might also like