Professional Documents
Culture Documents
NIM : 21070111130061 ASCII The American Standard Code for Information Interchange (ASCII) adalah skema pengkodean karakter yang berdasarkan abjad Inggris. Kode ASCII mewakili teks dalam komputer, peralatan komunikasi, dan perangkat lain yang menggunakan teks. Skema pengkodean karakter yang paling modern didasarkan pada ASCII, meskipun skema pengkodean lainnya mendukung karakter lebih banyak daripada ASCII.
ASCII dikembangkan dari kode telegraf. Penggunaan komersial pertama adalah sebagai kode teleprinter tujuh-bit yang dipromosikan oleh layanan data Bell. Bekerja pada standar ASCII mulai pada tanggal 6 Oktober 1960, dengan pertemuan pertama (ASA) subkomite American Standar Association X3.2. Edisi pertama dari standar tersebut diterbitkan selama tahun 1963, revisi besar selama tahun 1967, dan pembaharuan terbaru selama tahun 1986. Jika dibandingkan dengan kode telegraf sebelumnya, kode Bell dan ASCII yang diajukan berguna untuk penyusunan yang lebih nyaman, yaitu pengejaan dari daftar dan menambah fitur untuk perangkat selain teleprinter. ASCII mencakup definisi untuk 128 karakter: 33 non-cetak karakter kontrol (kebanyakan sekarang tidak digunakan lagi) yang akan mempengaruhi bagaimana teks dan ruang diproses dan 95 karakter yang dapat dicetak, termasuk ruang yang dianggap sebagai grafis tak terlihat. ASCII adalah pengkodean karakter yang paling umum digunakan di World Wide Web(WWW) sampai Desember 2007, ketika dilampaui oleh UTF-8. Sejarah ASCII
Bagan kode AS ASCII 1968 terstruktur dengan dua kolom karakter kontrol, kolom dengan karakter khusus, kolom dengan angka, dan empat kolom surat. The American Standard Code for Information Interchange (ASCII) dikembangkan di bawah naungan sebuah komite dari American Standards Association, yang disebut komite X3, oleh subkomite yang X3.2 (kemudian X3L2), dan kemudian oleh kelompok subkomite kerja X3.2.4. ASA menjadi the United States of America Standards Institute atau USASI dan akhirnya American National Standards Institute.
Subkomite X3.2 dirancang ASCII berdasarkan sistem pengkodean teleprinter sebelumnya. Seperti pengkodean karakter lainnya, ASCII menetapkan korespondensi antara pola bit digital dan simbol karakter (yaitu grafem dan karakter kontrol). Hal ini memungkinkan perangkat digital untuk berkomunikasi satu sama lain dan untuk memproses, menyimpan, dan mengkomunikasikan karakter berorientasi informasi seperti bahasa tulisan. Sebelum ASCII dikembangkan, pengkodean yang digunakan termasuk 26 karakter alfabet, 10 digit angka, dan 11-25 simbol grafis khusus. Untuk menyertakan semua ini, dan karakter kontrol kompatibel dengan Comit Consultatif International Tlphonique et Tlgraphique standar, Fieldata, dan EBCDIC awal, lebih dari 64 kode yang diperlukan untuk ASCII. Komite ini diperdebatkan karena kemungkinan fungsi tombol shift (seperti kode Baudot), yang akan memungkinkan lebih dari 64 kode untuk diwakili oleh enam bit. Dalam kode yang bergeser, beberapa kode karakter menentukan pilihan antara pilihan untuk kode karakter berikut. Hal ini memungkinkan pengkodean yang bersamaan, namun kurang dapat dipercaya untuk transmisi data, kesalahan dalam transmisi kode pergeseran biasanya membuat bagian panjang transmisi terbaca. Komite standar memutuskan untuk membuat kode tidak bergeser, dan ASCII memerlukan setidaknya kode tujuh bit. Komite ini dianggap sebagai kode delapan-bit, karena delapan bit (oktet) akan memungkinkan pola dua empat-bit secara efisien mengkodekan dua digit dengan desimal berkode biner. Namun, akan mengharuskan semua transmisi data untuk mengirim delapan bit ketika tujuh cukup bisa. Komite memilih untuk menggunakan kode tujuh bit untuk meminimalkan biaya yang berkaitan dengan transmisi data. Sejak pita berlubang pada saat itu bisa merekam delapan bit dalam satu posisi, juga memungkinkan untuk sedikit paritas untuk pengecekan error jika diinginkan. Delapanbit mesin (dengan oktet dengan tipe data asli) yang tidak menggunakan paritas pengecekan biasanya mengatur bit kedelapan menuju 0. Kode itu sendiri berpola sehingga kode kontrol sebagian besar sama, dan semua kode grafis bersama-sama, untuk memudahan identifikasi. Dua kolom pertama (32 posisi) yang disediakan untuk karakter kontrol "ruang" karakter harus ada sebelum grafis untuk dibuat untuk menyortir lebih mudah, sehingga menjadi posisi 20hex, karena alasan yang sama, tanda-tanda khusus yang biasanya digunakan sebagai pemisah ditempatkan sebelum angka. Komite memutuskan bahwa penting untuk mendukung kasus 64karakter alfabet, dan memilih untuk pola ASCII sehingga dapat dikurangi dengan mudah untuk satu set 64-karakter yang dapat digunakan kode grafis huruf bawah. Karena itu tidak disisipkan dengan huruf besar . Untuk menjaga pilihan yang tersedia
untuk huruf kecil dan grafis lain, kode-kode khusus dan angka diatur sebelum huruf, dan huruf "A" ditempatkan di posisi 41hex agar sesuai dengan rancangan standar Inggris yang sesuai. Angka 0 -9 diatur sehingga sesuai dengan nilai-nilai dalam biner yang diawali dengan 011, membuat konversi dengan kode-biner desimal langsung. Banyak karakter non-alfanumerik diposisikan untuk sesuai dengan posisi mereka bergeser pada mesin ketik. Jadi #, $ dan% ditempatkan untuk sesuai dengan 3, 4 dan 5 pada kolom yang berdekatan. Tanda kurung tidak bisa sesuai dengan 9 dan 0, namun, karena tempat yang sesuai ke 0 diambil oleh karakter spasi. Karena mesin ketik Eropa menempatkan tanda kurung dengan 8 dan 9, posisi-posisi yang sesuai dipilih untuk kurung. Simbol @ tidak digunakan di benua Eropa dan panitia diharapkan akan digantikan oleh beraksen dalam variasi Perancis, jadi @ ditempatkan di posisi sebelah 40hex huruf A. Kode kontrol penting untuk transmisi data adalah awal pesan (SOM), akhir alamat (EOA), akhir pesan (EOM), akhir transmisi (EOT), "siapa kamu?" (WRU), "engkau?" (RU), sebuah kontrol perangkat cadangan (DC0), sinkron idle (SYNC), dan mengakui (ACK). Ini diposisikan untuk memaksimalkan jarak Hamming antara pola bit mereka. Dengan karakter khusus lain dan kode kontrol diisi, ASCII diterbitkan sebagai ASA X3.4-1963, meninggalkan 28 posisi kode tanpa arti yang ditetapkan, disediakan untuk standarisasi masa depan, dan satu unassigned kode kontrol. Ada beberapa perdebatan di waktu apakah harus ada karakter kontrol lebih daripada alfabet huruf kecil. Keraguan tidak berlangsung lama selama Mei 1963, Partai CCITT Bekerja pada Alphabet Telegraph Baru diusulkan untuk menetapkan karakter huruf kecil ke kolom 6 dan 7, dan Organisasi Standardisasi TC 97 SC 2 Internasional terpilih selama bulan Oktober untuk memasukkan perubahan ke dalam rancangan standar tersebut. Kelompok tugas X3.2.4 memilih persetujuan untuk perubahan ke ASCII pada Mei 1963 pertemuannya. Mencari huruf kecil dalam kolom 6 dan 7 menyebabkan karakter berbeda dalam pola bit dari huruf besar oleh satu bit, yang disederhanakan case-insensitive pencocokan karakter dan pembangunan keyboard dan printer. Komite X3 membuat perubahan lainnya, termasuk karakter baru lainnya (brace dan karakter garis vertikal), mengubah nama beberapa karakter kontrol (SOM menjadi awal header (SOH)) dan memindahkan atau menghapus orang lain (RU telah dihapus). ASCII kemudian diperbaharui USASI X3.4-1967, maka USASI X3.4-1968, ANSI X3.4-1977, dan akhirnya ANSI X3.4-1986 (dua yang pertama kadang-kadang retronamed ANSI X3.4-1967 , dan ANSI X3.4-1968). Komite X3 juga dibahas bagaimana ASCII harus dikirim (paling signifikan bit
pertama), dan bagaimana harus direkam pada tape berlubang. Mereka mengusulkan sebuah standar 9-jalur untuk pita magnetik, dan berusaha untuk menangani beberapa bentuk format kartu punched. ASCII itu sendiri pertama kali digunakan secara komersial selama 1963 sebagai kode teleprinter tujuh-bit untuk American Telephone & Telegraph TWX (eXchange teletypewriter) jaringan. TWX awalnya menggunakan kode Baudot sebelumnya limabit, yang juga digunakan oleh sistem Telex teleprinter bersaing. Bob Bemer memperkenalkan fitur seperti urutan escape. Inggris Rekannya Hugh Ross McGregor membantu mempopulerkan karya ini, menurut Bemer, "begitu banyak sehingga kode yang dijadikan ASCII pertama kali disebut Kode Bemer-Ross dalam Eropa "Karena pekerjaan yang luas pada ASCII, Bemer telah dipanggil " bapak ASCII ". Pada tanggal 11 Maret 1968, Presiden AS Lyndon B. Johnson mengamanatkan bahwa semua komputer yang dibeli oleh pemerintah Amerika Serikat ASCII dukungan federal, yang menyatakan: Saya juga menyetujui rekomendasi dari Menteri Perdagangan mengenai standar untuk merekam Standard Kode untuk Informasi Interchange pada pita magnetik dan pita kertas ketika mereka digunakan dalam operasi komputer. Semua komputer dan konfigurasi peralatan terkait dibawa ke dalam persediaan Pemerintah Federal dan setelah tanggal 1 Juli 1969, harus memiliki kemampuan untuk menggunakan Standard Kode untuk Informasi Interchange dan format yang ditentukan oleh pita magnetik dan standar pita kertas ketika media ini digunakan. Badan Internasional lainnya telah meratifikasi pengkodean karakter seperti ISO / IEC 646 yang identik atau hampir identik dengan ASCII, dengan ekstensi untuk karakter luar abjad Inggris dan simbol yang digunakan di luar Amerika Serikat, seperti simbol untuk Poundsterling Inggris itu ( ). Hampir setiap negara membutuhkan versi yang disesuaikan ASCII, karena ASCII cocok kebutuhan hanya Amerika Serikat dan beberapa negara lainnya. Misalnya, Kanada memiliki versi sendiri yang mendukung karakter Perancis. Pengkodean disesuaikan lainnya termasuk ISCII (India), VISCII (Vietnam), dan YUSCII (Yugoslavia). Meskipun pengkodean kadang-kadang disebut sebagai ASCII, ASCII benar didefinisikan secara ketat hanya oleh standar ANSI. ASCII dimasukkan ke dalam karakter Unicode ditetapkan sebagai 128 simbol pertama, sehingga karakter ASCII memiliki kode numerik yang sama di kedua set. Hal ini memungkinkan UTF-8 menjadi kompatibel dengan ASCII, keuntungan yang signifikan.
Karakter Kontrol ASCII ASCII menyimpan 32 kode pertama (nomor 0-31 desimal) untuk karakter kontrol: Kode awalnya ditujukan bukan untuk mewakili informasi yang dapat dicetak, melainkan untuk perangkat kontrol (seperti printer) yang menggunakan ASCII, atau untuk memberikan meta-informasi tentang data stream seperti yang disimpan pada pita magnetik. Sebagai contoh, karakter 10 merupakan "garis pakan" fungsi (yang menyebabkan printer untuk memajukan kertas), dan karakter 8 mewakili "backspace". RFC 2822 mengacu mengontrol karakter yang tidak termasuk carriage return, line feed atau ruang putih sebagai non-spasi karakter kontrol. Kecuali untuk karakter kontrol yang meresepkan dasar garis berorientasi format, ASCII tidak mendefinisikan mekanisme apapun untuk menggambarkan struktur atau tampilan teks dalam dokumen. Lain skema, seperti bahasa markup, halaman alamat dan tata letak dokumen dan format. Standar ASCII asli yang digunakan frasa deskriptif hanya singkat untuk tiap karakter kontrol. Ambiguitas ini disebabkan kadang-kadang disengaja (di mana karakter akan digunakan sedikit berbeda pada link terminal dari pada aliran data) dan kadang-kadang disengaja (seperti apa "hapus" artinya). Mungkin perangkat tunggal paling berpengaruh pada interpretasi dari karakter ini adalah Teletype Model 33 ASR seri, yang merupakan terminal pencetakan dengan pita kertas pilihan yang tersedia pembaca / punch. Pita kertas adalah media yang sangat populer untuk penyimpanan jangka panjang program melalui tahun 1980-an, lebih murah dan dalam beberapa hal kurang rapuh dari pita magnetik. Secara khusus, Model Teletype tugas mesin 33 untuk kode 17 (Control-Q, DC1, juga dikenal sebagai XON), 19 (Control-S, DC3, juga dikenal sebagai XOFF), dan 127 (Hapus) menjadi standar de facto. Karena keytop untuk tombol O juga menunjukkan simbol panah kiri (dari ASCII1963, yang memiliki karakter ini bukan garis bawah), penggunaan patuh kode 15 (Control-O, Shift In) ditafsirkan sebagai "menghapus karakter sebelumnya" juga diadopsi oleh banyak sistem time sharing awal tetapi akhirnya menjadi terabaikan. Penggunaan Control-S (XOFF, singkatan untuk mengirimkan off) sebagai sinyal "handshaking" memperingatkan pengirim untuk menghentikan penularan karena overflow yang akan datang, dan Control-Q (XON, "mengirimkan pada") untuk melanjutkan pengiriman, tetap ada untuk hari ini dalam banyak sistem sebagai teknik kontrol keluaran manual. Pada beberapa sistem Control-S mempertahankan maknanya tetapi Control-Q digantikan oleh kedua Control-S untuk melanjutkan output. Kode 127 secara resmi bernama "hapus" tapi label Teletype adalah "rubout". Karena
standar asli tidak memberikan interpretasi rinci untuk kode kontrol yang paling, interpretasi dari kode ini bervariasi. Arti Teletype asli, dan maksud dari standar adalah untuk membuat karakter diabaikan, sama seperti NUL (semua nol). Ini berguna khusus untuk pita kertas, karena meninju pola bit semua yang di atas tanda yang ada akan melenyapkan itu. Tape dirancang untuk menjadi "diedit tangan" bahkan bisa diproduksi dengan spasi dari NULs tambahan (pita kosong) sehingga blok karakter bisa "digosok keluar" dan kemudian pengganti dimasukkan ke dalam ruang kosong. Sebagai terminal video mulai menggantikan yang dicetak, nilai dari karakter "rubout" hilang. Desember sistem, misalnya, ditafsirkan "Hapus" berarti "menghapus karakter sebelum kursor" dan penafsiran ini juga menjadi umum dalam sistem Unix. Kebanyakan sistem lain yang digunakan "Backspace" untuk makna tersebut dan digunakan "Hapus" berarti "menghapus karakter pada kursor". Itu interpretasi yang terakhir adalah yang paling umum sekarang. Banyak dari kode kontrol telah diberi makna yang cukup berbeda dari yang aslinya. Karakter "melarikan diri" (ESC, kode 27), misalnya, awalnya dimaksudkan untuk memungkinkan pengiriman karakter kontrol lainnya sebagai literal bukan memohon, artinya ini adalah arti yang sama "melarikan diri" yang dihadapi dalam pengkodean URL, string bahasa C, dan sistem lain di mana karakter tertentu memiliki makna disimpan. Seiring waktu makna ini telah dikooptasi dan telah akhirnya telah berubah. Dalam penggunaan modern, ESC dikirim ke terminal biasanya menunjukkan awal dari sebuah urutan perintah, biasanya dalam bentuk "kode melarikan diri ANSI" yang disebut (atau, lebih baik, sebuah "Control Introducer Sequence") dimulai dengan ESC diikuti oleh karakter "[" (kiri braket). Sebuah ESC dikirim dari terminal yang paling sering digunakan sebagai karakter out-of-band digunakan untuk mengakhiri operasi, seperti dalam TECO dan editor teks vi. Dalam antarmuka pengguna grafis (GUI) dan sistem windowing, ESC umumnya menyebabkan aplikasi untuk membatalkan operasi saat ini atau untuk keluar (menghentikan) sama sekali. Ambiguitas yang melekat pada karakter kontrol banyak dikombinasikan dengan penggunaan sejarah mereka, menciptakan masalah ketika mentransfer file "teks biasa" antara sistem. Contoh terbaik dari hal ini adalah masalah newline pada berbagai sistem operasi. Mesin teletype yang diperlukan baris teks diakhiri dengan kedua "Kembali Carriage" dan "feed Line". Yang pertama mengembalikan kereta cetak ke awal baris dan kemajuan kedua ke baris berikutnya tanpa memindahkan gerbong. Namun, membutuhkan dua karakter untuk menandai akhir baris memperkenalkan kompleksitas yang tidak perlu dan pertanyaan tentang bagaimana menafsirkan setiap karakter ketika ditemui saja. Untuk menyederhanakan masalah, file teks biasa on line sistem penggunaan Unix dan Amiga feed sendiri untuk baris yang berbeda. Demikian pula,
sistem Macintosh yang lebih tua, antara lain, gunakan tombol kembali hanya dalam file teks biasa. Berbagai IBM sistem operasi yang digunakan kedua karakter untuk menandai akhir baris untuk kompatibilitas dengan mesin Teletype. Ini standar de facto disalin ke CP / M dan kemudian ke MS-DOS dan akhirnya ke dalam Microsoft Windows. Transmisi teks melalui Internet, untuk protokol sebagai E-mail dan World Wide Web, menggunakan kedua karakter. Beberapa sistem operasi seperti pra-VMS sistem operasi DEC, bersama dengan CP / M, panjang file dilacak hanya dalam satuan blok disk dan digunakan Control-Z (SUB) untuk menandai akhir dari teks yang sebenarnya dalam file. Untuk alasan ini, EOF, atau end-of-file, digunakan bahasa sehari-hari dan konvensional sebagai singkatan tiga huruf (TLA) untuk Control-Z bukan Pengganti. Untuk berbagai alasan, kode akhir-teks, ETX alias Control-C, adalah tidak pantas dan menggunakan Z sebagai kode kontrol untuk mengakhiri sebuah file analog dengan itu mengakhiri alfabet, alat bantu mnemonic sangat nyaman. String ASCII diakhiri dengan karakter null dikenal sebagai ASCIZ, ASCIIZ atau null-dihentikan string.
Binary
[c]
Name
000 0000 000 0 000 0001 001 1 000 0010 002 2 000 0011 003 3 000 0100 004 4 000 0101 005 5 000 0110 006 6 000 0111 007 7 000 1000 010 8
00 NUL ^@ \0 Null character 01 SOH ^A 02 STX ^B 03 ETX ^C 04 EOT ^D 05 ENQ ^E 06 ACK ^F 07 BEL ^G \a 08 BS Start of Header Start of Text End of Text End of Transmission Enquiry Acknowledgment Bell
^H \b Backspace
09 HT
^I
\t
Horizontal Tab
000 1010 012 10 0A LF 000 1011 013 11 0B VT 000 1100 014 12 0C FF 000 1101 015 13 0D CR 000 1110 016 14 0E SO 000 1111 017 15 0F SI
^J \n Line feed ^K \v Vertical Tab ^L \f ^M \r ^N ^O Form feed Carriage return[g] Shift Out Shift In Data Link Escape Device Control 1 (oft. XON) Device Control 2 Device Control 3 (oft. XOFF) Device Control 4 Negative Acknowledgement Synchronous idle End of Transmission Block Cancel End of Medium
001 0000 020 16 10 DLE ^P 001 0001 021 17 11 DC1 ^Q 001 0010 022 18 12 DC2 ^R 001 0011 023 19 13 DC3 ^S 001 0100 024 20 14 DC4 ^T 001 0101 025 21 15 NAK ^U 001 0110 026 22 16 SYN ^V 001 0111 027 23 17 ETB ^W 001 1000 030 24 18 CAN ^X 001 1001 031 25 19 EM ^Y
001 1010 032 26 1A SUB ^Z 001 1011 033 27 1B ESC ^[ 001 1100 034 28 1C FS 001 1101 035 29 1D GS 001 1110 036 30 1E RS 001 1111 037 31 1F US ^\ ^] ^^[j] ^_
Substitute \e[h] Escape[i] File Separator Group Separator Record Separator Unit Separator Delete[k][e]
^ Karakter Unicode dari daerah U 2400 ke U 2421 dicadangkan untuk mewakili karakter kontrol jika diperlukan untuk mencetak atau menampilkan karakter Unicode bukan untuk meminta karakter Unicode melakukan fungsi yang ditujukan. Beberapa browser tidak dapat menampilkan ini dengan benar. ^ Caret notasi sering digunakan untuk mewakili karakter kontrol pada terminal. Pada terminal teks yang paling, menekan tombol Ctrl saat mengetik karakter kedua akan mengetik karakter kontrol. Kadang-kadang tombol shift tidak diperlukan, misalnya ^ @ mungkin typable hanya dengan Ctrl dan 2. ^ Kode Luput Karakter dalam bahasa pemrograman C dan bahasa lainnya banyak dipengaruhi olehnya, seperti Java dan Perl (meskipun tidak semua implementasi selalu mendukung semua kode escape). ^ Karakter Backspace juga dapat dimasukkan dengan menekan tombol Backspace pada beberapa sistem. ^ Ab Ambiguitas Backspace adalah karena terminal awal dirancang dengan asumsi penggunaan utama dari keyboard adalah dengan manual memukul pita kertas sementara tidak terhubung ke komputer. Untuk menghapus karakter sebelumnya, orang harus membuat cadangan punch pita kertas, yang untuk alasan mekanik dan kesederhanaan adalah sebuah tombol pada pukulan sendiri dan bukan keyboard, kemudian ketik karakter rubout. Oleh karena itu mereka menempatkan rubout memproduksi kunci di lokasi yang digunakan pada mesin ketik untuk backspace. Ketika sistem yang digunakan terminal ini dan menyediakan pengeditan baris perintah, mereka harus menggunakan "rubout" kode untuk melakukan backspace, dan sering tidak menafsirkan
karakter backspace (mungkin echo "^ H" untuk backspace). Terminal lain tidak dirancang untuk pita kertas yang dibuat kuncinya pada Backspace memproduksi lokasi, dan sistem ini dirancang untuk digunakan bahwa karakter untuk kembali. Karena kode hapus sering menghasilkan efek backspace, ini produsen terminal juga dipaksa untuk membuat sesuatu produk Hapus kunci selain karakter Hapus. ^ Karakter Tab juga dapat dimasukkan dengan menekan tombol Tab pada kebanyakan sistem. Karakter ^ Kembali Carriage juga dapat dimasukkan dengan menekan Enter atau Return kunci pada kebanyakan sistem. ^ Urutan escape '\ e' bukan bagian dari ISO C dan banyak spesifikasi bahasa lainnya. Namun, dapat dipahami dengan compiler beberapa. ^ Karakter Luput juga dapat dimasukkan dengan menekan tombol Esc pada beberapa sistem. ^ ^ ^ Cara Ctrl + ^ (menekan tombol "Ctrl" dan tombol tanda sisipan). ^ Karakter Hapus kadang-kadang dapat dimasukkan dengan menekan tombol Backspace pada beberapa sistem. Karakter ASCII yang Dapat Dicetak Kode 20hex untuk 7Ehex yang dikenal sebagai karakter yang dapat dicetak, mewakili huruf, angka, tanda baca, dan sedikit simbol lain-lain. Ada 95 karakter yang dapat dicetak secara total. Kode 20hex, karakter spasi, menunjukkan ruang antara kata-kata, seperti yang dihasilkan oleh space bar-dari keyboard. Karena karakter spasi dianggap sebagai tak terlihat grafis (bukan karakter kontrol) dan dengan demikian biasanya tidak terlihat, itu diwakili di sini oleh karakter Unicode U 2.420 ""; karakter Unicode U 2.422 " "dan U 2423" "juga tersedia untuk digunakan representasi terlihat dari ruang yang diperlukan. Kode 7Fhex sesuai dengan non-printable karakter "Hapus" (DEL) kontrol dan karena itu dihilangkan dari tabel ini, itu tercakup dalam grafik bagian sebelumnya. Versi sebelumnya dari ASCII digunakan panah-bukan tanda sisipan (5Ehex) dan panah kiri bukan garis bawah (5Fhex).
Binary
20
40
60
21
41
61
22
"
42
62
23
43
63
24
44
25
45
26
&
46
27
'
47
28
48
29
49
2A *
4A J
2B
4B
2C
4C
2D -
4D M
2E
4E
2F
4F
30
50
31
51
32
52
33
53
34
54
35
55
36
56
37
57
38
58
39
59
3A :
5A Z
3B
5B
3C
<
5C
3D =
5D ]
3E
>
5E
3F
5F
Alias Sebuah RFC pada Juni 1992 dan Internet Assigned Numbers Authority mengakui alias case-insensitive berikut untuk ASCII agar sesuai untuk digunakan di Internet: ANSI_X3.4-1968 (nama kanonik) iso-ir-6 ANSI_X3.4-1986 ISO_646.irv: 1991 ASCII (dengan ASCII-7 dan ASCII-8 varian) ISO646-AS US-ASCII (pilihan nama MIME) us IBM367 cp367 csASCII Dari itu semua, IANA mendorong penggunaan nama "US-ASCII" untuk penggunaan internet ASCII. Orang sering menemukan ini pada parameter opsional "charset" di header Content-Type dari beberapa pesan MIME, dalam elemen setara "meta" dari beberapa dokumen HTML, dan di bagian pengkodean deklarasi prolog dari beberapa dokumen XML.
Varian/Jenis Dikarenakan teknologi komputer menyebar ke seluruh dunia, badan standar dan perusahaan yang berbeda mengembangkan banyak variasi ASCII untuk memfasilitasi ekspresi non-Inggris bahasa yang digunakan Romawi berbasis huruf. Satu kelas bisa beberapa variasi sebagai "ekstensi ASCII", meskipun penyalahgunaan beberapa istilah untuk mewakili semua varian, termasuk yang tidak mempertahankan yang ASCII
karakter-peta di kisaran 7-bit. Para PETSCII kode Commodore International digunakan untuk 8-bit sistem mereka mungkin unik di antara pasca-1970 kode pada yang berbasis ASCII-1963, bukan yang lebih umum ASCII-1967, seperti yang ditemukan pada komputer ZX Spectrum. Komputer Atari dan Galaksija juga menggunakan varian ASCII.
Ketidaksesuaian VS Interoperabilitas Dari awal perkembangannya, ASCII ini dimaksudkan untuk menjadi hanya salah satu varian nasional beberapa standar kode karakter internasional, akhirnya diterbitkan sebagai ISO / IEC 646 (1972), yang akan berbagi karakter paling umum tetapi menetapkan lain lokal berguna karakter untuk beberapa poin kode dicadangkan untuk penggunaan "nasional." Namun, empat tahun yang lalu antara publikasi ASCII-1963 dan penerimaan pertama ISO dari rekomendasi internasional selama tahun 1967 menyebabkan pilihan ASCII untuk karakter penggunaan nasional tampaknya menjadi de facto standar untuk dunia, menyebabkan kebingungan dan ketidakcocokan di negaranegara lain pun mulai membuat tugas mereka sendiri untuk titik-titik kode. ISO / IEC 646, seperti ASCII, adalah set karakter 7-bit. Ini tidak membuat kode tambahan yang tersedia, sehingga poin kode yang sama dikodekan karakter yang berbeda di berbagai negara. Kode escape didefinisikan untuk menunjukkan varian nasional diterapkan untuk sepotong teks, tapi mereka jarang digunakan, jadi sering tidak mungkin untuk mengetahui apa varian untuk bekerja dengan dan karena itu karakter yang diwakili kode, dan secara umum teks-pengolahan sistem bisa mengatasi hanya satu varian saja. Karena karakter braket dan bertali dari ASCII ditugaskan untuk "nasional penggunaan" titik kode yang digunakan untuk huruf beraksen dalam varian nasional lainnya dari ISO / IEC 646, sebuah, Jerman, Perancis, atau Swedia dll pemrogram menggunakan varian nasional mereka dari ISO / IEC 646, bukan ASCII, harus menulis, dan dengan demikian membaca, sesuatu seperti ai = 'on'; daripada {A [i] = '\ n';}
Trigraphs C diciptakan untuk memecahkan masalah ini untuk ANSI C, meskipun pengenalan dan implementasi tidak konsisten dalam kompiler terbatas penggunaannya. Akhirnya, sebagai 8 -, 16 -, dan 32-bit komputer mulai menggantikan 18 - dan 36-bit komputer sebagai norma, itu menjadi umum untuk menggunakan 8-bit byte untuk menyimpan setiap karakter dalam memori, memberikan kesempatan bagi diperpanjang , 8-bit, keluarga ASCII, dengan 128 karakter tambahan menyediakan ruang untuk menghindari sebagian besar ambiguitas yang telah diperlukan dalam 7-bit kode. Sebagai contoh, IBM mengembangkan 8-bit kode halaman, seperti halaman, kode 437 yang menggantikan kontrol karakter dengan simbol grafis seperti wajah smiley, dan dipetakan karakter grafis tambahan untuk 128 posisi atas. Sistem operasi seperti DOS didukung ini kode-halaman, dan produsen PC IBM mendukung mereka dalam perangkat keras. Digital Equipment Corporation mengembangkan Character Set Multinasional (DEC-MCS) untuk digunakan di terminal VT220 populer. Delapan-bit standar seperti ISO / IEC 8859 (berasal dari DEC-MCS) dan Mac OS Romawi dikembangkan sebagai ekstensi sebenarnya dari ASCII, meninggalkan karakter-pemetaan utuh asli, tetapi menambahkan definisi karakter tambahan setelah 128 pertama (yaitu, 7 -bit) karakter. Representasi diaktifkan dari karakter yang digunakan dalam lebih luas bahasa. Karena ada beberapa bersaing 8-bit kode standar, mereka terus menderita tidak kompatibel dan keterbatasan. Namun, ISO-8859-1 (Latin 1), varian dengan Windows-1252 (sering disalahartikan sebagai ISO-8859-1), dan ASCII 7-bit asli tetap pengkodean karakter yang paling umum digunakan saat ini.
Unicode Unicode dan ISO / IEC 10646 Universal Character Set (UCS) memiliki karakter array yang jauh lebih luas, dan berbagai bentuk mereka pengkodean telah mulai menggantikan ISO / IEC 8859 dan ASCII pesat di banyak lingkungan. Sementara ASCII terbatas pada 128 karakter, Unicode dan dukungan UCS karakter lebih dengan memisahkan konsep identifikasi unik (menggunakan bilangan asli disebut poin kode) dan pengkodean (untuk 8 -, 16 - atau 32-bit format biner, yang disebut UTF-8 , UTF-16 dan UTF-32). Untuk memungkinkan kompatibilitas ke belakang, 128 ASCII dan 256 ISO-8859-1 (Latin 1) karakter ditugaskan poin kode Unicode / UCS yang sama dengan kode mereka dalam standar sebelumnya. Oleh karena itu, ASCII dapat dianggap sebagai skema pengkodean 7-bit untuk subset sangat kecil dari Unicode / UCS, dan, sebaliknya,
pengkodean UTF-8 adalah bentuk biner yang kompatibel dengan ASCII untuk poin kode di bawah 128, yang berarti ASCII semua UTF berlaku -8. Bentuk pengkodean ASCII lainnya menyerupai dalam cara mereka mewakili 128 karakter pertama dari Unicode, tetapi menggunakan 16 atau 32 bit per karakter, sehingga mereka membutuhkan konversi untuk kompatibilitas. (sama dengan UCS-2 kompatibel dengan UTF-16).
Orde/Urutan Orde/urutan kode ASCII disebut juga orde/urutan ASCIIbetical. Penyatuan data ini kadang dilakukan dalam rangka bukan "standar" urutan abjad (menyusun urutan). Penyimpangan utama dalam rangka ASCII adalah: Semua huruf besar muncul sebelum huruf kecil, misalnya, "Z" sebelum "a" Angka dan tanda baca banyak muncul sebelum huruf, misalnya, "4" adalah sebelum "satu" Perintah menengah yang dapat dengan mudah diimplementasikan mengubah huruf besar menjadi huruf kecil sebelum membandingkan nilai-nilai ASCII.