ASCII: binārais rakstzīmju kods un teksta kodējuma pamati
Iepazīsties ar ASCII pamatiem: binārais rakstzīmju kods, tā vēsture, 128 simbolu tabula un teksta kodējuma principi ar praktiskiem piemēriem.
ASCII (angļu valodā izrunā kā "aski" vai "eski") ir standarts rakstzīmju tabulai, ko izmanto datora un citu elektronisko ierīču teksta apstrādē. Pilns nosaukums ir American Standard Code for Information Interchange. ASCII izstrāde notika 1960. gados, balstoties uz agrākiem telegrāfa kodiem, un tas kļuva par pamatveidu, kā datoros un sakaru sistēmās kodēt angļu alfabēta burtus, ciparus un bieži lietotos simbolus. datoru un rakstzīmju apmaiņai ASCII kalpoja par vienkāršu un savietojamu risinājumu.
Kā darbojas ASCII
ASCII ir 7 bitu kods, kas paredz 128 rakstzīmes (no 0 līdz 127). 7 bitu izmantošana nozīmē, ka katrai rakstzīmei ir unikāls skaitlis no 0 līdz 127. No tiem:
- rakstzīmju kodi 0–31 ir kontroles rakstzīmes (piemēram, NUL, LF, CR),
- 32–126 ir drukājamas rakstzīmes (atstarpe, cipari, lielie un mazie burti, interpunkcija),
- 127 (DEL) ir īpaša dzēšanas/izdzēšanas kontroles rakstzīme.
Piemērs: lielais burts A atbilst decimālajam kodam 65, hex 41 un binārai 1000001 (7 bitos). Praksē datu pārsūtē vai iekšējā atmiņā bieži lieto 8 bitu baitu, tādēļ ASCII simboli tiek glabāti kā 8 bitu vērtības ar pirmo biti 0 (piem., 01000001) vai ar papildu paritātes bitu, lai pārbaudītu pārraides kļūdas. Šī papildu biti izmantošana bija svarīgāka laikā, kad sakari bieži bija trokšņaini.
Kontroles rakstzīmes
Kontroles rakstzīmes neparādās ekrānā kā drukājami simboli, bet tās ietekmē teksta apstrādi un sakaru plūsmu. Biežāk sastopamie piemēri:
- NUL (0) – nulles rakstzīme, bieži izmanto kā virknes beigu atzīmi programmēšanā;
- LF (Line Feed, 10) – jaunas rindas paziņojums Unix tipa sistēmās;
- CR (Carriage Return, 13) – kursora atgriešana sākumā (kopā ar LF tiek lietots Windows rindu beigu formātā CR+LF);
- DEL (127) – tradicionāli izmantoja rakstzīmju dzēšanai.
Daudzas no šīm kontroles funkcijām mūsdienu lietojumos nav izmantotas sākotnējā veidā, un ASCII neparedz formatēšanas iespējas kā treknraksts vai kursīva — tās pieder pie augstākā līmeņa formātu vai marķēšanas sistēmām (piem., HTML, RTF).
ASCII failu un teksta nozīme
Ja runā par failu vai dokumentu kā par "ASCII formātu", parasti domāts, ka tas ir vienkāršs teksts saturā, kurā tiek izmantoti tikai ASCII rakstzīmju kodi. ASCII teksti ir viegli pārnēsājami starp dažādām sistēmām, tāpēc tos plaši izmanto protokolos, konfigurācijas failos, programmas avota kodā un e-pasta galvenēs.
Paplašinājumi un mūsdienu situācija
Jo īpaši ārpus angļu valodas ASCII ir ierobežots — tam nav latviešu diakritisko zīmju, kirilicā vai citu valodu rakstzīmju. Lai risinātu šo problēmu, tika radīti dažādi 8 bitu paplašinājumi (piem., ISO-8859-1, Windows-1252, CP437), kas izmanto visu 8 bitu vietu (0–255) un pievieno vietējo akcentu rakstzīmes un simbolus. Šie paplašinājumi tomēr nav pilnīgi savietojami savā starpā.
Mūsdienās universālā risinājuma lomu ieņēmis Unicode (piem., UTF-8), kas iekļauj ASCII kā savas pirmās 128 rakstzīmes. Tas nozīmē, ka jebkura ASCII teksta fails ir derīgs arī UTF-8 kodējumā — tādēļ ASCII paliek būtiska mantojuma un savietojamības daļa.
Kopsavilkums
- ASCII ir 7 bitu standarts ar 128 rakstzīmēm, izstrādāts 1960. gados.
- Tas iekļauj gan drukājamas rakstzīmes (burti, cipari, simboli), gan kontroldarības rakstzīmes (rindas beigas, dzēšana u. c.).
- Praktiskā lietošanā ASCII bieži tiek glabāts 8 bitu baitu formātā, reizēm ar paritātes bitu vai paplašinājumu.
- Arī tagad ASCII ir svarīgs, jo tas ir Unicode (UTF-8) pamatā — nodrošinot saderību un vienkāršu teksta apmaiņu.
Vairāk par bināriem kodiem skatiet sadaļā binārais un par simboliem — simbolus. Par laikietilpīgākiem sakariem un trokšņainu pārraidi lasiet sadaļā trokšņaini. Par paritātes jēdzienu ir saite uz paritātes skaidrojumu.

95 grafiskās ASCII rakstzīmes ar numuriem no 32 līdz 126 (decimālskaitļos).
Paplašināts ASCII
ASCII nav diakritisko zīmju (zīmju, kas tiek pievienotas burtam, piemēram, punktiņi (umlauts) virs patskaņiem vācu valodā vai tilde (~) virs "n", ko lieto spāņu valodā). Tas bija paredzēts tikai angļu valodai un nedarbojas labi lielākajā daļā citu valodu. Dažos angļu valodas vārdos, kas aizgūti no citām valodām, šīs zīmes arī tiek lietotas, piemēram, resumé (skatīt pielikumu:Angļu valodas vārdi ar diakritiskajām zīmēm).
Tā rezultātā dažās sistēmās 7 bitu vietā tika izmantoti 8 biti (pilns baits). Sistēmas, kurās izmanto 8 bitus, sauc par paplašināto ASCII. Astoņi biti ļauj izmantot 256 rakstzīmes. Pirmajām 128 rakstzīmēm jābūt tādām pašām kā ASCII, un pārējās parasti izmanto alfabēta burtiem ar akcentiem, piemēram, É, È, Î un Ü. Tas atrisina problēmu valodās, kuru pamatā ir latīņu alfabēts, lai gan ne visas paplašinātās ASCII sistēmas ir vienādas. Citiem alfabētiem, piemēram, grieķu alfabētam, kirilicas alfabētam, ir vajadzīgs cits rakstzīmju komplekts. Un dažas sistēmas, piemēram, tās, kurās izmanto ķīniešu rakstzīmes, joprojām nedarbojas, jo tās izmanto tūkstošiem rakstzīmju. Tāpēc tika izveidots Unicode, lai visām valodām būtu viena kopīga sistēma.
ASCII standarts joprojām tiek plaši izmantots, jo īpaši datoru programmatūrā un HTML failos. Līdz 2010. gadam tas bija URL standarts. Bieži vien tīmekļa vietnēs, kurās ir teksta ievadīšanas lauki, var ievadīt tikai ASCII tekstu. Jebkuras īpašas atzīmes, piemēram, treknraksts, centrēts teksts u. c., tiks attēlotas nepareizi.

Jautājumi un atbildes
J: Kas ir ASCII?
A: ASCII ir datoru rakstzīmju tabula, kas izmanto bināro kodu, lai apstrādātu tekstu, izmantojot angļu alfabētu, ciparus un citus parastos simbolus.
Q: Ko nozīmē ASCII?
A: ASCII nozīmē American Standard Code for Information Interchange.
J: Kad tika izstrādāts ASCII?
A: ASCII tika izstrādāts 1960. gados.
J: Cik daudz rakstzīmju ietver kods?
A: Kods ietver 128 rakstzīmju definīcijas, kurām piešķirti numuri no 0 līdz 127.
Jautājums: Cik bitu nepieciešams, lai atveidotu ASCII rakstzīmi?
A: Lai atveidotu ASCII rakstzīmi, nepieciešami 7 bināri cipari (biti).
J: Vai ASCII datnē katram rakstzīmju veidam tiek izmantots viens baits?
A: Jā, ASCII datnē katram rakstzīmēm tiek izmantots viens baits, un katrā baitā ir 8 biti.
J: Vai mūsdienās joprojām plaši izmanto ASCII standartu? A: Jā, ASCI standarts joprojām tiek plaši izmantots, jo īpaši datoru programmatūrā un HTML failos.
Meklēt