Mojibake

Mojibake (文字化け, izrunā /modʑibake/) ir nosaukums nepareiziem, nelasāmiem burtiem, kas parādās, ja datora programmatūra nespēj pareizi attēlot tekstu. Lietojot datoru, teksts tiek kodēts, izmantojot rakstzīmju kodējumu. Pārsūtot katru rakstzīmi aizstāj ar tās pozīciju (vai numuru) kodējumā. Lai atkal parādītu rakstzīmi, pozīcija atkal tiek aizstāta ar rakstzīmi. Ja sākotnējā kodēšana nav norādīta, var izmantot citu rakstzīmi, kad numuru atkal aizstāj ar rakstzīmi, lai to parādītu. Unicode tika ieviests, lai atrisinātu šo problēmu: UTF-8 spēj kodēt lielāko daļu izplatīto rakstzīmju 2 baitos.

Pirms Unicode ieviešanas tika izmantoti citi rakstzīmju kodējumi. Piemēram, ISO-8859 ietver 15 dažādas kodēšanas. Tās ir tādas pašas angļu valodā parasti lietotajām rakstzīmēm. Tām ir vairāki "īpašo rakstzīmju" "bloki", kas katrā kodējumā ir atšķirīgi.



Tā var izskatīties tīmekļa vietne, ja tiek izmantota nepareiza fontu kodēšana.Zoom
Tā var izskatīties tīmekļa vietne, ja tiek izmantota nepareiza fontu kodēšana.

Japāņu Vikipēdijas rakstā par Mojibake ir izmantota UTF-8 kodēšana. Šis ekrānšāviņš parāda, kā tas izskatās, ja tas ir atšifrēts, izmantojot standarta Windows CP1252 kodējumu.Zoom
Japāņu Vikipēdijas rakstā par Mojibake ir izmantota UTF-8 kodēšana. Šis ekrānšāviņš parāda, kā tas izskatās, ja tas ir atšifrēts, izmantojot standarta Windows CP1252 kodējumu.

Vārda izcelsme

Mojibake ir japāņu vārds. Vārds 文字化け ([moʥibake]) sastāv no divām daļām. 文字 (moji) nozīmē burtu, raksturu. 化け (bake) no darbības vārda 化ける (bakeru) nozīmē parādīties pārģērbies, iegūt formu, mainīties uz sliktāku pusi. Burtiski tas nozīmē "rakstura mutācija".



Jautājumi un atbildes

J: Kas ir "mojibake"?


A: "Mojibake" ir termins, ar ko apzīmē nepareizas un nelasāmas rakstzīmes, kas parādās, ja datora programmatūra nespēj pareizi attēlot tekstu.

J: Kā tiek kodēts teksts, lietojot datoru?


A: Teksts tiek kodēts, izmantojot rakstzīmju kodējumu, kur katra rakstzīme tiek aizstāta ar tās pozīciju vai numuru kodējumā.

J: Kas notiek, ja, pārsūtot tekstu, nav norādīta sākotnējā kodēšana?


A: Ja nav norādīta sākotnējā kodēšana, var tikt izmantota cita rakstzīme, kad skaitlis tiek aizstāts ar rādīšanai paredzēto rakstzīmi.

J: Kas ir Unicode un kā tas atrisina šo problēmu?


A: Unicode ir rakstzīmju kodēšanas standarts, kas var attēlot lielāko daļu rakstzīmju divos baitos. Tas atrisina problēmu, kas saistīta ar dažādu rakstzīmju kodējumu izmantošanu, un nodrošina, ka rakstzīmes tiek attēlotas pareizi.

J: Kādi ir piemēri citām rakstzīmju kodēm, kas tika izmantotas pirms Unicode?


A: ISO-8859 ir vēl vienas rakstzīmju kodēšanas piemērs, kas tika izmantots pirms Unicode.

J: Cik daudz dažādu kodējumu ietver ISO-8859?


A: ISO-8859 ietver 15 dažādas kodēšanas.

J: Vai ISO-8859 īpašās rakstzīmes ir vienādas visās ISO-8859 kodējumos?


A: Nē, ISO-8859 īpašās rakstzīmes katrā kodējumā ir reģistrētas atšķirīgi.

AlegsaOnline.com - 2020 / 2023 - License CC3