Чому замість букв показуються ієрогліфи

Чому замість букв показуються ієрогліфи

Іноді отриманий електронний лист може замість тексту містити досить химерну суміш символів і графічних знаків, що нагадує ієрогліфи, яку з чиєїсь "легкої руки" охрестили "крякозябрами". Це трапляється не тільки з текстом листів, але й з вмістом веб-сторінок, деяких текстових файлів і навіть з написами в інтерфейсі комп 'ютерних програм.


При збереженні та відтворенні на екрані літер, цифр, знаків перепинання та інших текстових елементів операційна система комп 'ютера використовує спеціальні таблиці. У них всі ці символи розміщені в строго визначеному порядку. Коли ви зберігаєте документ, що містить текст, у файлі записуються не самі літери і цифри, а їх порядкові номери в цій таблиці. Коли ж ви відкриваєте такий документ, то відбувається зворотна операція - програма читає з файлу номери символів і виводить на сторінці відповідні їм знаки з таблиці. Ці таблиці називають "наборами символів" (Character Set, скорочено CharSet) або "кодуваннями".

Таких таблиць існує досить багато - кілька десятків. Спочатку кожен конкуруючий виробник комп 'ютерного програмного забезпечення створював свою власну таблицю символів, потім створювалися таблиці для різних національних алфавітів з обов' язковим включенням англійської, потім, у міру вдосконалення операційних систем, створювалися їх варіанти для нових можливостей тощо. Якщо текст, записаний і збережений з використанням однієї такої таблиці потім відкрити з використанням іншої, то результатом і буде те саме, що ми називаємо словом "крякозябри" - номери символів залишаться колишніми, але знаки їм відповідні в цій таблиці буде зовсім іншими.

Зазначення кодування, яке комп 'ютерна програма повинна використовувати для відображення текстового вмісту файлу, записується в службове поле цього файлу. Якщо текст передається по мережах, вказування кодування надсилається в службове поле переданого пакета інформації. У HTML-коді веб-сторінок для зберігання назви використаного кодування призначено спеціальний тег. У листі електронної пошти кодування передається у службових полях разом з інформацією про відправника, одержувача тощо. Якщо вказати кодування будь-яким з перелічених способів відсутнє, то з крякозябрами доведеться боротися вручну - спробуйте підібрати потрібне кодування засобами програми, що використовується. Така функція передбачена і в браузері, і в поштовому клієнті, а текстовий редактор (наприклад, Microsoft Word) сам намагається визначити правильне кодування за непрямими ознаками. Здається, сьогодні нарешті створено стандарт таблиці символів, який задовольняє всіх - його назвали "Юнікод" (Unicode). Але перехід на нього ще тільки відбувається, тому з крякозябрами доведеться стикатися ще кілька років.