Кодирование текстовой информации

Страницы: <<  <  1 | 2 | 3 | 4  >  >>

ют символом – потому что как раз для кодировки символа и стали использовать один байт. Даже меньше, изначально была придумана кодировка ASCII, которая использовала 7 битов – в первые 128 значений можно было вольготно разместить английский алфавит в обоих регистрах, диакритические знаки, цифры и набор спецсимволов. И эта кодировка действительно стала универсальной, поэтому англоязычные пользователи крайне редко могут испытывать проблемы с кодировкой.
КодировкаASCII(American Standard Code for Information Interchange, которая по-русски обычно произносится как «аски») описывает первые 128 символов из наиболее часто используемых англоязычными пользователями— латинские буквы, арабские цифры и знаки препинания. Так же еще в эти 128 символов кодировки ASCII попадали некоторые служебные символы, вроде скобок, решеток, звездочек и т. п. Именно эти 128 символов из первоначального вариант ASCII стали стандартом, и в любой другой кодировке текста вы их обязательно встретите и стоять они будут именно в таком порядке. Но дело в том, что с помощью одного байта информации можно закодировать не 128, а целых 256 различных значений (двойка в степени восемь равняется 256), поэтому вслед за базовой версией ASCII появился целый рядрасширенных кодировок ASCII, в которых можно было кроме 128 основных символов закодировать еще и символы национальной кодировки (например, русской).
Для представления текстовой информации в компьютере достаточно 256 различных знаков.
Воспользуемся формулой Хартли, чтобы вычислить количество информации для кодирования одного знака:
N2i 25628 i8 битов
Значит, длина кода для одного символа составляет
8 двоичных знаков (0 или 1)
Рис. 1 Стандартная часть кодовой таблицы
Кодировка КОИ-8R
Принцип работы кодировки KOI-8R такой— каждый

Страницы: <<  <  1 | 2 | 3 | 4  >  >>
Рейтинг
Оцени!
Поделись конспектом: