Кодирование информации
Задачи главы
- 1. Выявить особенности кодирования информации различной природы: текстовой, числовой, графической (растровой и векторной), звуковой, видео.
- 2. Изучить системы счисления числовой информации: позиционной (десятичная, двоичная, восьмеричная, шестнадцатеричная)и непозиционной.
- 3. Научиться кодировать текстовую информацию с помощью различных кодов: ASCII, Unicod, EBCDIC.
Особенности кодирования информации различной природы
Кодирование – процесс присвоения условных обозначений, результатом которого является создание кодов объектов.
Как известно, кодирование связано с определением:
■ множества объектов, для которых выполняется кодирование;
■ целей кодирования;
■ алфавита кода, т.е. состава символов, применяемых при создании кодов;
■ структуры кода, т.е. состава и назначения отдельных разрядов кода.
Целями кодирования могут быть: применение компактной формы записи информации, в том числе для замены естественного языка искусственным; идентификация объектов; помехозащищенность и др.
Для машинной обработки кодирование выполняет важную функцию – представление информации в виде, удобном для обработки на ЭВМ. Объектом кодирования становится информация различной природы:
■ числовая информация, применяемая для вычислений;
■ текстовая информация, позволяющая представлять разнообразную алфавитно-цифровую информацию, символы псевдографики;
■ звуковая и видеоинформация, используемые в мультимедиа.
Расширение видов обрабатываемой информации, потребность в оптимизации систем хранения и обработки данных (по требуемым объемам, времени или стоимости обработки) ставит проблему разработки и совершенствования методов кодирования. Для информации различной природы разработаны системы кодирования, использующие представление в виде последовательности 0 и 1.
В значительной мере требования к кодированию информации обусловлены пользовательскими приложениями (задачами и запросами на обработку данных). В частности, объекты, для которых выполняется содержательная обработка (продукция, поставщики, ресурсы и т.п.), требуют однозначной идентификации; вместо длинного наименования объекта удобно использовать короткий код (идентификатор).
Для обеспечения надежности систем обработки данных, связанных с накоплением информации в БД, передачей информации по каналам связи, другими видами обработки данных и т.п., встает вопрос помехозащищенности кодов. Это достигается методами помехоустойчивого кодирования, реализуемыми аппаратными или программными средствами, выполнением операций обработки по кодированию-декодированию информации, обнаружению и даже автоматическому исправлению ошибок в коде.
В качестве алфавита машинного кода для представления в современный цифровых ЭВМ используется так называемый двоичный алфавит, содержащий символы 0 и 1. Для информации определенного типа выбирается система кодирования, которая определяет структуру кода – количество разрядов и их назначение.