Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Представление символьной информации в ЭВМ






 

В отличии от обычной словесной формы, принятой в письменном виде, символьная информация хранится и обрабатывается в памяти ЭВМ в форме цифрового кода. Например, можно обозначить каждую букву числами, соответствующими ее порядковому номеру в алфавите: А – 01, Б – 02, В – 03, Г – 04, …, Э – 30, Ю – 31, Я – 32. Точно также можно договориться обозначать точку числом 33, запятую – 34 и т.д. Так как в устройствах автоматической обработки информации используются двоичные коды, то обозначения букв надо перевести в двоичную систему. Тогда буквы будут обозначаться следующим образом:

А – 000001

Б – 000010

В – 000011

Ю – 011111

Я – 100000

При таком кодировании любое слово можно представить в виде последовательности кодовых групп, составленных из нулей и единиц.

При преобразовании символов (знаков) в цифровой код между множествами символов и кодов должно иметь место взаимооднозначное соответствие, т.е. разным символам должны быть назначены разные цифровые коды и наоборот. Но существует также ряд практических соглашений, принимаемых при построении схемы преобразования исходя из соображений наглядности, эффективности, стандартизации. Например, какое бы число ни назначили для знака «0» (не путать с числом 0), знаку «1» удобнее назначить код, на единицу больший, чем код «0», и т.д. до знака «9». Также и для букв – А Б В и т.д.

Другим важным моментом при организации кодировки символьной информации является эффективное использование оперативной памяти ЭВМ. Так как общеупотребительными являются примерно 100 знаков (цифры, буквы англ. и рус. алфавита, знаки препинания, арифметич. знаки, символы перевода строки, возврата каретки, возврата на шаг и т.д.), то для взаимно-однозначного преобразования всех знаков в коды достаточно примерно сотни чисел. Значение этого выбора заключается в том, что для размещения числа из этого диапазона в оперативной памяти достаточно одного байта, а не машинного слова. Следовательно при такой организации кодировки достигается существенная экономия объема памяти.

При назначении кодов знакам надо также учитывать соглашения, касающиеся стандартизации кодировки.

 

IBM-совместимые компьютеры обрабатывают 256 различных символов, каждый из которых кодируется одним байтом.

Соответствие символов и байтов задается таблицей кодировки, в которой для каждого символа указывается соответствующий байт.

Символы с кодами от 0 до 127 построены по стандарту ASCII (A merican S tandard C ode for I nformation I nterchange - Американский стандартный код обмена информацией, читается " аски"). Вторая половина таблицы (коды 128... 255) в нашей стране содержит русские буквы (кириллицу) и символы псевдографики. Или коды в шестнадцатирич. виде: 00–77 – основные, 80-FF- расширенные

 

Коды 0...127 (кодировка ASCII)
0 1 2 3 4 5 6 7
      A   B C D   E F

Коды 128...255 (модифицированный альтернативный вариант)
8 9 A B C D E F
      A   B C D   E F

Для того, чтобы определить по этим таблицам код того или иного символа, нужно сложить номер строки с номером столбца, в которых он расположен. Так, код цифры 5 равен 05+048 = 053.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.