2. Технические средства реализации информационных процессов - shikardos.ru o_O
Главная
Поиск по ключевым словам:
Похожие работы
2. Технические средства реализации информационных процессов - страница №2/7

Кодирование символов: ASCII, KOI8, UNICODE


Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

Варианты:
1. 30
2. 60
3. 120
4. 480”

Все, что мы видим на экране монитора — это символы. Для вывода каждого символа нужен машинный код, который будет соответствовать только этому символу, или же правило, организующее корректный вывод каждого символа на дисплей.

Попробуем прикинуть, сколько же нужно всего символов пользователю: для начала, 26 букванглийского алфавита (строчных), во-вторых, 26 прописных, пробел, 10 цифр, 9 знаков препинания (. , : ! " ; ? ( ) ), 5 арифметических действий (+, — ,*, /, ^) и спецсимволы (№ % _ # $, ^, &, >, <, |, \). В итоге, получаем немногим больше 100. Такой базовый наборсимволов легко закодировать в двоичной системе счисления от 0 до 127 (всего 128 позиций), что и было сделано.

ASCII


Для отображения всех этих символов была создана таблитца ASCII (англ. American StandardCode for Information Interchange) — американский стандартный код для обмена информацией; произносится [э́ски].

Изначально разработана как 7-битная, потомASCII стала восприниматься как 8-битная. Так выглядят таблицы ASCII-кодов с печатаемыми и непечатаемымисимволами (для удобства в таблицах приведены коды в шестнадцатеричной системе счисления).



Но скоро набора кодов стало не хватать. Возникла новая таблицакодировок,названная «расширенная таблица ASCII», числознакомест в которой возросло до 256. Таблица имела полностью восьмибитный код — Latin-1.

Дальнейшее развитие привело к появлению понятия «кодовая страница», т.е. набор из 256 символов для определениягруппы языков (например,некоторые славянские языки с латинским алфавитом, турецкий, мальтийский, эсперанто и т.д.), но она не позволяла смешивать языки, и к тому же, не могла создать кодовые страницы японского и китайского языков.

КОИ-8


KOI8 — восьмибитовая ASCII-совместимая кодовая страница, созданная для кодирования букв кириллических алфавитов.

В КОИ-8 символы русского алфавита поместили в верхнюю часть кодовой таблицы так, что позиции кириллических символов соответствуют их фонетическим аналогам в английскомалфавите в нижней части таблицы. Это значит, что убрав в тексте, написанном в КОИ-8, восьмой бит каждого символа, то получится текст, написанный латинскими символами. Например, слова «Кодировка» превратились бы в «kODIROVKA».


UNICODE


Юнико́д — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.

Это система кодирования символов, способная закодировать 1 114 112 символов (code points). Большинство символов, используемых в основных языках мира занимают 65 536 code points. Остальные (более миллиона) code pointsвполне достаточно длякодирования всех известных символов, включая даже исторические знаки и редкие языки. Стандарт UNICODEочень обширен, имеет три формы: 32-битную (UTF-32),16-битную (UTF-16) и 8-битную (UTF-8). Весьма распространенная восьмибитная форма UTF-8 была создана для удобной совместимости с ASCII-ориентироваными системами кодирования.



UNICODE содержит 96 382 символа, их более чем достатонно для общения на всех известных языках мира, а также для написания классических (исторических) шрифтов многих языков (например, европейский алфавит, средне-азиатское письмо, направленное справа на лево, шрифты Азии, и другие).

Решение примера. Вернемся к примеру, приведенному в начале.

При перекодировке в 8-битный код, каждый символ уменьшился в «объеме» в два раза (было16 бит — стало 8). Следовательно, и все сообщение (сумма кодов символов) тоже уменьшилось в 2 раза. Т.к. полученное сообщение стало меньше на 480 бит, то умножив его на 2, мы получим длину исходного. Это 960 бит.


Изначально кодировка была 16-битная, значит разделив исходную длину 960 бит на 16разрядов, получим кол-во символов960/16=60 символов (вариант 2).

Ответ:вариант 2 — 60 символов.

Логические операции


Каждая логическая связка рассматривается как операция над логическими высказываниями и имеет свое название и обозначение.

Выделяют следующие логические операции: инверсия; конъюнкция; дизъюнкция; импликация; эквиваленция.


1. Операция инверсия (отрицание):


Отрицание - это логическая операция, которая каждому простому высказыванию ставит в соответствие составное высказывание, заключающееся в том, что исходное высказывание отрицается.

Обозначается: ол

В естественном языке: соответствует словам "неверно, что..." и частице "не"

Диаграмма Эйлера-Венна:

Принимаемые значения: лрл

Диаграмма Эйлера-Венна:

В алгебре множеств логическому отрицанию соответствует операция дополнения до универсального множества, т.е. множеству получившемуся в результате отрицания множества соответствует множество, дополняющее его до универсального множества.














rectangle 52

Пример: Луна — спутник Земли (А). Луна — не спутник Земли (  A)


2. Операция конъюнкция (лат. conjunctio — соединение) (логическое умножение):


Конъюнкция - это логическая операция, ставящая в соответствие каждым двум простым высказываниям составное высказывание, являющееся истинным тогда и только тогда, когда оба исходных высказывания истинны.

Обозначается: ол

В естественном языке: соответствует союзу "и"

Принимаемые значения: лрл

Диаграмма Эйлера-Венна:

В алгебре множеств конъюнкции соответствует операция пересечения множеств, т.е. множеству получившемуся в результате умножения множеств А и В соответствует множество, состоящее из элементов, принадлежащих одновременно двум множествам.














rectangle 47

Примеры:

  1. 10 делится на 2 (A - и). 5 больше 3 (B - и). 10 делится на 2 и 5 больше 3 (A  B - и).

  2. 10 не делится на 2 (A - л). 5 больше 3 (B - и). 10 не делится на 2 и 5 больше 3 (A  B - л).

  3. 10 делится на 2 (A - и). 5 не больше 3 (B - л). 10 делится на 2 и 5 не больше 3 (A  B - л).

  4. 10 не делится на 2 (A - л). 5 не больше 3 (B - л). 10 делится на 2 и 5 больше 3 (A  B - л).


3. Операция дизъюнкция (лат. disjunctio — разделение) (логическое сложение):


Дизъюнкция - это логическая операция, которая каждым двум простым высказываниям ставит в соответствие составное высказывание, являющееся ложным тогда и только тогда, когда оба исходных высказывания ложны и истинным, когда хотя бы одно из двух образующих его высказываний истинно.

Обозначается: ол

В естественном языке: соответствует союзу "или"

Принимаемые значения: лрл

Диаграмма Эйлера-Венна:

В алгебре множеств дизъюнкции соответствует операция объединения множеств, т.е. множеству получившемуся в результате сложения множеств А и В соответствует множество, состоящее из элементов, принадлежащих либо множеству А, либо множеству В.














rectangle 39

Примеры:

  1. 10 делится на 2 (A - и). 5 больше 3 (B - и). 10 делится на 2 или 5 больше 3 (A  B - и).

  2. 10 не делится на 2 (A - л). 5 больше 3 (B - и). 10 не делится на 2 или 5 больше 3 (A  B - и).

  3. 10 делится на 2 (A - и). 5 не больше 3 (B - л). 10 делится на 2 или 5 не больше 3 (A  B - и).

  4. 10 не делится на 2 (A - л). 5 не больше 3 (B - л). 10 не делится на 2 или 5 не больше 3 (A  B - л).


4. Операция импликация (лат. лат. implico — тесно связаны) (логическое сложение):


Импликация - это логическая операция, ставящая в соответствие каждым двум простым высказываниям составное высказывание, являющееся ложным тогда и только тогда, когда условие (первое высказывание) истинно, а следствие (второе высказывание) ложно.

Обозначается: ол

В естественном языке: соответствует обороту "если ..., то ..."

Принимаемые значения: лрл

Примеры:

  1. Данный четырёхугольник — квадрат (A - и). Около данного четырёхугольника можно описать окружность (B - и). Если данный четырёхугольник квадрат, то около него можно описать окружность (A  B - и).

  2. Данный четырёхугольник — не квадрат (A - л). Около данного четырёхугольника можно описать окружность (B - и). Если данный четырёхугольник не квадрат, то около него можно описать окружность (A  B - и).

  3. Данный четырёхугольник — квадрат (A - и). Около данного четырёхугольника нельзя описать окружность (B - л). Если данный четырёхугольник квадрат, то около него можно описать окружность (A  B - л).

  4. Данный четырёхугольник — не квадрат (A - л). Около данного четырёхугольника нельзя описать окружность (B - л). Если данный четырёхугольник не квадрат, то около него нельзя описать окружность (A  B - и).



<< предыдущая страница   следующая страница >>