Конспект по теме: «Кодирование текстовой, графической и звуковой информации»





Скачать 352.81 Kb.
НазваниеКонспект по теме: «Кодирование текстовой, графической и звуковой информации»
страница1/4
Дата публикации01.10.2013
Размер352.81 Kb.
ТипКонспект
100-bal.ru > Информатика > Конспект
  1   2   3   4

powerpluswatermarkobject3Конспект по теме: «Кодирование текстовой, графической и звуковой информации»

Учитель информатики Батракова Л.В

.

Для удобства представления информации в компьютере все возможные виды информации переводятся в числовую форму, и эти числа хранятся в компьютере в двоичном виде, т.е. кодируются.

Кодирование информации — процесс преобразования информации из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической переработки.

Кодирование текстовой информации



Для записи текстовой (знаковой) информации всегда используется какой-либо язык (естественный или формальный).

Всё множество используемых в языке символов называется алфавитом. Полное число символов алфавита N называют его мощностью. При записи текста в каждой очередной позиции может появиться любой из N символов алфавита, т.е. может произойти N событий. Следовательно, каждый символ алфавита содержит i бит информации, где i определяется из неравенства (формула Хартли):    2i  N. Тогда общее количество информации в тексте определяется формулой:

V = k * i , 

где V – количество информации в тексте; k – число знаков в тексте (включая знаки препинания и даже пробелы),  i- количество бит, выделенных на кодирование одного знака.

Так как каждый бит – это 0 или 1, то любой текст может быть представлен последовательностью нулей и единиц. Именно так  текстовая информация хранится в памяти компьютера. Присвоение символу алфавита конкретного двоичного кода - это вопрос соглашения, зафиксированного в кодовой таблице. В настоящее время широкое распространение получили кодовые таблицы ASCII и Unicode.

ASCII (American Standart Code for Informational Interchange - Американский стандартный код информационного обмена) используется достаточно давно. Для хранения кода одного символа выделено 8 бит, следовательно, кодовая таблица поддерживает до 28 = 256символов. Первая половина таблицы (128 символов) - управляющие символы, цифры и буквы латинского алфавита. Вторая половина отводится под символы национальных алфавитов. К сожалению, в настоящее время существует целых пять вариантов кодовых таблиц для русских букв (КОИ-8, Windows-1251, ISO, DOS,MAC), поэтому тексты созданные в одной кодировке неверно отображаются в другой. (Наверное, Вы встречали русскоязычные сайты, тексты которых выглядят как бессмысленный набор знаков?).

Unicode - получил распространение в последние годы. Для хранения кода одного символа выделено 16 бит, следовательно, кодовая таблица поддерживает до 216 = 65536 символов. Такого пространства достаточно, чтобы в одном стандарте объединить все "живые" официальные (государственные) письменности. Кстати, стандарт ASCII вошел в состав Unicode.
Если кодирование – это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите), то декодирование – обратный перевод.

При кодировании один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот – несколько символов исходного сообщения заменяются одним символом в новом коде (китайские иероглифы обозначают целые слова и понятия), поэтому кодирование может быть равномерное и неравномерное. При равномерном кодировании все символы кодируются кодами равной длины, при неравномерном кодировании разные символы могут кодироваться кодами разной длины, что затрудняет декодирование.

Закодированное сообщение можно однозначно декодировать с начала, если выполняется условие Фано: никакое кодовое слово не является началом другого кодового слова. Закодированное сообщение можно однозначно декодировать с конца, если выполняется обратное условие Фано: никакое кодовое слово не является окончанием другого кодового слова. Условие Фано – это достаточное, но не необходимое условие однозначного декодирования.
Решение задач на кодирование текстовой информации
1.Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 20 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения? В ответе запишите только число.

Решение:

  1. при 16-битной кодировке объем сообщения – 16*20 бит

  2. когда его перекодировали в 8-битный код, его объем стал равен– 8*20 бит

  3. таким образом, сообщение уменьшилось на 16*20 – 8*20 = 8*20 = 160 бит

Ответ: 160
2. Определите информационный объем текста в битах

Бамбарбия! Кергуду!

Решение:

  1. в этом тексте 19 символов (обязательно считать пробелы и знаки препинания)

  2. если нет дополнительной информации, считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка 8- или 16-битная), поэтому в сообщении 19*8 = 152 бита информации

Ответ: 152
3. В таблице ниже представлена часть кодовой таблицы ASCII:

Символ

1

5

A

B

Q

a

b

Десятичный код

49

53

65

66

81

97

98

Шестнадцатеричный код

31

35

41

42

51

61

62

Каков шестнадцатеричный код символа «q»?

Решение:

  1. в кодовой таблице ASCII все заглавные латинские буквы A-Z расставлены по алфавиту, начиная с символа с кодом 65=4116

  2. все строчные латинские буквы a-z расставлены по алфавиту, начиная с символа с кодом 97=6116

  3. отсюда следует, что разница кодов букв «q» и «a» равна разнице кодов букв «Q» и «A», то есть, 5116 – 4116=1016

  4. тогда шестнадцатеричный код символа «q» равен коду буквы «a» плюс 1016

  5. отсюда находим 6116 + 1016=7116.

Ответ: 71
4. Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А–00, Б–010, В–011, Г–101, Д–111. Можно ли сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно? Коды остальных букв меняться не должны. Выберите правильный вариант ответа.

1) для буквы Б – 01 2) это невозможно

3) для буквы В – 01 4) для буквы Г – 01
Решение (1 способ - проверка условий Фано):

  1. для однозначного декодирования достаточно, чтобы выполнялось одно из условий Фано: прямое или обратное условие Фано;

  2. проверяем последовательно варианты 1, 3 и 4; если ни один из них не подойдет, придется выбрать вариант 2 («это невозможно»);

  1. проверяем вариант 1: А–00, Б–01, В–011, Г–101, Д–111.

«прямое» условие Фано не выполняется (код буквы Б совпадает с началом кода буквы В);

«обратное» условие Фано не выполняется (код буквы Б совпадает с окончанием кода буквы Г); поэтому этот вариант не подходит;

  1. проверяем вариант 3: А–00, Б–010, В–01, Г–101, Д–111.

«прямое» условие Фано не выполняется (код буквы В совпадает с началом кода буквы Б);

«обратное» условие Фано не выполняется (код буквы В совпадает с окончанием кода буквы Г); поэтому этот вариант не подходит;

  1. проверяем вариант 4: А–00, Б–010, В–011, Г–01, Д–111.

«прямое» условие Фано не выполняется (код буквы Г совпадает с началом кодов букв Б и В); но «обратное» условие Фано выполняется (код буквы Г не совпадает с окончанием кодов остальных буквы); поэтому этот вариант подходит;

Ответ: 4

Решение (2 способ, дерево):

  1. построим двоичное дерево, в котором от каждого узла отходит две ветки, соответствующие выбору следующей цифры кода – 0 или 1; разместим на этом дереве буквы А, Б, В, Г и Д так, чтобы их код получался как последовательность чисел на рёбрах, составляющих путь от корня до данной буквы (красным цветом выделен код буквы В – 011):



  1. здесь однозначность декодирования получается за счёт того, что при движении от корня к любой букве в середине пути не встречается других букв (выполняется условие Фано);

  2. теперь проверим варианты ответа: предлагается перенести одну из букв, Б, В или Г, в узел с кодом 01, выделенный синим цветом

  3. видим, что при переносе любой из этих букв нарушится условие Фано; например, при переносе буквы Б в синий узел она оказывается на пути от корня до В, и т.д.; это значит, что предлагаемые варианты не позволяют выполнить прямое условие Фано

  4. хочется уже выбрать вариант 2 («это невозможно»), но у нас есть еще обратное условие Фано, для которого тоже можно построить аналогичное дерево, в котором движение от корня к букве дает её код с конца (красным цветом выделен код буквы В – 011, записанный с конца):



видно, что обратное условие Фано также выполняется, потому что на пути от корня к любой букве нет других букв

  1. в заданных вариантах ответа предлагается переместить букву Б, В или Г в синий узел; понятно, что Б или В туда перемещать нельзя – перемещённая буква оказывается на пути от корня к букве Г; а вот букву Г переместить можно, при этом обратное условие Фано сохранится

Ответ: 4
5. Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приёмной стороне канала связи. Использовали код: А–1, Б–000, В–001, Г–011. Укажите, каким кодовым словом должна быть закодирована буква Д.. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования.

1) 00 2) 01 3)11 4) 010

Решение:

  1. заметим, что для известной части кода выполняется условие Фано – никакое кодовое слово не является началом другого кодового слова

  2. если Д = 00, такая кодовая цепочка совпадает с началом Б = 000 и В = 001, невозможно однозначно раскодировать цепочку 000000: это может быть ДДД или ББ; поэтому первый вариант не подходит

  3. если Д = 01, такая кодовая цепочка совпадает с началом Г = 011, невозможно однозначно раскодировать цепочку 011: это может быть ДА или Г; поэтому второй вариант тоже не подходит

  4. если Д = 11, условие Фано тоже нарушено: кодовое слово А = 1 совпадает с началом кода буквы Д, невозможно однозначно раскодировать цепочку 111: это может быть ДА или ААА; третий вариант не подходит

  5. для четвертого варианта, Д = 010, условие Фано не нарушено;

Ответ: 4.
6. Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11, соответственно). Если таким способом закодировать последовательность символов БАВГ и записать результат шестнадцатеричным кодом, то получится

1) 4B16 2) 41116 3)BACD16 4) 102316
Решение:

  1. из условия коды букв такие: A – 00, Б –01, В – 10 и Г – 11, код равномерный;

  2. последовательность БАВГ кодируется так: 01 00 10 11 = 1001011

разобьем такую запись на тетрады справа налево и каждую тетраду переведем в шестнадцатеричную систему (то есть, сначала в десятичную, а потом заменим все числа от 10 до 15 на буквы A, B, C, D, E, F); получаем 1001011 = 0100 10112 = 4B16

Ответ: 1
7. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых – из трех): A – 000, B – 01, C – 100, D – 10, E – 011. Определить, какой набор букв закодирован строкой - 0110100011000?

1) EBCEA 2) BDDEA 3) BDCEA 4) EBAEAРешение (вариант 1, декодирование с начала):

  1. здесь используется неравномерное кодирование, при котором декодирование может быть неоднозначным, то есть, заданному коду может соответствовать несколько разных исходных сообщений;

  2. попробуем декодировать с начала цепочки, первой буквой может быть B или E, эти случаи нужно рассматривать отдельно;

  3. пусть первая буква – E с кодом 011, тогда остается цепочка 0100011000

  • для кода 0100011000 первой буквой может быть только B с кодом 01, тогда остается 00011000 ( начало исходной цепочки – EB?)

  • для кода 00011000 первой буквой может быть только A с кодом 000, тогда остается 11000, а эта цепочка не может быть разложена на заданные коды букв

  • поэтому наше предположение о том, что первая буква – E, неверно

  1. пусть первая буква – B с кодом 01, тогда остается цепочка 10100011000

  • для кода 10100011000 первой буквой может быть только D с кодом 10, тогда остается 100011000 (можно полагать, что начало исходной цепочки – BD?)

  • для кода 100011000 первой буквой может быть только С с кодом 100, тогда остается 011000 (начало исходной цепочки – BDC?)

Несмотря на то, что среди ответов есть единственная цепочка, которая начинается с BDC, здесь нельзя останавливаться, потому что «хвост» цепочки может «не сойтись»

  • для кода 011000 на первом месте может быть B (код 01) или E (011); в первом случае «хвост» 1000 нельзя разбить на заданные коды букв, а во втором – остается код 000 (буква А), поэтому исходная цепочка может быть декодирована как BDCEA

Ответ: 3

Решение (вариант 2, декодирование с конца):

  1. для кода 0110100011000 последней буквой может быть только А (код 000), тогда остается цепочка 0110100011

  2. для 0110100011 последней может быть только буква E (011), тогда остается цепочка 0110100

  3. для 0110100 последней может быть только буква C (100), тогда остается цепочка 0110

  4. для 0110 последней может быть только буква D (10), тогда остается 01 – это код буквы B

  5. таким образом, получилась цепочка BDCEA

Ответ: 3

Решение (вариант 3, кодирование ответов):

  1. в данном случае самое простое и надежное – просто закодировать все ответы, используя приведенную таблицу кодов, а затем сравнить результаты с заданной цепочкой

  2. получим

1) EBCEA – 01101100011000 2) BDDEA – 011010011000

3) BDCEA – 0110100011000 4) EBAEA – 01101000011000

  1. сравнивая эти цепочки с заданной, находим, что правильный ответ – 3.

Ответ: 3
8. Для передачи чисел по каналу с помехами используется код проверки четности. Каждая его цифра записывается в двоичном представлении, с добавлением ведущих нулей до длины 4, и к получившейся последовательности дописывается сумма её элементов по модулю 2 (например, если передаём 23, то получим последовательность 0010100110). Определите, какое число передавалось по каналу в виде 01010100100111100011?

1) 59143 2) 5971 3) 102153 4) 10273

Решение:

  1. сначала разберемся, как закодированы числа в примере; очевидно, что используется код равномерной длины; поскольку 2 знака кодируются 10 двоичными разрядами (битами), на каждую цифру отводится 5 бит, то есть 2 → 00101 и 3 → 00110

  2. как следует из условия, четыре первых бита в каждой последовательности – это двоичный код цифры, а пятый бит (бит четности) используется для проверки и рассчитывается как «сумма по модулю два», то есть остаток от деления суммы битов на 2; тогда:

2 = 00102, бит четности (0 + 0 + 1 + 0) mod 2 = 1

3 = 00112, бит четности (0 + 0 + 1 + 1) mod 2 = 0

  1. но бит четности нам совсем не нужен, важно другое: пятый бит в каждой пятерке можно отбросить!

  2. разобъем заданную последовательность на группы по 5 бит в каждой:

01010, 10010, 01111, 00011.

  1. отбросим пятый (последний) бит в каждой группе:

0101, 1001, 0111, 0001.

это и есть двоичные коды передаваемых чисел:

01012 = 5, 10012 = 9, 01112 = 7, 00012 = 1.

  1. таким образом, были переданы числа 5, 9, 7, 1 или число 5971.

Ответ: 2
  1   2   3   4

Добавить документ в свой блог или на сайт

Похожие:

Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconУрок на тему: Кодирование звуковой информации
Учитель: Здравствуйте, мы с вами уже изучили представление текстовой, числовой и графической информации в компьютере. А какие еще...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconУрока: Кодирование текстовой информации первый урок по теме «Кодирование информации»
Место работы: муниципальное общеобразовательное учреждение «Тарасковская средняя общеобразовательная школа»
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconПрограмма по формированию навыков безопасного поведения на дорогах...
Тема урока: Кодирование текстовой информации. (Второй урок по теме «Кодирование информации»)
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconУрок по теме «Кодирование графической информации»
Рассмотреть метод кодирования графической информации – дискретизация; ввести базовые понятия компьютерной графики
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconБазовые понятия информатики и информационных технологий Информация и информационные процессы
Дискретное (цифровое) представление текстовой, графической, звуковой информации и видеоинформации. Скорость передачи информации....
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconРеферат по дисциплине: информатика и икт на тему: «Многообразие кодов»
В данной исследовательской работе рассматриваются особенности кодирования информации на компьютере. Остановимся на особенностях кодирования...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconКонспект урока Тема урока: «Кодирование и обработка звуковой информации»
Цели: образовательная обеспечить формирование и использование учащимися знаний о кодировании звуковой информации с помощью компьютера,...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconПрограмма по формированию навыков безопасного поведения на дорогах...
На прошлых уроках мы говорили о кодирование числовой и текстовой информации в памяти компьютера. Сегодня мы обсудим способы компьютерного...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconУрок игра. Цели: 1 Образовательная: провести обобщающее повторение...
Зунов, полученных в учащимися после изучения тем «Кодирование числовой информации», «Кодирование символьной информации», «Кодирование...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconТекст, звук, видеоизображение, графическое изображение и анимацию(мультипликацию)
Иными словами, мультимедиа это совокупность аппаратных и программных средств, позволяющая пользователю одновременно использовать...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconТематическое планирование с определением основных видов учебной деятельности №
Зачетная работа по теме «Кодирование и обработка графической и мультимедийной информации»
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconПрограмма по формированию навыков безопасного поведения на дорогах...
Цель урока: Сформировать новые знания и умения по теме «Кодирование звуковой информации»
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconКонспект урока по ивт в 9 классе «Кодирование текстовой информации»
...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconПрограмма элективного курса по информатике и икт «Создание Web-сайтов»
Умение представлять информацию в виде, удобном для восприятия и использования другими людьми – одно из условий образовательной компетентности...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconПрограмма по формированию навыков безопасного поведения на дорогах...
Технологическая карта урока информатики в 9 классе по теме «Повторение темы «Кодирование и обработка графической и мультимедийной...
Конспект по теме: «Кодирование текстовой, графической и звуковой информации» iconДвоичное кодирование звуковой информации
Еще одним источником информации, использованным при написании данных материалов, послужили несколько подробных популярных статей...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск