Скачать 0.74 Mb.
|
20.Представление и кодирование информацииЯзык как знаковая системаДля обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.)» то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов). Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка – слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически. Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса. Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам. Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе) и др. Представление информации может осуществляться с помощью языков, которые являются знаковыми системами. Каждая знаковая система строится на основе определенного алфавита и правил выполнения операций над знаками Знаки могут иметь различную физическую природу. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов). Кодирование информации Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером и так далее. Преобразование информации из одной формы представления (знаковой системы) в другую называется кодированием. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем. В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре происходит кодирование знака, то есть преобразование его в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс – декодирование, когда из компьютерного кода знак преобразуется в его графическое изображение. Кодирование – это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы. Алфавитный подход к измерению информации А теперь познакомимся с другим способом измерения информации. Этот способ не связывает количество информации с содержанием сообщения, и называется он алфавитным подходом. Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык. Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами. Полное количество символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54. В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле, каждый такой символ несет i бит информации, которое можно определить из решения уравнения: 2i = N. Для N=54, используя формулу i=log2 , получим: i=5,755 бит : Вот сколько информации несет один символ в русском тексте! А теперь для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на i. Возьмем с книжной полки какую-нибудь книгу и посчитаем количество информации на одной ее странице. Пусть страница содержит 50 строк. В каждой строке – 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит. Следовательно, при алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от размера текста (т.е. от числа знаков в тексте) и от мощности алфавита. Отсюда следует, например, что нельзя сравнивать информационные объемы текстов, написанных на разных языках, только по размеру текста. У них отличаются информационные веса одного символа т.к. мощности алфавитов различных языков – разные. Но если книги написаны на одном языке, то, с алфавитной точки зрения, в толстой книге информации больше, чем в тонкой. При этом содержательная сторона книги в расчет не берется. Сформулируем правило о том, как измерить информацию, используя для этого алфавитный подход. Количество информации, содержащееся в символьном сообщении, равно К х i, где К – количество символов в тексте сообщения, а i – информационный вес символа, который находится из уравнения 2i = N , где N – мощность используемого алфавита Применение алфавитного подхода удобно прежде всего при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые – старые», «понятные – непонятные» сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода. |
Учебник «Информатика и икт» Представление информации. Информация, информационные объекты различных видов. Язык как способ представления информации: естественные... | Конспект урока урок Измерение информации (алфавитный подход). Единицы... Тема и номер урока в теме: Измерение информации (алфавитный подход). Единицы измерения информации. Урок 5 | ||
Конспект для ученика, пк, программа- электронный калькулятор Wise... Количество информации как мера уменьшения неопределенности знаний. Методы измерения количества информации: вероятностный (содержательный),... | Учебного времени для 10 класса Измерение информации: содержательный и алфавитный подходы. Единицы измерения информации | ||
Конспект урока по информатике в 6 классе. Тема урока: Единицы измерения... Сформировать навыки структурирования текстовой информации с помощью маркированных списков | План-конспект урока Тема учебного занятия : Введение. Инструктаж... Образовательные: знакомство учащихся с единицами измерения информации, отработка навыков перевода одних единиц измерения информации... | ||
Программа по формированию навыков безопасного поведения на дорогах... Обобщение материала по теме “Измерение информации (алфавитный подход). Единицы измерения информации” | Программа по формированию навыков безопасного поведения на дорогах... Тема: " Измерение информации (алфавитный подход). Единицы измерения информации " (урок информатики в 10 б классе) | ||
Программа по формированию навыков безопасного поведения на дорогах... Единицы измерения количества и скорости передачи информации; принцип дискретного (цифрового) представления информации | Фгбоу впо «дагестанская государственная сельскохозяйственная академия имени м. М. Джамбулатова» Понятие количества информации: различные подходы. Единицы измерения количества информации | ||
Фгбоу впо «дагестанский государственный аграрный университет имени м. М. Джамбулатова» Понятие количества информации: различные подходы. Единицы измерения количества информации | Программа по формированию навыков безопасного поведения на дорогах... Информационные процессы в технике; количество информации как мера уменьшения неопределенности; единицы измерения информации | ||
Пояснительная записка требования к уровню подготовки обучающихся... Единицы измерения количества информации; принцип дискретного (цифрового) представления информации | Конспект урока измерение информации (алфавитный подход). Единицы... ... | ||
Программа по формированию навыков безопасного поведения на дорогах... Тема урока: Виды и свойства информации. Кодирование информации. Игра «Информация и мы» | Единицы измерения количества информации Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации... |