Санкт-Петербургский государственный университет Математико-механический факультет





Скачать 301.99 Kb.
НазваниеСанкт-Петербургский государственный университет Математико-механический факультет
страница4/6
Дата публикации17.07.2013
Размер301.99 Kb.
ТипДипломная работа
100-bal.ru > Информатика > Дипломная работа
1   2   3   4   5   6

Теоретическая часть


Распознавание информации с чека включает в себя 3 этапа:

  • Сегментация текста

  • Распознавание символов

  • Формирование данных


Сегментация текста


Сегментация текста заключается в удалении фона изображения, разбиении его на строки и на символы. На этом этапе из изображения выделяются фрагменты, содержащие изображения символов.

Каждый полученный на этапе сегментации символ распознается, после чего из распознанных строк формируются данные, извлекаемые из документа. В задаче распознавания чеков они представляют собой сведения о покупках, магазине и пр.

Выделение границ символа из изображения чека делится на четыре этапа:

  1. Выделение изображения непосредственно чека (кадрирование изображения)

  2. Разбиение полученного изображения на строки (горизонтальная сегментация)

  3. Выделение левой и правой части строк (если присутствует явное разделение)

  4. Разбиение участков строки на символы

Выделение изображения непосредственно чека

На входе разрабатываемой системы имеется изображение, большую часть которого занимает чек. Возможно подключение предобработки изображения, включающей в себя ручное выделение границ чека, для более точного результата работы системы. В автоматическом режиме система оценивает расположение чека исходя из эвристики, что вне чека фон темный и однородный. Для этого изображение приводится к чернобелому, затем бинаризуется, исходя из средней яркости изображения: пиксели, яркость которых ниже средней устанавливаются в 1, а пиксели, яркость которых выше средней – в 0.



Рис.1 Бинаризация изображения. Слева – исходное изображение, справа – его бинарное представлениеd:\university\diplom\images\check_small.jpg
d:\university\diplom\images\ckeck_bw.bmp


Для выделения фона вводится понятие связности точек:

Две точки называются непосредственно связными, если расстояние между ними не более одного пикселя, и их значения4 совпадают. Другими словами, точки, непосредственно связные с фиксированной точкой – это те точки из ее восьми соседних, у которых значение совпадает со значением в этой точке.

Свойство связности – транзитивное замыкание непосредственной связности.

Связная область с центром в точке А – это множество всех точек, связных с точкой А.d:\university\diplom\images\connected_area_1.bmp
d:\university\diplom\images\connected_area_2.bmp


Рис.2 Связные области. На изображении слева красным выделена точка А. На изображении справа красным выделена область с центром в точке А

Для удаления фона обнуляются значения всех точек из областей, связанных с угловыми точками изображения. После этого удаляются все крайние столбцы и строки изображения, не содержащие ненулевых точек.

Рис.3 Удаление фона. Слева на изображении красным цветом выделены области, связные с угловыми точками изображения, Справа приведено изображение после удаления фона.d:\university\diplom\images\ckeck_bw_background.bmp
d:\university\diplom\images\ckeck_bw_background_removed.bmp


Изучение существующих образцов кассовых чеков и механизмов их построения выявило, что несмотря на различия между различными кассовыми аппаратами, все чеки имеют четко выделенные строки, т.е. можно определить глобальное для всего изображения разделение на строки.

Горизонтальная сегментация заключается в выделении из изображения текста изображений его строк. Для этого строится горизонтальная гистограмма5. Для выделения строк необходимо обнаружить пропуски между ними. Такие пропуски соответствуют нулям либо минимальным значениям гистограммы. Критерием разделителя строк могут быть две подряд идущие строки со значением горизонтальной гистограммы ниже порога.

Рис.4 Строка после горизонтальной сегментацииd:\university\diplom\images\one_line_good.bmp


Для последующего разбиения строк на символы используется вертикальная гистограмма6: ее минимумам соответствуют границы между словами и между символами внутри одного слова в зависимости от сохранения гистограммой минимального значения в последующих точках. d:\university\diplom\images\parsed line.bmp


Рис.5 Результат вертикальной сегментации. Сверху – символы левой половины чека. Снизу - правой
1   2   3   4   5   6

Похожие:

Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский Государственный Университет Математико-механический факультет
Сергей Николаевич Кучер, проректор краевого государственного образовательного учреждения дополнительного профессионального образования...
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский государственный морской технический университет...
Рецензия на книгу: С. А. Остроумов "Биотический механизм самоочищения пресных и морских вод: элементы теории и приложения" (Москва,...
Санкт-Петербургский государственный университет Математико-механический факультет iconМатематико-механический факультет
Государственное образовательное учреждение высшего профессионального образования
Санкт-Петербургский государственный университет Математико-механический факультет icon«Санкт-Петербургский государственный университет» (СПбГУ) Исторический факультет утверждаю
Краснодарский государственный историко-археологический музей-заповедник им. Е. Д. Фелицына
Санкт-Петербургский государственный университет Математико-механический факультет iconОбзор современных систем управления бизнес-процессами
Агапова Татьяна, математико-механический факультет, 2 курс
Санкт-Петербургский государственный университет Математико-механический факультет iconПсихическое здоровье в Германии и России: Клиническая и исследовательская инициатива
Санкт-Петербургский научно-исследовательский Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет Математико-механический факультет iconМатематико-механический факультет asmpy ассемблер python compiled (*. pyc ) файлов
Государственное образовательное учреждение высшего профессионального образования
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-петербургский Государственный университет Восточный факультет Филиппов Е. А. Аннотация
Метадическая разработка интегрированного урока с использованием возможностей интерактивной доски
Санкт-Петербургский государственный университет Математико-механический факультет iconПравительство Российской Федерации Санкт Петербургский государственный...
Муниципальное автономное образовательное учреждение «Средняя общеобразовательная школа №21»
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский центр научно-технической информации «Прогресс»,...
Особенности размещения государственного заказа в связи с изменениями в федеральном
Санкт-Петербургский государственный университет Математико-механический факультет icon«Санкт-Петербургский государственный университет» (СПбГУ) Исторический факультет утверждаю
Учебно-методический комплекс по дисциплине «Биохимия молока и мяса» составлен на основе
Санкт-Петербургский государственный университет Математико-механический факультет iconПрограмма по формированию навыков безопасного поведения на дорогах...
Санкт-Петербургский Государственный Политехнический Университет, Факультет Иностранных Языков
Санкт-Петербургский государственный университет Математико-механический факультет iconРоссийской Федерации Санкт Петербургский государственный университет Физический факультет
Цель изучения дисциплины: Обучение магистрантов аналитическим методам анализа структуры и эволюции нелинейных полей
Санкт-Петербургский государственный университет Математико-механический факультет iconОсновная образовательная программа (ооп) бакалавриата, реализуемая...
«Санкт-Петербургский государственный университет телекоммуникаций им проф. М. А. Бонч-Бруевича» (СПбгут) по направлению подготовки...
Санкт-Петербургский государственный университет Математико-механический факультет iconОсновная образовательная программа (ооп) бакалавриата, реализуемая...
«Санкт-Петербургский государственный университет телекоммуникаций им проф. М. А. Бонч-Бруевича» (СПбгут) по направлению подготовки...
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский государственный университет Факультет философии и политологии
Контрольная работа по дисциплине «Культура речи и деловое общение» является допуском студента заочной формы обучения к зачету


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск