Санкт-Петербургский государственный университет Математико-механический факультет





Скачать 301.99 Kb.
НазваниеСанкт-Петербургский государственный университет Математико-механический факультет
страница2/6
Дата публикации17.07.2013
Размер301.99 Kb.
ТипДипломная работа
100-bal.ru > Информатика > Дипломная работа
1   2   3   4   5   6

Постановка задачи


В рамках данной дипломной работы были поставлены следующие задачи:

  1. Разработка алгоритма распознавания печатных символов на основе рандомизированного алгоритма типа стохастической оптимизации SPSA (Simultaneous Perturbation Stochastic Approximation) [1]

  2. Проектирование мобильной системы распознавания кассовых чеков

  3. Реализация прототипа распознавателя под мобильную платформу iOS

Обзор существующих подходов


Основная часть данной работы – распознавание текста с изображения. Этой задачей занимаются уже давно, и разработано немало эффективных алгоритмов. Точность распознавания лучших из них превышает 99%1.

С точки зрения способа получения данных можно выделить два класса распознавателей:

  • Online

  • Offline

Offline распознаватель – это распознаватель, который оперирует только с готовым изображением текста. Он не владеет информацией о процессе создания этого текста. Обычно, на вход такому распознавателю подается изображение с текстом и, возможно, дополнительные сведения о нем: вероятный язык, шрифт и т.п.

Online распознаватель, в отличие от offline, распознает текст в момент его написания. Обычно,online методы применяются для распознавания именно рукописного текста. Такой распознаватель получает дополнительную информацию:

  • Разрывность линий при письме

  • Порядок появления частей изображения

  • Направление ввода (слева направо, справа налево или иначе)

  • Скорость рисования отдельных элементов

Online распознаватели нередко применяются для обработки рукописного ввода пользователя и обычно делаются адаптивными - подстраивающимися под его почерк. Ранние версии2 рукописного ввода требовали от пользователя вводить символы определенным, заранее заданным способом.

Существующие системы распознавания


Одним из наиболее известных open-source проектов по распознаванию текста является разработанный компанией HP-Labs Tesseract-OCR [6]. В систему включены многие эвристики для сегментации текста. Непосредственно для распознавания применяется нейронная сеть, которую необходимо обучать для конкретных шрифтов. Tesseract-OCR можно использовать в качестве библиотеки распознавания в собственных приложениях. В частности, в задаче мобильной обработки чеков можно было бы либо распознавать изображение на серверной части, используя непосредственно Tesseract-OCR, либо портировать Tesseract-OCR на мобильную платформу.

Среди мобильных программ для распознавания текста можно выделить следующие:

  • Мобильные программы компании ABBYY [7]

  • Сервис MOCRT [8]

  • Google Goggles [9]

Мобильные программы компании ABBYY

Включают в себя программу для считывания визитных карточек, распознаватель текста и переводчик. Этот набор приложений прекрасно иллюстрирует основные сценарии использования распознавания текста с мобильного телефона. Одно из ключевых преимуществ – сильная словарная база, которая позволяет корректировать немногочисленные ошибки распознавания. Это не дает преимуществ при распознавании кодов и случайных наборов символов, но значительно увеличивает качество распознавания документов, для которых созданы данные приложения.

Кроме того можно приобрести лицензию на использование движка распознавания ABBYY Mobile OCR Engine и использовать разработанный компанией распознаватель в своих приложениях. В частности можно использовать такой подход в задаче мобильного распознавания чеков. Но это не является однократным приоббретением продукта – для использования движка необходимо регулярно оплачивать лицензию.

Сервис MOCRT


Mobile OCR Translation on-line. Сервис является примером примитивной реализации функционала автоматического перевода печатного текста с использованием мобильного телефона. Сценарий работы следующий:

  • Пользователь отправляет фотографию интересующей его страницы текста веб-сервису;

  • Страница распознается на сервере: из исходного изображения получается текст на исходном языке;

  • Распознанный текст передается сервису переводов translate.google.com;

  • Пользователю отпраляется результат перевода.

Все распознавание ведется с серверной стороны, а не на мобильном телефоне, который выступает лишь в роли загрузчика фотографий. Подобный подход применяется во многих мобильных сервисах распознавания.
1   2   3   4   5   6

Похожие:

Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский Государственный Университет Математико-механический факультет
Сергей Николаевич Кучер, проректор краевого государственного образовательного учреждения дополнительного профессионального образования...
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский государственный морской технический университет...
Рецензия на книгу: С. А. Остроумов "Биотический механизм самоочищения пресных и морских вод: элементы теории и приложения" (Москва,...
Санкт-Петербургский государственный университет Математико-механический факультет iconМатематико-механический факультет
Государственное образовательное учреждение высшего профессионального образования
Санкт-Петербургский государственный университет Математико-механический факультет icon«Санкт-Петербургский государственный университет» (СПбГУ) Исторический факультет утверждаю
Краснодарский государственный историко-археологический музей-заповедник им. Е. Д. Фелицына
Санкт-Петербургский государственный университет Математико-механический факультет iconОбзор современных систем управления бизнес-процессами
Агапова Татьяна, математико-механический факультет, 2 курс
Санкт-Петербургский государственный университет Математико-механический факультет iconПсихическое здоровье в Германии и России: Клиническая и исследовательская инициатива
Санкт-Петербургский научно-исследовательский Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет Математико-механический факультет iconМатематико-механический факультет asmpy ассемблер python compiled (*. pyc ) файлов
Государственное образовательное учреждение высшего профессионального образования
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-петербургский Государственный университет Восточный факультет Филиппов Е. А. Аннотация
Метадическая разработка интегрированного урока с использованием возможностей интерактивной доски
Санкт-Петербургский государственный университет Математико-механический факультет iconПравительство Российской Федерации Санкт Петербургский государственный...
Муниципальное автономное образовательное учреждение «Средняя общеобразовательная школа №21»
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский центр научно-технической информации «Прогресс»,...
Особенности размещения государственного заказа в связи с изменениями в федеральном
Санкт-Петербургский государственный университет Математико-механический факультет icon«Санкт-Петербургский государственный университет» (СПбГУ) Исторический факультет утверждаю
Учебно-методический комплекс по дисциплине «Биохимия молока и мяса» составлен на основе
Санкт-Петербургский государственный университет Математико-механический факультет iconПрограмма по формированию навыков безопасного поведения на дорогах...
Санкт-Петербургский Государственный Политехнический Университет, Факультет Иностранных Языков
Санкт-Петербургский государственный университет Математико-механический факультет iconРоссийской Федерации Санкт Петербургский государственный университет Физический факультет
Цель изучения дисциплины: Обучение магистрантов аналитическим методам анализа структуры и эволюции нелинейных полей
Санкт-Петербургский государственный университет Математико-механический факультет iconОсновная образовательная программа (ооп) бакалавриата, реализуемая...
«Санкт-Петербургский государственный университет телекоммуникаций им проф. М. А. Бонч-Бруевича» (СПбгут) по направлению подготовки...
Санкт-Петербургский государственный университет Математико-механический факультет iconОсновная образовательная программа (ооп) бакалавриата, реализуемая...
«Санкт-Петербургский государственный университет телекоммуникаций им проф. М. А. Бонч-Бруевича» (СПбгут) по направлению подготовки...
Санкт-Петербургский государственный университет Математико-механический факультет iconСанкт-Петербургский государственный университет Факультет философии и политологии
Контрольная работа по дисциплине «Культура речи и деловое общение» является допуском студента заочной формы обучения к зачету


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск