Реферат Объем работы





Скачать 261.33 Kb.
НазваниеРеферат Объем работы
страница2/7
Дата публикации24.11.2017
Размер261.33 Kb.
ТипРеферат
100-bal.ru > Информатика > Реферат
1   2   3   4   5   6   7

Введение



Многие пользователи Интернета встречались с такой проблемой, как поиск интересной, актуальной информации. Зачастую этот процесс отнимает немало времени, чтобы найти именно то, что нужно. Автоматизация процесса веб-сёрфинга, с фильтрацией контента от неподходящей информации весьма интересная и нетривиальная задача.

Все сервисы желают достичь успеха в своей сфере, отсюда цель каждой компании узнать, что хочет их пользователь, что понравиться именно ему. Для этой цели используются рекомендательные системы, которые выявляют предпочтения пользователей, и на их основе рекомендуют своим покупателям товары, услуги или контент, которые могут понравиться именно ему.

Однако, многие рекомендательные системы сталкиваются с проблемой “холодного старта”, ситуацией, когда в системе появляется новый пользователей, и нет никакой информации о том, что ему нравится. Во избежание данной проблемы отсутствия начальных данных, будет использоваться профиль социальной сети “ВКонтакте”. На сегодняшний день социальные сети являются частью жизни огромного количества людей, а Россия занимает первое место в мире по времени, проводимому в социальных сетях, что подтверждает их популярность.

Целью выпускной квалификационной работы является разработка мультиагентной системы для анализа интересов пользователя по данным из профиля социальной сети “ВКонтакте” (название «EZSurf»), которая направлена на автоматизацию процесса веб-сёрфинга с фильтрацией контента.

Для достижения данной цели необходимо решить следующие задачи:

  1. Провести анализ предметной области;

  2. Выполнить проектирование системы;

  3. Разработать базу данных;

  4. Разработать клиентское приложение, с помощью которого пользователи смогут взаимодействовать с системой;

  5. Разработать агента для сбора данных из профиля “ВКонтакте”;

  6. Разработать агента, который анализирует полученные данные и на их основе создает список схожих объектов для дальнейшего поиска рекомендаций;

  7. Разработать агента для индексации веб страниц и сбора на них рекомендованного контента.

Анализ предметной области

Анализ объекта автоматизации



В век информационных технологий, если человеку необходимо найти какую-то информацию, например, почитать новости, он прибегает к помощи сети Интернет, а не идет покупать газету. Процесс поиска в Интернете необходимой или просто интересной информации, так называемый веб-сёрфинг, зачастую отнимает немало времени. А если у человека еще и несколько интересов, то этот показатель вырастет в разы.

Обычно, описанный выше процесс происходит следующим образом: пользователь вводит запрос в поисковую систему, в ответ на который, как бы хорошо не был сформирован этот запрос, получает множество страниц; затем, он просто начинает переходить с одной страницы на другую в поисках нужной информации. Этот процесс может происходить в цикле до тех пор пока человек не найдет то, что его интересует. Ниже представлено схематичное описание этого процесса:
c:\users\123\downloads\web_serfing.jpg

Рисунок 1. Процесс веб-сёрфинга.

Целью данной работы является именно автоматизация процесса веб-сёрфинга.

Анализ информационных технологий по направлению разработки



Для того чтобы автоматизировать процесс веб-сёрфинга необходимо понимать, что же интересует каждого отдельного пользователя, его увлечения, то, что он мог бы искать в Интернете. Проблемами выявления предпочтений пользователей занимается такая область информационных технологий как рекомендательные системы [6].

На данный момент существует несколько основных алгоритмов рекомендательных систем, однако, как правило, для большинства случаев нет универсального алгоритма, и всё зависит от поставленной задачи и ее особенностей. К известным алгоритмам относятся:


  1. Коллаборативная фильтрация

Метод построения рекомендательных систем, основанный на предположении о том, что пользователям со схожими оценками к предметам, просмотренным ранее, будет нравиться одно и то же в будущем. Группа пользователей наиболее схожая по интересам с активным, называется “соседями” [1][6].

  1. Фильтрация содержимого

При данном подходе каждому пользователю создается профиль в системе, который хранит историю его оценок объектам этой системы. Система выдает пользователю предметы схожие с теми, которые ему понравились в прошлом [6].

  1. Гибридные рекомендательные системы

Гибридные системы строятся с использованием комбинации подходов перечисленных выше. Такие системы направлены на то, чтобы компенсировать недостатки одного подхода, внедрением другого[6].


Рисунок 2. Виды рекомендательных систем [13].
Однако каждый из подходов обладает некоторыми недостатками, которые могут помешать при выполнении поставленной задачи. К примеру, рекомендательные системы, использующие метод коллаборативной фильтрации зачастую сталкиваются с проблемой “холодного старта”, ситуацией, когда в системе появляется новый пользователей, и нет никакой информации о том, что ему нравится [7]. Во избежание данной проблемы отсутствия начальных данных, будет использоваться профиль социальной сети “ВКонтакте”. Но, проблема “холодного старта” не уходит полностью, поскольку возможна ситуация, когда профиль пользователя будет пустым. Однако, главная проблема в том, что сбор данных будет производиться через профиль “ВКонтакте”, и возникает сложность определения “соседей”, что делает использование коллаборативного подхода невозможным.

Что же касается подхода основанного на данных, здесь возникает проблема отсутствия в разрабатываемой системе профилей, потому что пользователи заходят через профиль “ВКонтакте”. Однако, почему бы не использовать профиль “ВКонтакте”, как основу рекомендательной системы, который будет использоваться не только во избежание проблемы “холодного старта”, но и как историю его активности в данной системе. Таким образом, решено было остановиться на подходе фильтрации содержимого, с небольшими доработками, но как уже было сказано выше, не бывает уникального алгоритма, всё зависит от поставленной задачи.

Данный проект будет иметь клиент-серверную архитектуру, с целью оптимального распределения нагрузки и для ее реализации, рассматривалось несколько языков программирования.

C#

Для написания клиента с помощью C# можно было бы использовать Windows Forms, встроенные в Microsoft Visual Studio. Windows Forms представляет собой технологию, используемую в Visual C# для создания интеллектуальных клиентских приложений на основе Windows, выполняемых в среде .NET Framework. Технология Windows Forms специально создана для быстрой разработки приложений, в которых обширный графический пользовательский интерфейс не является приоритетом [5]. Серверный компонент можно было бы разработать с использованием технологии ASP.NET . Однако, есть один нюанс, когда дело дойдет до выбора инструмента для разработки агентов. Для C# не было найдено ни одной библиотеки или фреймворка, для выполнения данного рода задач [14].

Python

Язык программирования Python прекрасно подходил по всем параметрам для выполнения поставленых задач, но опять же не подходит из-за, того что стоит задача проектирования и реализации мультиагентной системы. Во всех инструментах для языка Python, позволяющих реализовать мультиагентную архитектуру отсутствует возможность создания систем агентов, способных интегрировать в Windows-приложения [9].

В итоге в качестве языка программирования для реализации обоих компонентов архитектуры был выбран язык Java. На это есть несколько причин:

  1. Высокая производительность приложений написанных на Java;

  2. Кроссплатформенность;

  3. Бесплатность;

  4. Большое количество библиотек;

  5. Надежность.

Выбор языка во многом определил и выбор других технологий. Для реализации клиента выбор стоял между JavaFX, и Java Swing. Обе библиотеки используются для создания интерфейсов приложений. Однако, определяющий стало быстродействие и возможности каждой из библиотек. В то время как Java Swing позволяет создавать приложения со строгими типичными интерфейсами, JavaFX, обладая большим количеством графических компонентов, позволяет строить унифицированные приложения, обладающие богатым графическим интерфейсом пользователя, которые могут быть запущены как непосредственно из-под операционных систем, так и в браузерах и на мобильных телефонах. Самым важным стало наличие в JavaFX удобных компонентов и библиотек для работы с вебом [12].

Для реализации агентов на Java существует наибольшее количество инструментов для создания агентов, что также повлияло на выбор этого языка. В ходе выбора инструмента для разработки агентов были рассмотрены такие библиотеки как - Java Application Development Environment (JADE), Framework for Agent-based MOdeling with Java (FAMOJA) и Java Agent-based Simulation library (JAS). Так как, данный проект - это первая случай разработки агентов, выбор библиотеки происходил по принципу наличия понятной, подробной документации и примеров. Все три упомянутых выше библиотеки имеют это в своем арсенале, и каждая из них имеет GUI для управления агентами. Выбор был сделан в пользу JADE, только по причине наличия еще и книги посвященной разработке мультиагентных систем с помощью данной библиотеки – “Developing Multi-Agent Systems with JADE” [2].

1   2   3   4   5   6   7

Похожие:

Реферат Объем работы iconРеферат курсовой работы «аккумулирование радионуклидов растениями лесных фитоценозов»
Объем работы: общий объем работы составляет 30 печатных страниц, содержит 4 таблицы, список использованных источников составляет...
Реферат Объем работы iconТребования к письменным работам Объем текста работы
Объем текста работы определяемом видом работы: выпускная квалификационная работа – 50-75 стр.; курсовая работа – 25-30 стр.; реферат...
Реферат Объем работы iconРеферат должен содержать введение
Реферат должен быть представлен в машинописном варианте (шрифт Times New Roman, размер шрифта – 14; интервал – 1,0), объем работы...
Реферат Объем работы icon«Глобализация»
«история цивилизаций». Контрольная работа состоит из одной части – реферат (без тестовых заданий). Контрольные работы должны быть...
Реферат Объем работы icon«Становление классической науки»
«история науки». Контрольная работа состоит из двух частей – реферат и ответы на тесты. Контрольные работы должны быть представлены...
Реферат Объем работы iconИзделий и конструкций
Программа предназначена для студентов строительных факультетов высших учебных заведений и отражает цель и задачи изучения дисциплины,...
Реферат Объем работы iconРеферат Подготовка и написание реферата
Объем реферата должен составлять не менее 20 страниц. Объем текста определяется содержанием документа (количеством сведений, их научной...
Реферат Объем работы icon1. Получено сообщение, информационный объём которого равен 32 битам....
Организационное. План работы на декабрь, анализ проведённых мероприятий за ноябрь
Реферат Объем работы iconКафедра информатики и вычислительной техники карпенко сергея михайловича...
Структура и объем работы. Данная работа состоит из введения, двух глав, заключения и трех приложений. Общий объем работы – 82 с....
Реферат Объем работы iconФедеральное государственное бюджетное образовательное учреждение...
Объем курсовой работы должен быть в пределах 35-40 страниц печатного текста. Указанный объем относится к тестовой части работы. Список...
Реферат Объем работы iconП711 преднапряженный железобетон учебная программа. Методические указания
Программа предназначена для студентов строительных факультетов высших учебных заведений и отражает цель и задачи изучения дисциплины,...
Реферат Объем работы iconКнига 1
Объем работы – реферат от 12 до 25 печатных листов, курсовая работа – от 20 до 30 страниц, дипломная работа 60-70 страниц компьютерного...
Реферат Объем работы iconРеферат «история интернет»
За последние десять лет в мире произошли значительные изменения объем мирового рынка компьютеров и программного обеспечения в 2003...
Реферат Объем работы iconМатематическое моделирование реферат
Реферат должен носить исследовательский характер. Объем реферата составляет 16-20 страниц в компьютерном исполнении (формат А4, шрифт...
Реферат Объем работы iconОбъем и оформление реферата или курсовой работы по физике
Полный объем реферата или курсовой работы по физике (далее – работа по физике) – порядка 15-25 страниц стандартного формата А4
Реферат Объем работы iconПравила оформления реферата
Объём работы не должен превышать 25 страниц. Шрифт Times New Roman, масштаб 14, междустрочный интервал 1,5, выравнивание по ширине....


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск