БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Выпускная работа по «Основам информационных технологий»
магистрант
кафедры теории функций
Шкадрецов Дмитрий
Руководители:
доцент Рогозин Сергей Васильевич,
ст. преподаватель Кожич Павел Павлович
Минск 2008
Оглавление
Оглавление 2
Список обозначений и сокращений 3
Реферат на тему «Коллаборативная фильтрация» 6
Введение 6
Обзор литературы 7
Методика исследования. 9
Основные результаты 17
Обсуждение результатов. 19
Заключение. 20
Список литературы к реферату. 21
Предметный указатель к реферату. 25
Интернет ресурсы в предметной области исследования. 26
Действующий личный сайт в WWW (гиперссылка). 27
Граф научных интересов 28
Презентация магистерской диссертации. 29
Список литературы к выпускной работе. 30
Приложение 32
Список обозначений и сокращений В данном документе применяют следующие термины с соответствующими определениями:
F-статистика (F-statistic): отношение двух выборочных дисперсий.
Web 2.0: методика проектирования систем сети Интернет, которые путем учета сетевых взаимодействий, становятся тем лучше, чем больше людей ими пользуются.
агрегатор (aggregator): клиентская программа или веб-приложение для автоматического сбора сообщений из источников, например заголовков новостей, блогов, подкастов и видеоблогов.
кластерный анализ (data clustering): Математическая процедура, позволяющая на основе схожести количественных значений нескольких признаков, свойственных каждому объекту (например, испытуемому) какого - либо множества, сгруппировать эти объекты в определенные классы, или кластеры. Осуществляется путем вычисления расстояния между этими объектами прежде всего в терминах евклидовой метрики [13], [14].
коллаборативная фильтрация (collaborative filtering): метод, дающий автоматические прогнозы (фильтрацию) относительно интересов пользователя по собранной информации о вкусах множества пользователей (сотрудничающих между собой).
конте́нт (англ. content — содержание): любое информационно значимое (содержательное) наполнение информационного ресурса (например, веб-сайта) — тексты, графика, мультимедиа — вся информация, которую пользователь может загрузить на диск компьютера с соблюдением соответствующих законностей, как правило, только для личного пользования.
метод CLOPE: Метод кластеризации категоризационных данных [17].
метод Варда (method Warda): Метод, основанный на разделении объектов на кластеры, расстояние между которыми измеряетсы при помощи общей суммы квадратов отклонений каждого объекта от центра своего кластера.
метод К-средних (K-means): Метод позволяющих сформировать кластеры, если заранее известно количество [15], [16].
рунет (runet): русскоязычная часть сети Интернет.
тег (англ. tag ярлык,этикетка,бирка; метить): ключевое слово, метка для категоризации чего-либо. Используется для поиска какой-либо информации или для форматирования текста.
Холодный старт (Cold start): Ситуация в фильтрации, когда система не может осуществить для тебя фильтрацию, поскольку ещё недостаточно ознакомилась с твоими интересами.
чарт (англ. chart): схема, таблица, список, карта. В чарте, как правило, данные распределены по какому-то признаку (по возрастанию/уменьшению какой-либо характеристики, по времени создания, и т. п.). Примером служит финансовый термин «чарт»: график цен, применяемый для учёта и прогнозирования. Сейчас значение этого слова нам больше известно лишь по распределению музыкальных произведений — «музыкальный чарт» (не путать с «хит-парадом»). Хит-парад, это чарт, составленный по предпочтениям слушателей, тогда как просто чартом может быть и не хит-парад, а список песен одного и того же певца или певицы (группы, оркестра, ансамбля), выведенный по временной шкале, по алфавитному ряду названий песен и т. д. В данном документе применяют следующие сокращения:
ANOVA: Analysis of variance (дисперсионный анализ)
IMDb: База данных фильмов в Интернете (Internet Movie Database)
WPGMC: Метод взвешенного попарного центроидного усреднения ( weighted pair-group method using the centroid average)
ИМХО (англ. IMHO): известный интернет-мем, означающий «по-моему», «по моему скромному мнению» (англ. In My Humble Opinion)
КФ: Коллаборативная фильтрация
ТОП: От англ. top — «верх», «верхняя часть», «верхушка»
|