Задание 3: Построение ассоциативных правил. Метод Априори. Нахождение ассоциативных правил происходит почти так же, как и классификация. На вкладке Associate выбирается метод нахождения, для него выставляются параметры кликом на его названии, после чего нажимается кнопка Start и анализируется вывод (перед началом использования метода Априори необходимо применить фильтр RemoveType и удалить numeric-атрибуты). В нашем случае ассоциативные правила строятся по методу Априори.
Рисунок 8
Apriori
=======
Minimum support: 0.4 (160 instances)
Minimum metric : 0.9
Number of cycles performed: 12
Generated sets of large itemsets:
Size of set of large itemsets L(1): 7
Size of set of large itemsets L(2): 13
Size of set of large itemsets L(3): 9
Size of set of large itemsets L(4): 1
Best rules found:
1. relationship=Husband 163 ==> marital-status=Married-civ-spouse sex=Male 163 conf:(1)
2. marital-status=Married-civ-spouse relationship=Husband 163 ==> sex=Male 163 conf:(1)
3. marital-status=Married-civ-spouse sex=Male 163 ==> relationship=Husband 163 conf:(1)
4. relationship=Husband sex=Male 163 ==> marital-status=Married-civ-spouse 163 conf:(1)
5. relationship=Husband 163 ==> sex=Male 163 conf:(1)
6. relationship=Husband 163 ==> marital-status=Married-civ-spouse 163 conf:(1)
7. marital-status=Married-civ-spouse 172 ==> relationship=Husband sex=Male 163 conf:(0.95)
8. marital-status=Married-civ-spouse 172 ==> sex=Male 163 conf:(0.95)
9. marital-status=Married-civ-spouse 172 ==> relationship=Husband 163 conf:(0.95)
10. race=White 341 ==> native-country=United-States 311 conf:(0.91)
Выводы:
1. из 163 мужей семейное положение «женат» и мужской пол имеют 163 с достоверностью 100%;
2-6. правила со второго и вплоть до 7го схожи;
7. из 172 женатых людей, статус «муж» и мужской пол имеют 163 с достоверностью 95%;
8. из 172 женатых людей статус «мужа» имеют 163 с достоверностью 95%;
9. из 172 женатых людей мужской пол имеют 163 с достоверностью 95%;
10. из 341 белого, в США родились 311 с достоверностью 91%.
При изменении метрики правила меняются полностью.
В настройках метода устанавливалось создание 10 ассоциативных правил. Данный алгоритм определяет часто встречающиеся наборы, соответственно самыми точными являются самые часто встречающиеся наборы, но не все они, как видно, не все они имеют смысл. Показываются наборы с метрикой больше минимальной.
ИТОГ Метод
| Точность классификации, %
| Средняя ошибка, %
| NAIVE BAYES
| 84.75
| 15.25
| J4.8
| 82.75
| 17.25
| ID3
| 72.75
| 17.25
| 1R(OneR)
| 81.5
| 18.5
| SVM (SMO)
| 84.5
| 15.5
|
Из сравнения методов видно, что с большей точностью объекты классифицируют алгоритмы NAIVE BAYES и SVM (SMO). SVM (SMO) более точен, но сложен для чтения информации.
ID3 оказался не удобным для реализации, т.к. ему необходимы численные переменные и он не допускает пустых элементов, что приводит к необходимости использовать фильтры.
ЗАКЛЮЧЕНИЕ
В результате работы были исследованы методы классификации и построения ассоциативных правил. Исходным набором данных в нашем случае являлась перепись населения в США, в которой классификация производилась по доходам населения.
НАБОР ДАННЫХ datamining400-57
Москва 2008
|
| Реферат Error: Reference source not found введение Задание 1: Подготовить исходный файл в формате *. arff. Error: Reference source not found
| | Министерство образования и науки российской федерации «Error: Reference source not found», профиль «Error: Reference source not found». Дисциплина реализуется на Механико-математическом...
|
| Реферат по дисциплине Социальная философия на тему: Социально-философские взгляды славянофилов Основоположники и представители славянофильской теории Error: Reference source not found
| | Открытое акционерное общество энергетики и электрификации «тюменьэнерго»... Том 01. Ремонт и техническое обслуживание трансформаторов и электродвигателей Error: Reference source not found
|
| План: Введение Error: Reference source not found Введение 3 Закон... Целью работы является общее представление о закономерностях развития биологических систем. И как можно было увидеть, закономерности...
| | Западное окружное управление образования центр психолого-медико-социального... Не вдаваясь в качественную сторону составления тестов и не рассуждая о том, насколько технически и экономически оправдано внедрение...
|
| Реферат Введение Введение. С конца XIX века одной из проблем философии стало массовое сознание. Ницше писал: "Когда сто человек стоят друг возле друга,...
| | Реферат должен содержать введение Реферат должен быть представлен в машинописном варианте (шрифт Times New Roman, размер шрифта – 14; интервал – 1,0), объем работы...
|
| Реферат по географии "Ресурсы пресной воды" План. 0 Введение (общие сведения) Вода и жизнь – понятия неразделимые. По этому реферат данной темы необъятен, и я поэтому рассматриваю лишь некоторые, особенно актуальные...
| | The tools for solving rapes and murders have improved rapidly. Five...
|
| Реферат по 10-15 стр реферат должен быть написан самостоятельно Реферат должен быть написан самостоятельно и построен по типу статьи: краткая аннотация 4-5 строчек, введение (цели, задачи реферата,...
| | Реферат Православие и российская государственность Введение 3
|
| Реферат Отчет представлен на 21 страницах, включает в себя 1 таблицу... Содержание деятельности и результаты реализации Мероприятия 1 «Предоставление услуг населению по формированию ик компетенций с помощью...
| | Программа по формированию навыков безопасного поведения на дорогах... Доска: Love books, they are the source of knowledge, and only knowledge can make us strong and better
|
| Реферат по литературе на тему: Жизнь и творчество Введение 3
| | Реферат ргасу 19 2009 699 содержание введение 2 список использованной... «Теоретические основы "Философии хозяйства" С. Н. Булгакова» одна из важных и актуальных тем на сегодняшний день
|