Материалы доклад





НазваниеМатериалы доклад
страница8/14
Дата публикации13.04.2015
Размер1.72 Mb.
ТипДоклад
100-bal.ru > Информатика > Доклад
1   ...   4   5   6   7   8   9   10   11   ...   14

Список литературы

[1] Christopher D. Manning . Introduction to Information Retrieval. Cambridge University Press, 2008

[2] T. Joyce, R.M. Needham. The Thesaurus Approach to Information Retrieval, American Documentation, 1958

[3] Karen Sparck Jones. A Statistical Interpretation of Term Specificity and Its Application in Retrieval, Journal of Documentation, 1972

[4] S.E. Robertson and Sparck Jones K. Relevance Weighting of Search Terms, JASIS, 1976
ПРИМЕНЕНИЕ АССОЦИАТИВНЫХ ПРАВИЛ ДЛЯ ПРЕДСКАЗАНИЯ СЕРДЕЧНОСОСУДИСТЫХ ЗАБОЛЕВАНИЙ.

В.А. Демиденок

Московский Государственный Институт Электроники и Математики, Россия

1. Введение

В последнее время информатизация общества и автоматизация различных сфер деятельности привели к накоплению большого количество различных данных. Возникла потребность в анализе данных, выявлении скрытых закономерностей и правил. Data Mining это направление интеллектуального анализа данных, которое позволяет решать подобный класс задач, а именно обнаружение ранее неизвестных, нетривиальных, практически полезных знаний в данных. Интеллектуальный анализ данных применяют в различных сферах, таких как анализ покупательской корзины, медицина, анализ рисков. Предсказание сердечнососудистых заболеваний является одной из тех задач, где Data Mining может быть успешно применён для улучшения предсказания возникновения заболеваний и предотвращении их возникновения.

Поиск ассоциативных правил является одним из ключевых методов в Data mining и имеет большой потенциал в применении на медицинских данных с целью улучшения принятия решений и предсказании заболеваний.

Данная работа разбита на несколько разделов. Во 2 разделе работы дано классическое определение ассоциативным правилам и общий подход к их поиску. В 3 разделе рассмотрено применение ассоциативных правил в кардиологии. В 4 разделе рассмотрены методы дискретизации, позволяющие сократить потери информации при поиске ассоциативных правил и методы сокращения общего объёма правил.

2. Общие определения

Классическое определение ассоциативного правила выглядит следующим образом:

Пусть I = {i1, i2, i3, ...in} – множество атрибутов. D – множество из n транзакции, такое что D = {T1, T2, …, Tn } и где Ti – набор элементов из I. Ассоциативным правилом называется импликация XY, где XI, YI, XY=.

Правило имеет поддержку(support), где supp - процент транзакций из D, которые содержат XY, supp(XY) = supp(XY). Правило справедливо с некоторой достоверностью (confidence), где conf - процент транзакций из D, таких что, если транзакция содержит X, то она также содержит Y, conf(XY) = supp(XY)/supp(X ).

Существует довольно много алгоритмов поиска ассоциативных правил из которых самыми известными являются Apriori, FP-growth, APACS2. В общем случае задача поиска ассоциативного правила сводится к двум этапам:

1) Осуществляется поиск и генерация наиболее частых наборов элементов, то есть таких наборов, у которых поддержка выше определённого значения.

2) Генерация правил на основе частых наборов с достоверностью выше определённого значения.

Классические ассоциативные правила позволяют работать лишь с категориальными атрибутами, но так как данные в большинстве своём не ограничиваются бинарными значениями в скором времени появились расширения ассоциативных правил.

Так, например обобщённые ассоциативные правила это правила, которые объединяют несколько правил вместе. При построении таких правил, элементы обычно группируются согласно иерархии, и их поиск ведется на самом высоком концептуальном уровне. Другим типом правил является количественные ассоциативные правила, у которых атрибуты могу принимать как категориальные, так и числовые значения. Помимо описанных выше ассоциативных правил существуют косвенные ассоциативные правила, ассоциативные правила c отрицанием, временные ассоциативные правила для событий связанных во времени и другие.

3. Применение в кардиологии.

Впервые применение ассоциативных правил в контексте сердечнососудистых заболеваний было проведено в 1999 году. В этой области были попытки использования и других инструментов, таких как нейронные сети, деревья решений, метод опорных векторов. Применение ассоциативных правил обусловлено тем, что они имеют важные преимущества по сравнению с традиционным машинным обучением или статистическими алгоритмами:

-они дают интерпретацию, основанную на вероятности появления паттерна и условную вероятность между двумя паттернами (например, отношение медицинскими метрик и факторов риска к артериальной узости)

-позволяют связывать комбинации предсказываемых атрибутов (предсказывать существование болезни в одной или двух артериях.)

-могут обрабатывать несколько предсказываемых атрибутов одновременно без необходимости разделения данных на множества или несколько прогонов (предсказания проблем для всех артерий, используя одно множество данных)

-могут находить паттерны, которые существуют на небольшом множестве атрибутов (что важно на небольших, но многоразмерных объёмах данных)

-каждое правило может относиться к перекрывающимся множествам данных, соотносясь с другими правилами (избегая фрагментации данных, где это возможно)

Кроме того, для медицинских данных многие другие методы потребовали бы множество моделей (моделей деревьев решений или регрессионных моделей), дополнительные меры для обработки редких случаев, или для создания адекватных атрибутов цели, и специальные процедуры для нахождения небольших подмножеств атрибутов связанных с определённой формой заболевания.

Однако, использование ассоциативных правил на медицинских данных сопряжено с некоторыми трудностями. Прежде всего это огромный объём получаемых ассоциативных правил, большая часть которых с точки зрения медицины не интересна и большие временные затраты на поиск релевантных правил. Второй проблемой является потеря информации, обусловленная применением чётких границ для численных и категориальных ассоциативных правил.

4. Проблемы использования ассоциативных правил и их решенние

В процессе работы, исследователи столкнулись с рядом проблем использования ассоциативных правил, таких как:

- генерация огромного количества правил при низкой поддержке, многие из которых с медицинской точки зрения бессмысленны;

- потеря информации при дискретизации числовых атрибутов, что ведёт к нахождению не всех «хороших» правил;

a) Сокращение количества правил

Одним их подходов к снижению количества правил является наложение ограничений на генерацию, как частых наборов, так и ассоциативных правил. Такими ограничениями могу быть:

- максимальная длина ассоциативного правила;

- группировка атрибутов;

- задание того, в какой части правила может на- ходиться атрибут;

Применение ограничений позволяет существенно сократить объём генерируемых правил.

б) Уменьшение потери информации.

В медицине большая часть информации представлена в виде числовых, категориальных, временных данных и для того чтобы иметь возможность применить классические ассоциативные правила необходимо разбивать числовые и временные атрибуты на интервалы. Такое разделение позволяет перейти к бинарным данным, увеличивая при этом количество атрибутов. Пример такого разбиения представлен на рисунке 1.


Рисунок 1
Использование такого подхода обладает следующими недостатками:

- если число интервалов для атрибута велико (длина интервала небольшая), то поддержка отдельного интервала будет низкой и некоторые правила не будут найдены.

- если длина интервала будет большой, то может уменьшиться доверие правила, и оно не будет найдено.

Одним из вариантов решения данной проблемы является применение перекрывающихся интервалов, пример которого представлен на рисунке 2.


Рисунок 2
Хотя данный подход и позволяет несколько снизить потерю информации, он приводит к появлению огромного количества атрибутом по сравнению с предыдущим подходом и появлению большого числа неинтересных правил.

Потеря информации происходит из-за так называемой проблемы жёстких границ. Одной из главных проблем предыдущих подходов была в том, что значения, лежащие близко к границам разбиения интервалов не оказывали никакого вклада в поддержку множества и получаемые правила сильно зависели от выбора длин интервалов. Использование подхода нечёткой дискретизации позволяет решить эту проблему. Пример такой дискретизации представлен на рисунке 3.


Рисунок 3
Выбор функций принадлежности для атрибутов может быть произведён как экспертом в области кардиологии, так и методом кластеризации. Данный подход известен под названием нечётких ассоциативных правил.

Заключение.

Ассоциативные правила дают широкие возможности в применении на медицинских данных и в частности в кардиологии. Они обладают рядом существенных преимуществ перед остальными методами интеллектуального анализа данных в этой области. Многие существующие проблемы применения ассоциативных правил решаемы. Возникает необходимость использования новых подходов к ассоциативным правилам и разработка качественно нового программного обеспечения.

Список литературы.

1. Kuok, Chan Man; Fu, Ada; Wong, Man Hon: Mining Fuzzy Association Rules in Databases. SIGMOD Record Volume 27, 1998.

2. Association Rule Discovery With the Train and Test Approach for Heart Disease Prediction. Carlos Ordonez IEEE TRANSACTIONS ON INFORMATION TECHNOLOGY IN BIOMEDICINE, VOL. 10, NO. 2, APRIL 2006

3. K. Wang, Y. He, and J. Han, “Pushing support сonstraints into association rules mining,” IEEE Trans. Knowl. Data Eng., vol. 15, no. 3, pp. 642–658, May/Jun. 2

4. Fuzzy Association Rules An Implementation in R. Lukas Helm. Vienna, 2.8.2007. Vienna University of Economics and Business Administration

практика управления вузами. Разработка автоматизированной системы управления

Фофанов И.С.

Всероссийская государственная налоговая академия Министерства финансов Российской Федерации, Россия

Аннотация

Работа посвещена проблемам развития вузов в России. Предлагается создание АСУ вузом в качестве инструмента, позволяющего повысить эффективность управления вузом.

Введение

По настоящее время многие вузы России испытывают проблемы в развитии как от недостатка денежных средств так и в результате отсутствия адекватных управленческих моделей.

Эффективное развитие вузов в России требует предпринимательской активности не только организации в целом, но и её подразделений и даже отдельных сотрудников. Для стимулирования подобной активности требуется особая система внутреннего управления.

Сложность управления учебными заведениями во многом объясняется их особенностями, присущими им как структуре, которую Г. Минцберг назвал «профессиональной бюрократией».

Считается, что основными причинами, вызывающими низкую эффективность управления такими объектами, являются:

  • слабые стратегические вершина и средняя линия, которые связаны с отсутствием профессиональных менеджеров в большинстве учебных заведений;

  • вертикальная децентрализация власти, вызванная передачей властных полномочий на уровень среднего звена управления, а также традиционной академической автономией профессорско-преподавательского состава;

  • сильная горизонтальная специализация на уровне факультетов и кафедр, которая может привести к преобладанию частных целей и интересов над общеуниверситетскими;

  • неизбежная стандартизация организационного поведения работников, используемая для упрощения управления в ситуации их большого разнообразия;

  • относительно высокая доля технического персонала, имеющего, широкий спектр функций, и неразвитая технологическая структура.

Важными преимуществами предпринимательских организаций являются рост заинтересованности сотрудников в конечном результате их деятельности, быстрая реакция на изменения внешней среды, снижение времени и усилий на руководство деятельностью организации, в частности на осуществление функции контроля, и т.д.

1. Цели и задачи проекта

Целью является разработка автоматизированной информационной системы управления вузом, которая позволит решить многие проблемы, связанные с реализацией задач повышения эффективности развития вуза.

2. Технология реализации проекта

Создание, эксплуатация и организация жизненного цикла системы такого масштаба – сложная организационная, техническая и технологическая задача. Для реализации АСУ необходимо создание основных взаимодействующих управленческих моделей:

  • Управление процессом обучения – 1 этап.

  • Управление качеством образования – 1 этап.

  • Управление кадрами – 1 этап.

  • Управление научными исследованиями – 1 этап.

  • Управление делами – 1 этап.

  • Управление проектами – 1 этап.

  • Управление бухгалтерским учетом – 2 этап.

  • Управление экономикой и финансами – 2 этап.

  • Управление трудом и заработной платой – 2 этап.

  • Управление социальным развитием – 2 этап.

  • Управление материально-техническим снабжением – 2 этап.

  • Из всех перечисленных моделей первостепенной является разработка блока управления учебным процессом.

Сформулированы требования к АСУ вузом:

1) обеспечить управление учебным процессом, включающего три уровня: ректорат и его службы, деканаты, кафедры.

2) обеспечить компьютерное обучение студентов.

3) быть открытой для наращивания и модернизации.

4) быть защищенной от несанкционированного доступа к определенной информации.

5) обеспечить снижение объема документооборота с информацией по студентам на бумажной основе.

6) обрабатывать информацию для отчетов по заданным алгоритмам, в том числе автоматически следить за текущей успеваемостью студентов.

7) иметь возможность интеграции в системы более высокого уровня, например, в отраслевую систему, в систему образовательных услуг и др.

Для решения задач поставленных блоком управления образовательным процессом, АСУ разрабатывается по технологии «клиент-сервер». В качестве сервера используется Microsoft SQL Server 2005. Реализация строиться на технологиях предоставляемых платформой .NET: WPF, WCF, LINQ и ADO.NET 2.0.

Основной причиной отсутствия целостной АСУ вузом по настоящее время является недостаточная заинтересованность государства в этом процессе. Для создания такой системы по предварительным рассчётам требуется один миллион долларов и тридцать месяцев разработки командой программистов экстра-класса в количестве девяти человек.
1   ...   4   5   6   7   8   9   10   11   ...   14

Похожие:

Материалы доклад iconДоклад предназначен для родителей (законных представителей) обучающихся,...
Доклад может быть полезен родителям, планирующим направить ребенка на обучение в нашу школу. Материалы доклада помогут сориентироваться...
Материалы доклад iconПубличный доклад о работе муниципального казенного
Методические материалы для студентов дневного отделения
Материалы доклад iconПрограмма по формированию навыков безопасного поведения на дорогах...
Природные каменные материалы, керамические материалы, стеклокристаллические материалы
Материалы доклад iconМатериалы в государственный доклад
«О состоянии защиты населения и территории муниципального района Татышлинский район от чрезвычайных ситуаций природного и техногенного...
Материалы доклад iconДоклад Стендовый доклад
Доклад – это устный рассказ (сочинение) на заданную или самостоятельно сформулированную тему
Материалы доклад iconПрограмма по формированию навыков безопасного поведения на дорогах...
Приборы и материалы: компьютер, проектор, доска, дидактические материалы, учебник математики для 6 класса, автор Н. Я. Виленкин,...
Материалы доклад iconАналитические материалы по итогам профилактической работы с несовершеннолетними...
Материалы по результатам диагностики, анкетирования, собеседования с классными руководителями, педагогами доп образования, педагогам-организаторам...
Материалы доклад iconКак написать доклад
Доклад есть достаточно неизученная, но довольно часто встречающаяся работа в учебных заведениях. Различают устный и письменный доклад...
Материалы доклад iconКак написать доклад
Доклад есть достаточно неизученная, но довольно часто встречающаяся работа в учебных заведениях. Различают устный и письменный доклад...
Материалы доклад iconКак написать доклад
Доклад есть достаточно неизученная, но довольно часто встречающаяся работа в учебных заведениях. Различают устный и письменный доклад...
Материалы доклад iconКак написать доклад
Доклад есть достаточно неизученная, но довольно часто встречающаяся работа в учебных заведениях. Различают устный и письменный доклад...
Материалы доклад iconКак написать доклад
Доклад есть достаточно неизученная, но довольно часто встречающаяся работа в учебных заведениях. Различают устный и письменный доклад...
Материалы доклад iconКак написать доклад
Доклад есть достаточно неизученная, но довольно часто встречающаяся работа в учебных заведениях. Различают устный и письменный доклад...
Материалы доклад iconРеферат по курсу: ''эдсс'' на тему: ''Магнитные материалы для микроэлектроники''
Необходимы магнитные материалы, прозрачные в оптическом и ик-диапазоне, обладающие большой коэрцитивной силой, намагниченностью насыщения,...
Материалы доклад iconРабочая учебная программа конспекты лекций материалы для лабораторных...
Учебно-методический комплекс составлен на основании требований федерального государственного образовательного стандарта высшего профессионального...
Материалы доклад iconРабочая программа учебной дисциплины (рпуд) 5 конспекты лекций 33...
Учебно-методический комплекс составлен в соответствии с требованиями государственного образовательного стандарта высшего профессионального...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск