Частое обнаружение закономерностей - Frequent pattern discovery

Частое обнаружение закономерностей (или же Открытие FP, FP майнинг, или же Частый майнинг наборов элементов) часть открытие знаний в базах данных, Массовый онлайн-анализ, и сбор данных; описывает задачу поиска наиболее частых и актуальных узоры в больших наборах данных.[1][2]Эта концепция была впервые представлена ​​для баз данных транзакций майнинга.[3]Частые шаблоны определяются как подмножества (наборы элементов, подпоследовательности или подструктуры), которые появляются в наборе данных с частотой не ниже заданного пользователем или автоматически определенного порога.[2][4]

Методы

Методы FP-майнинга включают:

По большей части обнаружение FP может быть выполнено с помощью изучение правил ассоциации с особыми алгоритмами Эклат, FP-рост и Алгоритм априори.

Другие стратегии включают:

и соответствующие конкретные методы.

Существуют реализации для различных машинное обучение системы или модули, такие как MLlib для Apache Spark.[5]

Рекомендации

  1. ^ а б Цзявэй Хан; Хонг Ченг; Дун Синь; Сифэн Ян (2007). «Частый поиск паттернов: текущее состояние и будущие направления» (PDF). Интеллектуальный анализ данных и обнаружение знаний. 15: 55–86. Дои:10.1007 / s10618-006-0059-1. Получено 2019-01-31.
  2. ^ а б "Частая разработка шаблонов". SIGKDD. 1980-01-01. Получено 2019-01-31.
  3. ^ а б Агравал, Ракеш; Имелински, Томаш; Свами, Арун (1 июня 1993 г.). «Правила ассоциации интеллектуального анализа данных между наборами элементов в больших базах данных». Запись ACM SIGMOD. 22 (2): 207–216. CiteSeerX  10.1.1.217.4132. Дои:10.1145/170036.170072. ISSN  0163-5808.CS1 maint: ref = harv (связь)
  4. ^ "Частый анализ шаблонов, закрытый частый набор элементов, макс. Частый набор элементов в интеллектуальном анализе данных". T4Учебники. 2018-12-09. Получено 2019-01-31.
  5. ^ «Частая разработка шаблонов». Документация Spark 2.4.0. Получено 2019-01-31.