ID3 (алгоритм)

ID3 (алгоритм)

Алгоритм ID3 — один из алгоритмов для построения дерева принятия решений. Разработан Джоном Р. Квинланом (англ. John R. Quinlan). Впоследствии Квинлан создал усовершенствованную версию — алгоритм C4.5.

Алгоритм

  1. Взять все неиспользованные признаки и посчитать их энтропию относительно тестовых образцов
  2. Выбрать признак, для которого энтропия минимальна (а информационная выгода соответственно максимальна)
  3. Сделать узел дерева, содержащий этот признак

Алгоритм следующий:

ID3(Таблица примеров, Целевой признак, Признаки)

  1. Если все примеры положительны, то возвратить узел с меткой «+».
  2. Если все примеры отрицательны, то возвратить узел с меткой «-».
  3. Если множество признаков пустое, то возвратить узел с меткой, которая больше других встречается в значениях целевого признака в примерах.
  4. Иначе:
    1. A — признак, который лучше всего классифицирует примеры (с максимальной информационной выгодой).
    2. Создать корень дерева решения; признаком в корне будет являться A.
    3. Для каждого возможного значения A (v_i):
      1. Добавить новую ветвь дерева ниже корня с узлом со значением A = v_i
      2. Выделить подмножество Examples(v_i) примеров, у которых A = v_i.
      3. Если подмножество примеров пусто, то ниже этой новой ветви добавить узел с меткой, которая больше других встречается в значениях целевого признака в примерах.
      4. Иначе, ниже этой новой ветви добавить поддерево, вызывая рекурсивно ID3(Examples(v_i), Целевой признак, Признаки)
  5. Возвратить корень.



Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "ID3 (алгоритм)" в других словарях:

  • ID3 — может означать: ID3 (метаданные) (от англ. Identify an MP3) формат метаданных, сохраняемых в файлах форматов типа MP3 (автор, название альбома, и т. д.) ID3 (алгоритм) один из алгоритмов для построения дерева принятия решений …   Википедия

  • Дерево принятия решений — (также могут назваться деревьями классификации или регрессионными деревьями)  используется в области статистики и анализа данных для прогнозных моделей. Структура дерева представляет собой следующее: «листья» и «ветки». На ребрах («ветках»)… …   Википедия

  • MP3 — MPEG 1 Audio Layer 3 Расширение .mp3 MIME audio/mpeg Тип формата аудиоформат MP3 (более точно, англ. MPEG 1/2/2.5 Layer 3; но не MPEG 3)  это кодек третьего уровня, разработанный командой MPEG, лицензируемый формат файла для хранения… …   Википедия

  • C4.5 — C4.5  алгоритм для построения деревьев решений, разработанный Джоном Квинланом (англ. John Ross Quinlan). C4.5 является усовершенствованной версией алгоритма ID3 того же автора. В частности, в новую версию были добавлены отсечение… …   Википедия

  • TTA — True Audio Тип Кодек Разработчик Александр Джурик Операционная система Кроссплатформенное программное обеспечение Последняя версия 2.1 (11 марта 2011) Лицензия Свободная …   Википедия

  • Windows XP — Windows XP …   Википедия

  • TTA (codec) — True Audio (сокращённо TTA) это свободный и бесплатный, аудио кодек, осуществляющий сжатие аудиофайлов без потерь, способный работать в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает такими же или… …   Википедия

  • Tta — True Audio (сокращённо TTA) это свободный и бесплатный, аудио кодек, осуществляющий сжатие аудиофайлов без потерь, способный работать в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает такими же или… …   Википедия

  • Формат метаданных — Метаданные, в общем случае Метаданные это информация о данных[1]. Информация об информации. Пример: Имя автора правки в тексте. Этот термин в широком смысле слова используется для любой информации о данных: именах таблиц, колонок в таблице в… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»