- Топологический анализ данных
-
Топологический анализ данных — новая область теоретических исследований для задач анализа данных (Data mining) и компьютерного зрения.
Основные вопросы:
- Как из низкоразмерных представлений получать структуры высоких размерностей;
- Как дискретные единицы складываются в глобальные структуры.
Человеческий мозг легко строит представление об общей структуре по частным данным низких размерностей. Ему, например, не составляет труда получить трехмерную форму объекта по плоским изображениям в каждом глазу. Создание общей структуры также производится при объединении дискретных во времени фрагментов в непрерывный образ. Так, например, телевизионное изображение технически является массивом отдельных точек, который, однако, воспринимается как единая сцена.
Основной метод топологического анализа данных:
- Замена набора элементов данных некоторым семейством симплициальных комплексов в соответствии с параметром близости.
- Анализ этих топологических комплексов с помощью алгебраической топологии, а конкретно новой теорией устойчивых гомологий.
- Перекодировка устойчивой гомологии набора данных в параметризованную версию чисел Бетти, далее называемую штрихкодом.
Содержание
Облако точек
Данные часто представлены множеством точек в Евклидовом пространстве En, форма которого отражает описываемый данными феномен..
Реальные трехмерные объекты могут представляться в виде облака точек. Например лазером отмечаются отдельные точки и их неструктурированный набор служит представлением объекта в компьютере. Облаком точек считается любой (возможно зашумленный) набор точек в En или проекций точек в более низкой размерности.
В компьютерной графике и статистике есть различные методы построения прообразов по проекциям. Топологический анализ данных предназначен для пространств высоких размерностей или слишком искривленных чтобы создавать по ним плоские проекции.
Для преобразования облака точек в метрическом пространстве в целостный объект точки используются в качестве вершин графа ребрам которого приписаны расcтояния, затем граф превращается в симплициальный комплекс и изучается средствами алгебраической топологии.
Устойчивая гомология
См. также
- Понижение размерности
- Интеллектуальный анализ данных
- Компьютерное зрение
- Вычислительная топология
- Цифровая топология
- Цифровая теория Морзе
- Анализ формы
- Анализ структурированных данных (статистика)
Ссылки
- Topological Methods in Scientific Computing, Statistics and Computer Science Stanford group
- BARCODES: THE PERSISTENT TOPOLOGY OF DATA
- Topological Data Analysis: the algebraic topology of point data clouds?
- Sanjay Rana Topological Data Structures for Surfaces. — John Wiley and Sons, 2004. — ISBN ISBN 978-0470851517
- TOPOLOGY AND DATA, GUNNAR CARLSSON, BULLETIN (New Series) OF THE AMERICAN MATHEMATICAL SOCIETY, Volume 46, Number 2, April 2009, Pages 255–308, Article electronically published on January 29, 2009
Категория:- Математическая статистика
Wikimedia Foundation. 2010.