
ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ
ЧТО ТАКОЕ АНАЛИЗ ДАННЫХ? Иллюстративные проблемы анализа данных Анализ данных и математическая статистика: инженерный и научный подходы ОДНОМЕРНЫЙ АНАЛИЗ Количественные признаки: распределение и гистограммаП2.1. ПредставлениеФ2.1. ФормулировкиВ2.1. Вычисление Дальнейшая суммаризация: центр и рассеяниеП2.2. Центр и рассеяние: представлениеФ2.2. Центр и рассеяние: формулировкиФ2.2.1. Подход анализа данныхФ2.2.2. Теоретико-вероятностный подходВ2.2. Центр и рассеяние: вычисление Бинарные и категоризованные признакиП2.3. ПредставлениеФ2.3. ФормулировкиВ2.3. ВычислениеПроект 2.1. Вычисление центра по критерию МинковскогоПроект 2.2. Доверительный интервал бутстрэп-методомПроект 2.3. Перекрестная валидация (скользящий контроль) ДВУМЕРНЫЙ АНАЛИЗ: СУММАРИЗАЦИЯ И КОРРЕЛЯЦИЯ ДВУХ ПРИЗНАКОВ Постановка проблемы Случай двух количественных признаковП3.2. Линейная регрессия: представлениеПЗ.2.1. Поле рассеяния, линейная регрессия и коэффициент корреляцииПЗ.2.2. Анализ степени адекватности уравнения регрессииФ3.2. Линейная регрессия: формулировкиФЗ.2.1. Аппроксимация данных линейным уравнениемФЗ.2.2. Коэффициент корреляции и его свойстваФ3.2.3. Линеаризация для оценки нелинейной регрессииВ3.2. Линейная регрессия: вычисление Случай смешанных шкал: номинальный и количественный признаки Целевой количественный признакП3.3.1. Бокс-плот, табличная регрессия и корреляционное отношениеФ3.3.1. Табличная регрессия: формулировки Номинальный целевой признак Классификатор по правилу ближнего соседа Классификатор с интервальными предикатами Случай двух номинальных признаковП3.4. Анализ таблиц сопряженности: представлениеПЗ.4.1. Построение концептуальных связей по статистическим даннымПЗ.4.2. Исследование связей с помощью индекса КетлеП3.4.3. Коэффициент хи-квадрат как индекс связи и визуализация его структурыФ3.4. Анализ таблиц сопряженности: формулировки КОРРЕЛЯЦИЯ И СУММАРИЗАЦИЯ ДЛЯ МНОГОМЕРНЫХ ДАННЫХ Необходимость задания класса решающих правил при изучении корреляции Байесовский подход к распознаванию Бэйесовское решающее правило Наивный Байесовский классификатор Меры качества классификатораП4.3. Точность и связанные с ней показателиФ4.3. Точность и связанные с ней показатели: формулировки Постановка проблемы кластеризации Кластеризация методом К-среднихП4.5. Параллельный метод К-средних и его особенностиАлгоритм К-среднихОсобенности методаФ4.5. Критерий метода К-средних Проблема инициализации К-средних и аномальные кластеры Подходы к инициализации К-средних Многочисленные прогоны для инициализации К-средних Метод аномальных кластеров П4.6.1.2. Аномальные кластерыФ4.6.1.2. Аномальные группы Интеллектуальная версия метода К-среднихП4.6.2. Аномальные группы и интеллектуальный метод К-среднихФ4.6.2. Метод К-средних: формулировки и вычислениеЗаключениеАнализ данных, объяснение паттернов и принятие решенийДоктор Сноу и вспышка холерыМалый размер благоприятствует проявлению крайностейОсновы вычислительной среды МатЛабВведение: как начать работуЗагрузка и запоминание файловРабота с подмножествами объектов и признаковДве программы па МатЛабеПредметный указатель