Хотите получать информацию по новым курсам и их датам проведения?
(OSPSS-7) Многомерные методы классификации в SPSS
Цель изучения курса "Многомерные методы классификации в IBM SPSS Statistics" разобрать многомерные статистические методы, которые также относят к методам добычи знаний (data mining), позволяющие находить скрытые и неочевидные закономерности в больших массивах данных и принимать на основе этих закономерностей управленческие решения.
По окончании курса Вы будете уметь:
- проводить кластерный анализ различными методами;
- проводить факторный и компонентный анализ;
- проводить дискриминантный анализ и классификацию на его основе;
- строить деревья решений и анализировать их;
Объем курса: 32 ак. часа (общая продолжительность видео лекций более 15 астрономических часов)
Программа курса:
Тема 1. Введение в многомерные методы классификации (продолжительность видео лекции 1 час 35 минут)
- Многомерные методы классификации
- Понятие и области применения кластерного анализа
- Задачи кластерного анализа
- Методы кластерного анализа
- Преимущества и недостатки кластерного анализа
- Этапы кластерного анализа
- Исходные данные в многомерном анализе
- Меры различия между количественными данными
- Процедура Расстояния
- Оценка мер различия между количественными данными
- Меры различия между бинарными данными и их оценка
- Меры различия между частотными данными и их оценка
- Меры сходства между количественными данными и их оценка
- Меры сходства между бинарными данными и их оценка
- Анализ качества классификации
Тема 2. Иерархический кластерный анализ (продолжительность видео лекции 1 час)
- Особенности иерархического кластерного анализа
- Алгоритм иерархических методов кластерного анализа
- Меры расстояния между кластерами
- Процедура Иерархический кластерный анализ
- Выбор метода иерархического кластерного анализа
- Результаты процедуры Иерархический кластерный анализ
- Графическое представление результатов иерархического кластерного анализа
- Настройка статистик процедуры Иерархический кластерный анализ
- Сохранение результатов иерархического кластерного анализа
Тема 3. Классификация методом k-средних (продолжительность видео лекции 1 час)
- Сущность и особенности метода k-средних
- Алгоритм метода k-средних
- Процедура Кластерный анализ методом k-средних
- Результаты процедуры Кластерный анализ методом k-средних
- Настройка количества итераций
- Настройка дополнительных параметров
- Результаты вывода дополнительных настроек
- Сохранение результатов классификации к-средними
- Графическое представление результатов
Тема 4. Двухэтапный кластерный анализ (продолжительность видео лекции 1 час)
- Особенности двухэтапного кластерного анализа
- Предпосылки двухэтапного кластерного анализа
- Алгоритм двухэтапного кластерного анализа
- Процедура Двухэтапный кластерный анализ
- Сводка результатов модели
- Оценка кластерной структуры
- Просмотр информации о кластерах
- Вывод информации по кластерам
- Управление выводом
- Вывод процедуры Двухэтапный кластерный анализ
- Дополнительная панель средства просмотра кластеров
- Отбор наблюдений по кластерам
- Параметры процедуры Двухэтапный кластерный анализ
Тема 5. Факторный и компонентый анализ в задачах классификации (продолжительность видео лекции 1 час 45 минут)
- Понятие факторного анализа
- Цель и задачи факторного анализа
- Этапы реализации методов снижения размерности
- Алгоритм компонентного анализа
- Алгоритм факторного анализа
- Предпосылки применения факторного и компонентного анализа
- Сравнение факторного и компонентного анализов
- Процедура Факторный анализ
- Результаты процедуры Факторный анализ
- Правила отбора факторов
- Выбор метода факторного анализа
- Проблема вращения факторов
- Настройка вращения факторов
- Параметры процедуры Факторной анализ
- Вывод описательных статистик
- Сохранение значений факторов
Тема 6. Дискриминантный анализ (продолжительность видео лекции 1 час 40 минут)
- Методы классификации на основе откликов
- Исходные данные для дискриминантного анализа
- Сходства дискриминантного анализа и логистической регрессии
- Различия дискриминантного анализа и логистической регрессии
- Цель и задачи дискриминантного анализа
- Предпосылки дискриминантного анализа
- Этапы дискриминантного анализа
- Методы дискриминантного анализа
- Исходные данные для дискриминантного анализа
- Линейная модель дискриминантного анализа
- Процедура Дискриминантный анализ
- Результаты процедуры Дискриминантный анализ
- Статистики процедуры Дискриминантный анализ
- Метод пошагового отбора процедуры Дискриминантный анализ
- Процедуры классификации
- Классификация на основе результатов дискриминантного анализа
- Классификационные статистики
- Геометрическая интерпретация классификационных функций
- Сохранение результатов классификации
Тема 7. Классификация методом ближайших соседей (продолжительность видео лекции 1 час)
- Сущность метода ближайших соседей
- Процедура Ближайшие соседи
- Задание правил определения ближайших соседей
- Отбор переменных для классификации
- Задание обучающей и контрольной выборки
- Сохранение результатов классификации
- Настройка вывода
- Обработка пропущенных значений
- Сводка результатов модели
- Пространство предикторов
- Оценка важности предикторов
- Диаграмма соседей
- Таблица соседей и расстояний до них
- Диаграмма квадрантов
- Значение ошибок при выборе числа предикторов и числа соседей
- Таблица классификации и сводка ошибок
Тема 8. Классификация на основе деревьев решений (продолжительность видео лекции 30 минут)
- Цель метода деревьев решений
- Терминология деревьев решений
- Задачи построения деревьев решения
- Области применения деревьев решений
- Преимущества и недостатки метода деревьев решений
- Методы деревьев решений
Тема 9. Построение деревьев решений методом CHAID (продолжительность видео лекции 1 час 40 минут)
- Описание метода CHAID
- Процедуры Деревья классификации
- Сводка модели дерева решений
- Диаграмма дерева решений
- Таблица выигрышей
- Таблицы риска и классификации
- Настройка вывода дерева
- Настройка вывода статистик
- Настройка вывода графиков
- Вывод правил классификации
- Ограничение размера дерева
- Сохранение результатов
- Проверка модели
- Обработка пропущенных значений
- Задание стоимостей ошибочной классификации
- Задание прибылей
- Задание значений зависимой порядковой переменной
Тема 10. Построение деревьев решений методами исчерпывающий CHAID, CRT, QUEST (продолжительность видео лекции 50 минут)
- Особенности метода исчерпывающий CHAID
- Особенности метода CRT
- Настройка отбора предикторов в модели CRT
- Вывод важности предикторов в модели CRT
- Отсечение ветвей
- Использование суррогатов
- Задание априорных вероятностей
- Особенности метода QUEST
Тема 11. Редактор дерева решений (продолжительность видео лекции 30 минут)
- Просмотр диаграммы дерева в Редакторе дерева
- Просмотр содержимого узла дерева
- Настройка внешнего вида диаграммы дерева
- Изменение ориентации диаграммы дерева
- Настройка содержимого узла дерева
- Отбор наблюдений в Редакторе дерева
Лабораторные работы (продолжительность видео лекции более 3 часов)
Дни | 32 ак. часа |
---|---|
Дата курса | По запросу |
Город | Все города |
Формат обучения | Вебинар (WEB) |