Полная версия

Главная arrow Информатика arrow ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

ДВУМЕРНЫЙ АНАЛИЗ: СУММАРИЗАЦИЯ И КОРРЕЛЯЦИЯ ДВУХ ПРИЗНАКОВ

В данном разделе приводится несколько важных характеристик суммаризации и корреляции двух признаков, а также некоторые способы их использования, такие как: (а) поле рассеяния (.scatter-plot), линейная регрессия и коэффициент корреляции двух количественных признаков; (б) бокс-плот, табличная регрессия, корреляционное отношение, декомпозиция разброса количественного признака и классификатор по ближайшему соседу для случая смешанных шкал; (в) для двух номинальных признаков: таблица сопряженности, коэффициент Кетле, статистическая независимость и хи-квадрат Пирсона, который может считаться показателем связи признаков, а не только критерием статистической независимости, как обычно.

В результате изучения данной главы студент будет:

знать

  • • понятия, связанные с анализом пары количественных признаков: иоле рассеяния, линейная регрессия, коэффициенты корреляции и детерминации, а также их свойства;
  • • аппроксимационную и вероятностную интерпретации коэффициента корреляции;
  • • понятие о нелинейной регрессии; оценку параметров экспоненциальной регрессии с помощью линеаризации и методом, инспирированным природой;
  • • понятия, связанные с анализом пары признаков, один из которых номинальный, а другой — количественный: табличная регрессия, межгрупповая дисперсия, коэффициент корреляционного отношения и его свойства, классификатор по методу ближайшего соседа;
  • • понятия, связанные с анализом пары поминальных признаков: таблица сопряженности, условная частота и вероятность, статистическая независимость, коэффициенты Кетле и их смысл, коэффициент хи-квадрат, его экстремальные значения и их смысл;

уметь

  • • вычислять и визуализировать понятия, связанные с анализом пары количественных признаков: поле рассеяния, линейную регрессию и коэффициенты корреляции и детерминации;
  • • оценивать параметры экспоненциальной регрессии с помощью линеаризации и методом, инспирированным природой;
  • • вычислять табличную регрессию и коэффициент корреляционного отношения количественного признака относительно номинального признака;
  • • вычислять и визуализировать понятия, связанные с анализом пары номинальных признаков: таблицу сопряженности, условные частоты, коэффициенты Кетле, коэффициент хи-квадрат, а также его визуализацию через коэффициенты Кетле;

владеть навыками

  • • использования МатЛаба или другой вычислительной среды для вычисления и визуализации понятий, связанных с анализом пары количественных признаков: поля рассеяния, линейной регрессии, коэффициентов корреляции и детерминации;
  • • использования МатЛаба или другой вычислительной среды для оценки параметров экспоненциальной регрессии с помощью линеаризации и методом, инспирированным природой;
  • • использования МатЛаба или другой вычислительной среды для вычисления табличной регрессии и коэффициента корреляционного отношения количественного признака относительно номинального признака;
  • • использования МатЛаба или другой вычислительной среды для вычисления и визуализации понятий, связанных с анализом пары номинальных признаков: таблиц сопряженности, условных частот, коэффициентов Кегле, коэффициента хи-квадрат, а также его визуализации через коэффициенты Кетле.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>