Полная версия

Главная arrow Статистика arrow СТАТИСТИКА

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ДВУМЕРНЫХ ДАННЫХ

В результате освоения данной темы студент должен:

знать

• основные методы статистического анализа взаимосвязи между двумя признаками, виды уравнений регрессии и их особенности, формулы расчета коэффициентов корреляции, коэффициентов регрессии, показателей динамики временных рядов и прогнозирования;

уметь

  • • определять тесноту связи между категориальными и количественными признаками;
  • • рассчитывать коэффициенты корреляции и регрессии, показатели динамики временных рядов и прогнозы, строить графики и интерпретировать результаты;

владеть

• категориями, понятиями и методами анализа двумерных данных.

Определение степени зависимости признаков

Пусть имеются данные п наблюдений, каждое из которых характеризуется двумя признаками: х и г/.Таким образом, имеется п двумерных данных: (Xj, У У2)1 •••> (рСр yj)> •••> 0*7v Уп)'

Например, каждое из п домашних хозяйств характеризуются среднедушевым доходом (х) и среднедушевыми сбережениями (у), или каждое из п предприятий характеризуется себестоимостью продукции (у) и производительностью труда (х).

Требуется наряду с характеристиками каждого признака: х, у, Sх2, S2 и т.д. проанализировать зависимость между х и у. Исследование объективно существующих зависимостей и взаимосвязей между явлениями играет в экономике значительную роль. Важно уметь количественно измерить тесноту причинно-следственных связей и выявить форму связи между экономическими явлениями, что позволяет лучше понять их природу. Это в свою очередь позволяет воздействовать на выявленные факторы и соответствующие процессы с целью получения нужных результатов. Зависимости между экономическими показателями бывают функциональные и стохастические.

Зависимость между двумя признаками х и у называется функциональной, если каждому значению величины х соответствует единственное значение величины у, и наоборот.

Примером функциональной связи в экономике может служить зависимость производительности груда от объема произведенной продукции и затрат рабочего времени.

Однако гораздо чаще в экономике имеет место не функциональная, а статистическая зависимость, когда каждому фиксированному значению переменой х соответствует не одно, а множество значений зависимой переменной у, причем заранее нельзя сказать, какое именно значение примет у. Это связано с тем, что наг/, кроме ху влияют и другие неконтролируемые переменные.

Частным случаем статистической зависимости является корреляционная зависимость, при которой функциональной зависимостью связаны признак х и среднее значение результативной переменной у.

Статистическая зависимость может быть выявлена по результатам достаточно большого числа наблюдений. Графически статистическая зависимость двух признаков может быть представлена с помощью поля корреляции, при построении которого на оси абсцисс откладываются значения признака х, по оси ординат — значения г/, а каждое наблюдение отображается точкой на плоскости.

Исследование зависимостей включает задачи двух видов: определение степени и вида зависимости между признаками х и у. Рассмотрим в содержательном плане эти задачи. Представим п наблюдений на плоскости, когда каждое i-e наблюдение (xjy у), где /=1,2,..., п отображается точкой (рис. 5.1) и получим поле корреляции. Предположим, что все п наблюдений находятся внутри эллипса. Найдем средние значения у yvyv уъ для трех значений переменной х: х х2 и х3. Соединим полученные точки на плоскости прямой.

Поле корреляции и уравнение регрессии

Рис. 5.1. Поле корреляции и уравнение регрессии

Полученное уравнение прямой у = Ь0 + Ь{х называют уравнением регрессии, которое характеризует функциональную зависимость среднего значения у от переменной х, т.е. вид зависимости у от х.

Рассмотрим теперь два набора данных объемом п: (,хух), (х2, г/2), •••> п,уп) и (x'vy[ (х', у'), (х'п,у'п). Графически эти данные представлены

на рис. 5.2, а и б.

Из рис. 5.2. следует, что данные для случаев а и б характеризуются одинаковыми уравнениями регрессии, так как параметры уравнений (Ь0 и Ь) равны. Однако из рис. 5.2 видно по полю корреляции, что уравнение у = Ь0 + Ьхх в случае а более адекватно характеризует исследуемое явление, чем в случае б. Эго обусловлено тем, что степень линейной зависимости между х и у в случае а выше, чем в случае 6. Таким образом, уравнение регрессии более адекватно исследуемому явлению, если степень зависимости между х и у выше (в случае а, чем в случае б).

Степень зависимости переменныххиу

Рис. 5.2. Степень зависимости переменныххиу

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>