Автокорреляционная функция. Примеры расчётов

Поиск периодических составляющих временного ряда с помощью коррелограммы. Коэффициент автокорреляции и его оценка. Примеры автокорреляционной функции. Критерий Дарбина-Уотсона. Практические расчеты с помощью макроса Excel

Содержание

Что представляет собой корреляционный анализ

Простыми словами, корреляция – это связь между двумя явлениями. В свою очередь, под корреляционным анализом подразумевают выявление этой связи. Очень частое утверждение гласит, что корреляция – это зависимость между разными объектами, но на деле это неточное определение. Ведь существует множество изображений, которые показывают связь между явлениями, которые никак не могут быть зависимы друг от друга или одного третьего фактора, который влияет на них.

Для определения зависимости используется другой тип анализа, который называется регрессионным.

Величина, определяющая степень выраженности взаимосвязи, называется коэффициентом корреляции. Это единственная величина, которая рассчитывается корреляционным анализом по сравнению с регрессионным. Возможные вариации коэффициента корреляции могут быть в пределах от -1 до 1. Если это число положительное, взаимосвязь между динамикой изменения значений прямая. Если же отрицательное, то увеличение числа 1 приводит к аналогичному уменьшению числа 2. Если число меньше единицы по модулю, то корреляция неполная. Например, увеличение числа 1 на единицу приводит к увеличению числа 2 на 0,5. В таком случае коэффициент корреляции составляет 0,5. Если же коэффициент корреляции составляет 0, то взаимосвязи между двумя переменными нет.

Интересный факт: корреляции делятся на истинные и ложные. То есть, иногда то, что графики идут в одинаковом направлении, может быть чистой случайностью, а не закономерным следствием воздействия одной переменной на другую или влияния общего фактора на обе переменные. В узких кругах довольно популярны картинки, где коррелируют между собой абсолютно не связанные явления. Вот некоторые примеры:

  1. Количество человек, которые стали утопленниками в бассейнах, четко коррелирует с количеством фильмов, в которых Николас Кейдж был актером.
  2. Количество съеденной моцареллы и количество человек, которые получили докторскую степень, также коррелирует на протяжении 2000-2009 годов. Наверно, действительно, моцарелла как-то влияет на мозг и стимулирует желание совершать научные открытия.
  3. Почти во всех случаях средний возраст женщин, которые получили статус «Мисс Америка» коррелирует с количеством людей, которые погибли от нахождения в горячем паре.
  4. Число людей, которое погибло в результате дорожно-транспортного происшествия, четко коррелирует с количеством сметаны, которое съедают люди.
  5. Мало кто знает, что чем больше курятины человек ест, тем больше сырой нефти импортируется в мире. Правда, это тоже пример ложной корреляции. Кстати, импорт сырой нефти родом из Норвегии тесно связано с количеством людей, которые погибли в результате столкновения автомобиля с поездом. Причем в этом случае корреляция почти 100 процентов.
  6. А еще маргарин негативно влияет на статистику разводов. Чем больше людей, которые проживали в штате Мэн, потребляли маргарина, тем выше была частота разводов. Правда, здесь еще может быть рациональное зерно. Ведь частота потребления маргарина имеет обратную корреляцию с экономическим положением в семье. В свою очередь, плохое экономическое положение в семье имеет непосредственную связь с количеством разводов. И это уже доказано научно. Так что кто знает, может, эта корреляция и не является такой ложной. Правда, никто этого не перепроверял.
  7. Количество денег, которое правительство США тратит на развитие науки, космоса и технологий, имеет тесную связь с количеством самоубийств, проведенных в форме повешения или удушения.

Ну и наконец, еще один пример ложной корреляции – чем больше сыра люди едят, тем больше людей умирает из-за того, что они запутываются в своих простынях.

Поэтому несмотря на то, что корреляция является эффективным статистическим инструментом, нужно учиться отфильтровывать истинные взаимосвязи между явлениями и ложные. Иначе исследование может получить такие интересные результаты. А теперь переходим непосредственно к тому, как проводить корреляционный анализ в Excel.

Поиск периодических составляющих временного ряда с помощью коррелограммы. Коэффициент автокорреляции и его оценка. Примеры автокорреляционной функции. Критерий Дарбина-Уотсона. Практические расчеты с помощью макроса Excel “Автокорреляционная функция”.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 05.05.2011
Размер файла 2,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Курсовая работа

Тема:

Автокорреляционная функция. Примеры расчётов

1.1 Коэффициент автокорреляции и его оценка

Для совершенной характеристики случайного движения недостаточно его математического ожидания и дисперсии. Вероятность того, что на определенном месте возникнут те или иные конкретные значения зависит от того, какие роли случайная величина получила раньше или будет получать позже.

Другими словами, существует поле рассеяния пар значений x(t), x (t+n) временного ряда, где n – постоянный интервал или задержка, которая характеризует зависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации –

g (n) = E[(x(t) – m) (x (t + n) – m)] –

и автокорреляции

r (n) = E[(x(t) – m) (x (t + n) – m)] / D,

где m и D – математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p (x(t1), x(t2)).

r (n) = g (n) /g (0),

откуда вытекает, что r (0) = 1. В тех же условиях стационарности множитель корреляции r (n) между двумя значениями временного ряда зависит лишь от величины временного интервала n и не зависит от самих моментов наблюдений t. Коэффициент автокорреляции может быть оценен и для нестационарного ряда, но в этом случае его вероятностная интерпретация теряется.

В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (n) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический коэффициент автокорреляции с задержкой n

автокорреляционный функция excel расчет

Главным из различных коэффициентов автокорреляции является первый – r1, измеряющий тесноту связи между уровнями x(1), x(2),…, x (n -1) и x(2), x(3),…, x(n).

Распределение коэффициентов автокорреляции неизвестно, поэтому для оценки их правдивости иногда используют непараметрическую теорию Андерсона (1976), предложившего статистику [4, 112]

t = r1 (n -1)0.5,

которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице (Тинтнер, 1965).

Корреляционный анализ в Excel — 2 способа

Вычисление коэффициента корреляции осуществляется двумя способами. Первый – это использование Мастера функций, который позволяет ввести формулу КОРРЕЛ. Второй инструмент – это пакет анализа, требующий отдельной активации.

Приведем данные о ВВП РФ

Год

квартал

ВВП

первая разность

2001

I

1900,9

II

2105,0

204,1

III

2487,9

382,9

IV

2449,8

-38,1

2002

I

2259,5

-190,3

II

2525,7

266,2

III

3009,2

483,5

IV

3023,1

13,9

2003

I

2850,7

-172,4

II

3107,8

257,1

III

3629,8

522,0

IV

3655,0

25,2

2004

I

3516,8

-138,2

II

3969,8

453,0

III

4615,2

645,4

IV

4946,4

331,2

2005

I

4479,2

-467,2

II

5172,9

693,7

III

5871,7

698,8

IV

6096,2

224,5

2006

I

5661,8

-434,4

II

6325,8

664,0

III

7248,1

922,3

IV

7545,4

297,3

2007

I

6566,2

-979,2

II

7647,5

1081,3

Как выполнить корреляцию в Excel?

Самым трудоемким этапом определения корреляции является набор массива данных. Сравниваемые данные располагаются обычно в двух колонках или строчках. Таблицу следует делать без пропусков в ячейках. Современные версии Excel (с 2007 и младше) не требуют установок дополнительных настроек для статистических расчетов; необходимые манипуляции можно сделать в разделе формул:

  1. Выбрать пустую ячейку, в которую будет выведен результат расчетов.
  2. Нажать в главном меню Excel пункт «Формулы».
  3. Среди кнопок, сгруппированных в «Библиотеку функций», выбрать «Другие функции».
  4. В выпадающих списках выбрать функцию расчета корреляции (Статистические — КОРРЕЛ).
  5. В Excel откроется панель «Аргументы функции». «Массив 1» и «Массив 2» — это диапазоны сравниваемых данных. Для автоматического заполнения этих полей можно просто выделить нужные ячейки таблицы.
  6. Нажать «ОК», закрыв окно аргументов функции. В ячейке появится подсчитанный коэффициент корреляции.

Корреляция может быть прямая (если коэффициент больше нуля) и обратная (от -1 до 0).

Первая означает, что при росте одного параметра растет и другой. Обратная (отрицательная) корреляция отражает факт, что при росте одной переменной другая уменьшается.

Корреляция может быть близка к нулю. Это обычно свидетельствует, что исследуемые параметры не связаны друг с другом. Но иногда нулевая корреляция возникает, если сделана неудачная выборка, которая не отразила связь, либо связь имеет сложный нелинейный характер.

Если коэффициент показывает среднюю или сильную взаимосвязь (от ±0,5 до ±0,99), следует помнить, что это лишь статистическая взаимосвязь, которая вовсе не гарантирует влияние одного параметра на другой. Также нельзя исключать ситуации, что оба параметра независимы друг от друга, но на них воздействует какой-нибудь третий неучтенный фактор. Excel помогает моментально вычислить коэффициент корреляции, но обычно только количественных методов недостаточно для установления причинно-следственных связей в соотносимых выборках.kak-vypolnyaetsya-korrelyaciya-v-excel-102

Отблагодари меня, поделись ссылкой с друзьями в социальных сетях:

Оставить комментарий ВКонтакте

Ниже даны значения автокорреляционной функции и уровня белого шума

АКФ(…)

Ошибка АКФ

1

0,856

0,203

-0,203

2

0,762

0,616

-0,616

3

0,658

0,747

-0,747

4

0,550

0,831

-0,831

5

0,418

0,885

-0,885

6

0,315

0,915

-0,915

7

0,224

0,932

-0,932

8

0,131

0,940

-0,940

Если нас интересует внутренняя динамика ряда необходимо найти первую разность его членов, т.е. для каждого квартала найти изменение значения по сравнению с предыдущим кварталом. Для первой разности построим автокорреляционную функцию.

Статистика Дарбина-Ватсона (DW) =1,813

DW Up= 1,450

DW Low=1,290

Как построить поле корреляции в Excel

Итак, давайте теперь разберемся, как построить поле корреляции. Для начала нужно разобраться, что это вообще такое. Под корреляционным полем подразумевается фактически график корреляции. Главное требование к такой диаграмме – каждая точка должна соответствовать единице совокупности. Поле корреляции поможет установить более глубокие связи и проанализировать данные более качественно. Для начала нам нужно найти коэффициент корреляции между двумя диапазонами, используя функцию КОРРЕЛ. Как построить график корреляции в Excel

После того, как мы это сделали, мы теперь можем сделать поле корреляции. Для этого выполняем следующие действия:

  1. Переходим во вкладку «Вставка» и там находим вариант диаграммы «точечный график». Как построить график корреляции в Excel
  2. После того, как мы его добавили, нажимаем по будущему полю корреляции правой кнопкой мыши и вызываем контекстное меню. Далее нажимаем на «Выбрать данные». Как построить график корреляции в Excel
  3. Далее выбираем наш диапазон в качестве источника данных. После этого подтверждаем свои действия нажатием клавиши ОК. Все остальные действия программа выполнит самостоятельно. Как построить график корреляции в Excel

Этот график можно построить не только на основе корреляции, определенной через функцию КОРРЕЛ.

Дано

год

квартал

номер

значение

разность

1999

I

1

3,10

II

2

3,40

0,30

III

3

3,33

-0,07

IV

4

3,80

0,47

2000

I

5

3,20

-0,60

II

6

3,60

0,40

III

7

3,70

0,10

IV

8

4,33

0,63

2001

I

9

3,60

-0,73

II

10

4,43

0,83

III

11

4,30

-0,13

IV

12

5,17

0,87

2002

I

13

4,13

-1,03

II

14

4,77

0,63

III

15

5,20

0,43

IV

16

5,97

0,77

2003

I

17

5,10

-0,87

II

18

5,90

0,80

III

19

6,33

0,43

IV

20

7,23

0,90

2004

I

21

6,43

-0,80

II

22

7,70

1,27

III

23

8,17

0,47

IV

24

9,08

0,92

2005

I

25

8,17

-0,92

II

26

9,80

1,63

III

27

10,50

0,70

IV

28

12,47

1,97

2006

I

29

10,40

-2,07

II

30

12,67

2,27

III

31

14,20

1,53

IV

32

17,10

2,90

Построим автокорреляционную функцию

АКФ(…)

Ошибка АКФ

1

0,802

0,211

-0,211

2

0,693

0,535

-0,535

3

0,585

0,637

-0,637

4

0,566

0,701

-0,701

5

0,423

0,756

-0,756

6

0,343

0,785

-0,785

7

0,255

0,803

-0,803

8

0,231

0,813

-0,813

9

0,131

0,822

-0,822

10

0,072

0,824

-0,824

Рейтинг
( 1 оценка, среднее 5 из 5 )
Загрузка ...