Меню
Главная
Авторизация/Регистрация
 
Главная arrow Статистика arrow Общая теория статистики

Комплексная задача и теории статистики

Задание. По данным каталога инвестиционных проектов Северо-Западного региона РФ в 2007 г. известны 16 проектов Ленинградской области, характеризующихся следующими показателями:

W — объем инвестиций (млн. руб.);

W2 — срок окупаемости (г.);

W3 — чистый дисконтированный доход (млн. руб.);

W4 — внутренняя норма доходности (%);

Исходные данные представлены в табл. 10.14.

Таблица 10.14

Значение показателей эффективности проектов

проекта

Объем

инвестиций

(WJ

Срок

окупаемости

(W2)

Чистый дисконтированный доход (W3)

Внутренняя норма доходности (W4)

1

37,5

5

1,1

30

2

9,2

4,2

1

33

3

9,2

6

1,2

36

4

7,2

9,2

1,21

24

5

2,4

6

0,25

18

6

11.7

9,6

1,24

17

7

8,3

2,7

1,1

30

8

3

4,8

1,39

20

9

6,9

2,5

0,64

21

10

10,8

3,3

1,79

21

11

30

7,8

1,8

33

12

11,4

3,6

0,58

33

13

15,6

2,4

1,24

24

14

12

2,4

12,5

15

5

3,6

1,9

12,5

16

2,5

3

0,68

24

Требуется:

1. Используя методологию регрессионного анализа, найти аналитическую зависимость и рассчитать уравнение парной регрессии, а также зависимость срока окупаемости, чистого дисконтированного дохода и внутренней нормы доходности, соответственно, от объема инвестиций, т. е. определить W2 = f(Wj), W2 = f(W3) и W2 = f(W4).

2. Применяя методологию корреляционного анализа, определить коэффициенты корреляции зависимостей, выведенных по п. 1. Выявить наиболее значимые факторы, влияющие на срок окупаемости (W2).

3. В полученном при вычислениях п. 2 уравнении многофакторной регрессии определить коэффициент множественной регрессии и параметры модели.

4. Проверить адекватность рассчитанной модели с использованием коэффициента множественной регрессии.

5. Используя методологию многофакторного дисперсионного анализа (для данных табл. 10.15), оценить существенность вклада в срок окупаемости: А — типа региона; В — номера интервала диапазона изменений объема инвестиций.

1. Применим к комплексной задаче основы

регрессионного анализа

В практике статистических исследований наибольшее распространение получили однофакторные линейные модели, широко используемые при прогнозировании развития экономических систем. Примером служит следующая аналитическая зависимость:

, т. е. уравнение регрессии.

Коэффициенты а0 и ар уравнения регрессии рассчитываются по методу наименьших квадратов (МНК) с использованием следующих аналитических зависимостей:

Производим необходимые расчетные процедуры по нахождению параметров следующих уравнений регрессии:

1.

2.

3.

247

Таблица 10.15

Исходные данные инвестиционных проектов субъектов Федерации

Субъекты Х^Федера- Х. ции

№ п/п ^Х^

Ленинградская

область

Кировская

область

Псковская

область

Республика

Карелия

Новгородская область

Калининградская

область

Вологодская

область

номер

В

А

В

А

В

А

В

А

В

А

В

А

В

А

1

3760

10

54,5

6,5

9,5

3

65

2,1

400

5

45

6

29,5

5

2

158

7,5

8,3

2,1

13,6

1,8

1,8

6

1,5

2

300

10

4,3

3

3

270

15

2

3

0.18

2

7

2

7

8

9

12

14.4

8

4

50

5

3.5

4,1

10

2

46.8

3

2,5

4

11

5

1,7

1,5

5

2300

5

30

4

0.154

1,6

30

5

12.6

4

45

6

6.93

2,9

6

110

6

13

4

1

1,5

2.5

5

2

1,5

2

5

2,5

2

7

160

5

1.96

2

6

3

3

7

10

3.2

8

6.5

8

25

6.5

1,2

1

110

5

4,8

6

0.8

1,8

14

8

9

200

5.2

31.8

2

30

4,8

7

2,7

1,1

1

0.5

5

10

97

3

1.62

1

20

7

0.31

1

0.95

2

11

1000

13

44

3

16.4

5.5

0.3

1,5

0.33

3

12

220

3

1,4

2

2,4

2

800

1,5

100

10

13

0,963

2,9

10

2

13,5

5

0,1

1,2

65

5

14

1,73

0,83

4,5

5

0,13

1

25,5

6

15

0,074

1

2

2

1,1

1,5

5,9

4

16

0.06

1

40

1,5

7,8

1,5

4

8

17

0.074

1

1,5

1,5

0.6

2.5

300

5

18

2,1

1,6

0.38

2

40

6

19

2

2,2

0.8

2.5

20

0.49

9

21

0.355

2

22

0.35

2

23

0.26

2,5

1.1. Расчет зависимостей

Расчет зависимости :

Расчет зависимости W., = f(W,):

Расчет зависимости W2 = f(W4):

1.2. Расчет зависимости W3 = f(W2)

1.3. Расчет зависимости W4 = f (W3)

2. Применим к комплексной задаче основы корреляционного анализа

Требуется установить корреляционную зависимость между сроком окупаемости проекта и остальными показателями массива данных.

Рассмотрим два фактора: X и Y.

Коэффициент корреляции двух факторов рассчитывается по формуле

где — корреляционный момент;

— оценки среднего значения факторов х. и у.; п — количество инвестиционных проектов;

— среднее квадратическое отклонение фактора X;

— среднее квадратическое отклонение

фактора Y.

2.1. Рассчитываем кху для факторов W2 и Wr

Как следует из представленного расчета, зависимость между сроком окупаемости и объемом инвестиций существенна.

2.2. Рассчитываем г для факторов WP и Wr

Как показывают расчеты, зависимость между сроком оку паемости и чистым дисконтированным доходом несущественна

2.3. Рассчитываем гху для факторов W2 и W4.

Как показывают расчеты, зависимость между сроком оку паемости и внутренней нормой доходности является сущест венной.

2.4. Рассчитываем гху для факторов W3 и W4.

Зависимость существенная.

Произведенные аналитические расчеты позволяют сделать следующий вывод: из четырех факторов, для которых оценивалась корреляционная зависимость, в дальнейших исследованиях остаются три фактора — W2, Wp W4, т. е. срок окупаемости (W2) в наибольшей степени зависит от объема инвестиций и внутренней нормы доходности (W4 и W4)

3. Выбор модели и оценка параметров множественной регрессии

В общем виде уравнение множественной, например, трехфакторной регрессии можно записать следующим образом:

А

где W — оценка срока окупаемости;

хх = 1 ?— исходный параметр (фиктивная переменная), принимаемый для упрощения дальнейших расчетов равным единице;

х2 — объем инвестиций (W4); х3 — внутренняя норма доходности (W4); bj, b2, b3 — постоянные коэффициенты (параметры модели). Определим коэффициенты bv b2, Ь3 с использованием метода наименьших квадратов, согласно которому параметры модели рассчитывают по следующим аналитическим зависимостям:

— исходная матрица размерностью (16x3);

где — параметры модели, причем г — номер переменной, а j — номер значения проекта;

— матрица размерностью (3x16), транспонированная к матрице X;

т • X)'1 — обратная матрица размерностью (3x3);

W — вектор-столбец неизвестных параметров.

Ввиду существенной неоднородности значений переменных, необходимо от натуральных значений параметров сделать переход к кодированным переменным, причем кодированная переменная изменяется в пределах:

3.1. Кодирование переменных для объема инвестиций (х2) и внутренней доходности (х3) осуществляется в соответствии с алгоритмом:

а) Рассчитаем координаты центра факторного пространства по переменным х2, х3.

б) Рассчитываем полуразность максимального и минимального значения переменной:

в) Зависимость для переменных х вычисляется по формуле

Кодирование переменных для объема инвестиций (х2):

Кодирование переменных для внутренней нормы доходности (х3):

Приведенные расчеты необходимо свести в таблицу значений кодированных переменных (табл. 10.16), которые в дальнейшем необходимы для расчета оценки срока окупаемости (W).

Исходную матрицу X и вектор-столбец W необходимо записать, используя данные табл. 10.14.

Таблица 10.16

Значения кодированных переменных

проекта

Срок окупаемости (W)

Объем инвестиций

W

Внутренняя норма доходности (х,)

1

5

1

0,49

2

4,2

-0.61

0,74

9

6

-0,61

1

4

9,2

-0,73

-0,02

5

6

-1

-0,53

6

9,6

-0,47

-0,62

7

2,7

-0,66

0,49

8

4,8

-0,97

-0,36

9

2,5

-0,74

-0.28

10

3,3

-0,52

-0,28

11

7,8

0,57

0,74

12

3,6

-0.49

0,74

13

_м_

-0,25

-0,02

Окончание табл. 10.16

Срок окупаемости

Объем инвестиций

Внутренняя норма

проекта

(W)

(я,)

доходности (х,)

14

2,4

-0,45

-1

15

3,6

-0,85

-1

16

3

-1

-0,02

Тогда матрица Хт, транспонированная к исходной матрице X, будет выглядеть следующим образом:

Произведение матриц (Хт • X) запишется в следующем виде:

Произведение матрицы Хтна вектор-столбец W рассчитывается следующим образом:

Итак, мы рассчитали произведение матриц Хт • X и вектор-столбец (Хт • W). Однако в зависимости

нет матрицы (Хт • X), а фигурирует ее обратная матрица, т. е. (Хт- X)"1, которую необходимо найти.

3.2. Алгоритм вычисления обратной матрицы

3.2.1. Определяем, квадратная ли исходная матрица. Если она квадратная, то переходим к п. 3.2.2, если нет, то обратной матрицы не существует, так как она является вырожденной.

3.2.2. Вычисляем определитель исходной матрицы. Если определитель равен 0, то обратной матрицы не существует; если он не равен 0, то переходим к п. 3.2.3.

3.2.3. Вместо каждого элемента исходной матрицы подставляем его алгебраическое дополнение.

3.2.4. Полученную матрицу транспонируем.

3.2.5. Элементы полученной матрицы делятся на определитель А (п. 3.2.2). Получаем обратную матрицу.

Проверяем работу алгоритма на практике:

3.2.1. Матрица

квадратная, следовательно, обратная матрица существует.

3.2.2. Вычисляем ее определитель:

Определитель матрицы не равен 0, следовательно, можно вычислить обратную матрицу.

3.2.3. Каждый элемент исходной матрицы заменяем его алгебраическим дополнением.

Получаем присоединенную матрицу

3.2.4. Полученную матрицу транспонируем; но, так как она симметричная относительно ее главной диагонали, то она запишется как исходная

3.2.5. Каждый элемент полученной матрицы делим на определитель, который мы рассчитали ранее. Получаем обратную матрицу:

Подставив полученные значения в зависимость получаем коэффициенты или параметры модели

Рассчитанное уравнение будет иметь вид:

Искомая аналитическая зависимость связывает срок окупаемости с объемом инвестиций и внутренней нормой доходности. Далее необходимо сравнить по вкладу в значения срока окупаемости рассматриваемых факторов. Для этого фактору х3 присвоим значение 0,38 (центр эксперимента), а фактору х2 значение: -0,12 и рассчитаем значение W и AW.

Приращение результирующего фактора (срок окупаемости) составит 0,68.

Приращение произошло за счет х2 — объема инвестиций.

Приращение произошло за счет х— внутренней нормы доходности.

Из полученных значений приращений, связанных с отдельными факторами, можно сделать вывод о том, что на значение срока окупаемости инвестиций наиболее существенное влияние оказывает такой фактор, как внутренняя норма доходности.

Адекватна ли исходная информация?

4. Проверка адекватности рассчитанной модели

Проверим адекватность модели с использованием коэффициента множественной корреляции.

Составим таблицу,

где W — исходные данные из каталога проектов (срок окупаемости);

W — данные, рассчитанные с использованием модели проекта (оценка срока окупаемости).

Сопоставительный анализ срока окупаемости и его оценки от объема инвестиций и внутренней нормы доходности представлен в табл. 10.17.

Если бы модель идеально отражала данные из каталога проектов, то эту ситуацию была бы представить в виде графика. (рис. 10.4).

Таблица 10.17

Таблица оценок срока окупаемости проектов

№ проекта

W

*2

*3

W

1

5

1

0,49

5,45

2

4,2

-0,61

0,74

5,1

3

6

-0,61

1

5,29

4

9,2

-0,73

-0,02

4,48

5

6

-1

-0,53

4

6

9,6

-0,47

-0,62

4,1

7

2,7

-0,66

0,49

4,89

8

4,8

-0,97

-0,36

4,14

9

2,5

-0,74

-0,28

4,28

10

3,3

-0,52

-0,28

4,35

11

7,8

0,57

0,74

5,5

12

3,6

-0,49

0,74

5,14

13

2,4

-0,25

-0,02

4,64

14

2,4

-0,45

-1

3,8

15

3,6

-0,85

-1

3,7

16

3

-1

-0,02

4,4

На практике модель искажает реальные данные. Реальные значения результирующего фактора образуют некоторое облако точек относительно биссектрисы угла графика зависимости реальных и модельных данных. В качестве показателя, характеризующего несоответствие “модельного” и реального результатов, для отдельного результата используют расстояние от биссектрисы до соответствующей точки.

Несоответствие реальных и “модельных” данных по всему массиву оценивают с помощью коэффициента множественной корреляции

где — среднее квадратическое отклоне

ние от оценки срока окупаемости;

Рис. 10.4. Зависимость реальных и модельных данных срока окупаемости инвестиций

— среднее квадратическое отклонение от математического ожидания срока окупаемости;

W = 4,76 — математическое ожидание срока окупаемости. Рассматриваем необходимые значения для определения адекватности модели:

Модель тем точнее отражает реальные данные, чем коэффициент множественной корреляции ближе к единице.

Вывод: между данными, полученными на модели и реальными данными связи практически нет. Модель неадекватна реальным значениям срока окупаемости.

5. Применим к комплексной задаче основы дисперсионного анализа

5.1. Оценка существенности вклада в срок окупаемости типа региона и номера интервала диапазона изменений объема инвестиций

5.1.1. Объемы инвестиций (в соответствии с табл. 10.15) предоставляем в виде вариационного ряда:

5.1.2. Разбиваем диапазон изменения объема инвестиций на 4 интервала и находим длину одного интервала (не учитываем резко отличающиеся значения показателей):

5.1.3. Составляем таблицу сроков окупаемости, соответствующих значениям объемов инвестиций в данных интервалах (табл. 10.18):

Таблица 10.18

Интервал

Д

Ленинградская

область

Кировская область

Псковская область

Республика Карелия

Новгородская

область

Калинградская

область

Вологодская облатсь

Bj(O-lO)

2,9

2,1; 3; 4,1; 2; 1

3; 2; 1,6; 1,5; 3; 1; 2; 0,83; 1; 1; 1

6; 2; 5; 7; 6; 2,7; 2; 5; 2; 1,5; 1,6; 2,2

2; 8; 4; 1,5; 1,8; 1; 1; 1,5; 1,2; 1;

ш

2,5; 3; 2; 2; 2,5

12; 5; 6,5; 5; 2; 3; 4; 8

3; 1,5; 2,9; 2

в2(10-30)

6,5

4

1,8; 2; 2

7; 5,5; 5

4; 3,2

5; 8; 6

5; 8

В3(30-100)

5

6,5; 4; 2

4,8; 3

2,1; 3; 5; 1,5

6; 6; 5; 6

в4(>100)

10; 7,5; 15; 5; 6; 5; 5,2; 13; 3

5

5; 1,5

10; 10; 5

5.1.4. Составляем таблицу для средних значений сроков окупаемости, соответствующих значениям объемов инвестиций в данных интервалах (табл. 10.19):

Таблица 10.19

Интервал

Д

Ленинградская

область

Кировская

область

Псковская

область

Республика

Карелия

Новгородская

область

Калинградская

область

Вологодская

облатсь

I

В,(0-10)

2,9

2,44

1,63

3,58

2,23

5,68

2,35

20,81

в,(10-30)

6,5

4

1,93

5,83

3,6

6,3

6,5

34,66

В,(30-100)

5

4,16

5

2,9

0

5,75

0

22,81

в,(100-)

7,74

0

5

0

3,25

8,3

0

24,29

I

22,14

10,6

13,56

12,31

9,08

26,03

8,85

102,57

5.2. Методика многофакторного дисперсионного анализа:

5.2.1. Вычисляем сумму квадратов всех наблюдений:

5.2.2. Определяем сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:

5.2.3. Вычисляем сумму квадратов итогов по строкам, деленную на число наблюдений в строке:

5.2.4. Вычисляем значение квадрата общего итога, деленного на число всех наблюдений (табл. 10.19):

5.2.5. Определяем оценки следующих дисперсий:

А) дисперсия ошибок измерений:

где i -— количество субъектов РФ;

j — количество интервалов.

Б) дисперсия, связанная с первым фактором (типом региона):

В) дисперсия, связанная со вторым фактором (номер интервала в диапазоне значений объемов инвестиций):

5.2.6. Проверка гипотезы о значимости факторов осуществляется с использованием F-статистики, при этом вычисляем F-статистику (приложение 4):

Получаем:

Из таблицы Фишера (приложение 4) при уровне значимости а = 0,05 находим:

- для первого фактора:

- для второго фактора:

Вывод. Так как табличные значения F-статистики больше рассчитанных в задаче, то оба фактора (тип региона и номер интервала в диапазоне значений объемов инвестиций) влияют на срок окупаемости.

Вопросы для самопроверки

1. Чем отличаются друг от друга функциональная и корреляционная зависимости?

2. Что собой представляет корреляционная связь?

3. Какой метод определения параметров уравнения регрессии вы знаете?

4. С помощью каких коэффициентов определяется мера близости исследуемых признаков или однофакторной регрессионной модели?

5. Каков смысл и значение коэффициента детерминации?

6. Как осуществляется проверка значимости параметров линейной однофакторной регрессионной модели?

7. Как проверяется значимость уравнения парной линейной регрессии в целом?

8. Какие непараметрические методы моделирования корреляционной связи вы знаете?

9. Какие ранговые коэффициенты для установления тесноты корреляционной связи вам известны?

10. Каковы суть и значение частной корреляции первого порядка?

11. Каковы значение и сущность совокупного коэффициента множественной детерминации?

12. Какие криволинейные парные регрессионные модели вы знаете?

13. Какие криволинейные многофакторные регрессионные модели вам известны?

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
 
Популярные страницы