Реферат: Использование корреляционно-регрессионного анализа для обработки экономических статистических данных

Министерство образования  Российской Федерации

Ивановский государственный университетФизический факультетКафедра теоретической физики,математического и компьютерногомоделирования

КУРСОВАЯ РАБОТА

на тему

“Использование корреляционно-регрессионного анализадля обработки экономических статистических данных”

Выполнил:

студент3 курса Одинокий А.В.

Научный руководитель:

доцент Озерова В.М.

Иваново 2002


СОДЕРЖАНИЕ

1.    

2.    

3.    

4.    

5.    

6.    

7.    


Введение

Обработка статистических данных  уже давно применяется в  самых разнообразныхвидах человеческой деятельности. Вообще говоря, трудно назвать ту сферу, вкоторой она бы не использовалась. Но, пожалуй, ни в одной области знаний ипрактической деятельности обработка статистических данных  не играет такой исключительно большой роли,как в экономике, имеющей дело с обработкой и анализом огромных массивовинформации о социально-экономических явлениях и процессах. Всесторонний иглубокий анализ этой информации, так называемых статистических данных,предполагает использование различных специальных методов, важное место средикоторых занимает корреляционный и регрессионный анализы обработкистатистических данных.

В экономических исследованиях часто решают задачувыявления факторов, определяющих уровень и динамику экономического процесса.Такая задача чаще всего решается методами корреляционного и регрессионногоанализа. Для достоверного отображения объективно существующих в экономикепроцессов необходимо выявить существенные взаимосвязи и не только выявить, но идать им количественную оценку. Этот подход требует вскрытия причинныхзависимостей. Под причинной зависимостью понимается такая связь междупроцессами, когда изменение одного из них является следствием изменениядругого.

Основными задачами корреляционного анализа являются оценкасилы связи и проверка статистических гипотез о наличии и силе корреляционнойсвязи. Не все факторы, влияющие на экономические процессы, являются случайнымивеличинами, поэтому при анализе экономических явлений обычно рассматриваютсясвязи между случайными и неслучайными величинами. Такие связи называютсярегрессионными, а метод математической статистики, их изучающий, называетсярегрессионным анализом.

Использование возможностей современной вычислительнойтехники, оснащенной пакетами программ машинной обработки статистическойинформации на ЭВМ, делает практически осуществимым оперативное решение задачизучения взаимосвязи показателей биржевых ставок  методами корреляционно-регрессионногоанализа.

При машинной обработке исходной информации на ЭВМ,оснащенных пакетами стандартных программ ведения анализов, вычислениепараметров применяемых математических функций является быстро выполняемойсчетной операцией.

Данная работа посвящена изучению возможности обработкистатистических данных биржевых ставок методами корреляционного и  регрессионного анализа с использованиемпакета прикладных программ Microsoft Excel.


Ролькорреляцонно-регрессионного анализа в обработке экономических данных

Корреляционный анализ ирегрессионный анализ являются смежными разделами математической статистики, ипредназначаются для изучения по выборочным данным статистической зависимостиряда величин; некоторые из которых являются случайными. При статистическойзависимости величины не связаны функционально, но как случайные величины заданысовместным распределением вероятностей. Исследование взаимосвязи случайныхвеличин биржевых ставок приводит к теории корреляции, как разделу теориивероятностей и корреляционному анализу, как разделу математической статистики.Исследование зависимости случайных величин приводит к моделям регрессии ирегрессионному анализу на базе выборочных данных. Теория вероятностей иматематическая статистика представляют лишь инструмент для изучениястатистической зависимости, но не ставят своей целью установление причиннойсвязи. Представления и гипотезы о причинной связи должны быть привнесены изнекоторой другой теории, которая позволяет содержательно объяснить изучаемоеявление.

 Формально корреляционная модель взаимосвязисистемы случайных величин <img src="/cache/referats/11467/image002.gif" v:shapes="_x0000_i1025"><img src="/cache/referats/11467/image004.gif" v:shapes="_x0000_i1026">Z – набор случайных величин,оказывающих влияние на изучаемые случайные величины.

Экономическиеданные почти всегда представлены в виде таблиц. Числовые данные, содержащиеся втаблицах, обычно имеют между собой явные (известные) или неявные (скрытые)связи.

Явносвязаны показатели, которые получены методами прямого счета, т. е. вычислены позаранее известным формулам. Например, проценты выполнения плана, уровни,удельные веса, отклонения в сумме, отклонения в процентах, темпы роста, темпыприроста, индексы и т. д.

Связиже второго типа (неявные) заранее неизвестны. Однако необходимо уметь объяснятьи предсказывать (прогнозировать) сложные явления для того, чтобы управлять ими.Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимостии выразить их в виде формул, т. е. математически смоделировать явления илипроцессы. Одну из таких возможностей предоставляет корреляционно-регрессионныйанализ.

Математическиемодели строятся и используются для трех обобщенных целей:

• дляобъяснения;

• дляпредсказания;

• дляуправления.

Представлениеэкономических и других данных в электронных таблицах в наши дни стало простым иестественным. Оснащение же электронных таблиц средствами корреляционно-регрессионногоанализа способствует тому, что из группы сложных, глубоко научных и потомуредко используемых, почти экзотических методов, корреляционно-регрессионныйанализ превращается для специалиста в повседневный, эффективный и оперативный аналитическийинструмент. Однако, в силу его сложности, освоение его требует значительнобольших знаний и усилий, чем освоение простых электронных таблиц.

Пользуясьметодами корреляционно-регрессионного анализа, аналитики измеряют теснотусвязей показателей с помощью коэффициента корреляции. При этом обнаруживаютсясвязи, различные по силе (сильные, слабые, умеренные и др.) и различные понаправлению (прямые, обратные). Если связи окажутся существенными, тоцелесообразно будет найти их математическое выражение в виде регрессионноймодели и оценить статистическую значимость модели. В экономике значимоеуравнение используется, как правило, для прогнозирования изучаемого явления илипоказателя.

Регрессионныйанализ называют основным методом современной математической статистики длявыявления неявных и завуалированных связей между данными наблюдений.Электронные таблицы делают такой анализ легко доступным. Таким образом,регрессионные вычисления и подбор хороших уравнений — это ценный, универсальныйисследовательский инструмент в самых разнообразных отраслях деловой и научнойдеятельности (маркетинг, торговля, медицина и т. д.). Усвоив технологиюиспользования этого инструмента, можно применять его по мере необходимости,получая знание о скрытых связях, улучшая аналитическую поддержку принятиярешений и повышая их обоснованность.

Корреляционно-регрессионныйанализ считается одним из главных методов в маркетинге, наряду соптимизационными расчетами, а также математическим и графическим моделированиемтрендов (тенденций). Широко применяются как однофакторные, так и множественныерегрессионные модели.


Корреляционно-регрессионныйанализ и его возможности

Корреляционный анализявляется одним из методов статистического анализа взаимосвязи несколькихпризнаков.

Он определяется как метод,применяемый тогда, когда данные наблюдения можно считать случайными ивыбранными из генеральной совокупности, распределенной по многомерномунормальному закону. Основная задача корреляционного анализа (являющаясяосновной и в регрессионном анализе) состоит в оценке уравнения регрессии.

Корреляция – этостатистическая зависимость между случайными величинами, не имеющими строгофункционального характера, при которой изменение одной из случайных величинприводит к изменению математического ожидания другой.

1.               Парная корреляция – связь между двумя признаками (результативным ифакторным или двумя факторными).

2.               Частная корреляция – зависимость между результативным и одним факторнымпризнаками при фиксированном значении других факторных признаков.

3.               Множественная корреляция – зависимость результативного и двух или болеефакторных признаков, включенных в исследование.

Корреляционный анализ имеетсвоей задачей количественное определение тесноты связи между двумя признаками(при парной связи) и между результативным признаком и множеством факторныхпризнаков (при многофакторной связи).

Теснота связи количественновыражается величиной коэффициентов корреляции. Коэффициенты корреляции,представляя количественную характеристику тесноты связи между признаками, даютвозможность определить «полезность» факторных признаков при построенииуравнений множественной регрессии. Величина коэффициентов корреляции служиттакже оценкой соответствия уравнению регрессии выявленным причинно-следственнымсвязям.

Первоначально исследованиякорреляции проводились в биологии, а позднее распространились и на другиеобласти, в том числе на социально-экономическую. Одновременно с корреляциейначала использоваться и регрессия. Корреляция и регрессия тесно связаны междусобой: первая оценивает силу (тесноту) статистической связи, вторая исследуетее форму. И корреляция, и регрессия служат для установления соотношений междуявлениями и для определения наличия или отсутствия связи между ними.


Предпосылкикорреляционного и регрессионного анализа

Перед рассмотрениемпредпосылок корреляционного и регрессионного анализа, следует сказать, чтообщим условием, позволяющим получить более стабильные результаты при построениикорреляционных и регрессионных моделей биржевых ставок, является требованиеоднородности исходной информации. Эта информация должна быть обработана напредмет аномальных, т.е. резко выделяющихся из массива данных, наблюдений. Этапроцедура выполняется за счет количественной оценки однородности совокупностипо какому-либо одномерному или многомерному критерию (в зависимости от исходнойинформации) и имеет цель тех объектов наблюдения, у которых наилучшее (илинаихудшее) условия функционирования по не зависящим или слабо зависящимпричинам.

После обработки данных напредмет «аномальности» следует провести проверку, насколько оставшаясяинформация удовлетворяет предпосылкам для использования статического аппаратапри построении моделей, так как даже незначительные отступления от этихпредпосылок часто сводят к нулю получаемый эффект. Следует иметь  ввиду, что вероятностное или  статистическое решение любой экономическойзадачи должно основываться на подробном осмыслении исходных математическихпонятий и предпосылок, корректности и объективности сбора исходной информации,в постоянном сочетании с теснотой связи экономического иматематико-статистического анализа.

Для применениякорреляционного анализа необходимо, чтобы все рассматриваемые переменные былислучайными и имели нормальный закон распределения. Причем выполнение этихусловий необходимо только при вероятностной оценке выявленной тесноты связи.

Рассмотрим простейшие случайвыявления тесноты связи – двумерную модель корреляционного анализа.

Для характеристики теснотысвязи между двумя переменными обычно пользуются парным коэффициентом корреляции<img src="/cache/referats/11467/image006.gif" v:shapes="_x0000_i1027"><img src="/cache/referats/11467/image008.gif" v:shapes="_x0000_i1028">

<img src="/cache/referats/11467/image010.gif" v:shapes="_x0000_i1029">

а его выборочное значение –по формуле <img src="/cache/referats/11467/image012.gif" v:shapes="_x0000_i1030">

При малом числе наблюдений выборочный коэффициенткорреляции удобно вычислять по следующей формуле:

<img src="/cache/referats/11467/image014.gif" v:shapes="_x0000_i1031">

Величина коэффициентакорреляции изменяется в интервале <img src="/cache/referats/11467/image016.gif" v:shapes="_x0000_i1032">

При <img src="/cache/referats/11467/image018.gif" v:shapes="_x0000_i1033"> между двумяпеременными существует функциональная связь, при <img src="/cache/referats/11467/image020.gif" v:shapes="_x0000_i1034"> - прямаяфункциональная связь. Если <img src="/cache/referats/11467/image022.gif" v:shapes="_x0000_i1035"><img src="/cache/referats/11467/image024.gif" v:shapes="_x0000_i1036"> имеет двумерноенормальное распределение, то величины Х и У будут и независимыми.

Если коэффициент корреляциинаходится в интервале <img src="/cache/referats/11467/image026.gif" v:shapes="_x0000_i1037">

Если каждая пара значенийвеличин Х и У чаще всего одновременно оказывается выше (ниже) соответствующихсредних значений, то между величинами существует прямая корреляционная связь икоэффициент корреляции находится в интервале <img src="/cache/referats/11467/image028.gif" v:shapes="_x0000_i1038">

Если же отклонение величиныХ от среднего значения одинаково часто вызывают отклонения величины У вниз отсреднего значения и при этом отклонения оказываются все время различными, томожно предполагать, что значение коэффициента корреляции стремится к нулю.

Следует отметить, чтозначение коэффициента корреляции не зависит от единиц измерения и выбора началаотсчета. Это означает, что если переменные Х и У уменьшить (увеличить) в К разлибо на одно и то же число С, то коэффициент корреляции не изменится.


Пакет анализа MicrosoftExcel

В состав Microsoft Excelвходит набор средств анализа данных (так называемый пакет анализа),предназначенный для решения сложных статистических и инженерных задач. Дляпроведения анализа данных с помощью этих инструментов следует указать входныеданные и выбрать параметры; анализ будет проведен с помощью подходящейстатистической или инженерной макрофункции, а результат будет помещен ввыходной диапазон. Другие средства позволяют представить результаты анализа вграфическом виде.

Графические изображения используются прежде всего длянаглядного представления статистических данных, благодаря им существеннооблегчается их восприятие и понимание. Существенна их роль и тогда, когда речьидет о контроле полноты и достоверности исходного статистического материала,используемого для обработки и анализа.

Статистические данные приводятся в виде длинных и сложныхстатистических таблиц (см., например, табл.1), поэтому бывает весьма труднообнаружить в них имеющиеся неточности и ошибки.

Графическое же представление статистических данныхпомогает легко и быстро выявить ничем не оправданные пики и впадины, явно несоответствующие изображаемым статистическим данным, аномалии и отклонения. Награфике, построенном по данным таблицы 1 (рис.1),  наглядно показано распределение курсабиржевых ставок в зависимости от времени совершения сделки и цены сделки врублях.

Графическое представление статистических данных являетсяне только средством иллюстрации статистических данных и контроля ихправильности и достоверности. Благодаря своим свойствам оно является важнымсредством толкования и анализа статистических данных, а в некоторых случаях — единственным и незаменимым способом их обобщения и познания. В частности, ононезаменимо при одновременном изучении нескольких взаимосвязанных экономических явлений,так как позволяет с первого взгляда установить существующие между нимисоотношения и связи, различие и подобие, а также выявить особенности ихизменений во времени.

Однако, чтобы эффективнее использовать графическиеизображения статистических данных, необходимо овладеть методикой и техникой ихпостроения. К этому следует добавить, что построенное  графическое изображение статистических данныхбиржевых ставок в наибольшей степени соответствует  характеру и содержанию изображаемых данных ипоставленной задаче их анализа.


Время

Цена сделки
в рублях

11:16:45

99,45

11:21:53

99,4

11:23:09

99,31

11:23:37

99,31

11:24:49

99

11:24:57

99

11:48:40

98,61

11:49:45

98,99

11:53:51

98,66

11:55:05

98,65

11:55:24

98,7

11:58:18

98,8

11:58:18

98,8

11:58:24

98,65

11:58:35

98,8

Таблица 1. Выборка биржевыхставок относительно времени совершения сделки и цены сделки в рублях за одиндень работы биржи


<img src="/cache/referats/11467/image030.gif" v:shapes="_x0000_i1039">

Рис.1  Распределение курса биржевых ставок взависимости от времени совершения сделки и цены сделки в рублях.


Корреляция — один из инструментов пакета анализа Microsoft Excel. Используется дляколичественной оценки взаимосвязи двух наборов данных, представленных вбезразмерном виде. Коэффициент корреляции выборки представляет собой ковариациюдвух наборов данных, деленную на произведение их стандартных отклонений.

Корреляционный анализ дает возможность установитьассоциированы ли наборы данных по величине, то есть: большие значения из одногонабора данных связаны с большими значениями другого набора (положительнаякорреляция); или, наоборот, малые значения одного набора связаны с большимизначениями другого (отрицательная корреляция); или данные двух диапазонов никакне связаны (корреляция близка к нулю).

Регрессиятакже является инструментом пакета анализа данных Microsoft Excel…Линейный регрессионный анализ заключается в подборе графика для наборанаблюдений с помощью метода наименьших квадратов. Регрессия используется дляанализа воздействия на отдельную зависимую переменную значений одной или болеенезависимых переменных. Например, на курс биржевых ставок влияют несколькофакторов, включая такие, как время совершения сделки и  ее цена. Регрессия пропорциональнораспределяет меру качества по этим двум факторам на основе данныхфункционирования курса биржевых ставок. Результаты регрессии могут бытьиспользованы для предсказания качеств новых, не совершенных еще биржевыхсделок. Например, используя результаты таблицы 1, можно с помощью регрессиипредсказать цены следующих сделок.

Наблюдение

Предсказанная цена сделки в рублях

Остатки

1

72,22015

27,22985

2

72,76796

26,63204

3

72,90313

26,40687

4

72,95293

26,35707

5

73,08099

25,91901

6

73,09522

25,90478

7

75,62617

22,98383

8

75,74178

23,24822

9

76,17932

22,48068

10

76,31094

22,33906

11

76,34473

22,35527

12

76,65421

22,14579

13

76,65421

22,14579

14

76,66488

21,98512

15

76,68444

22,11556

Табл.2.Предсказанная цена сделки в рублях


Заключение

Наиболее сложным этапом,завершающим регрессионный анализ, является интерпретация полученныхрезультатов, т.е. перевод их с языка статистики и математики на язык экономики.

Интерпретация моделейрегрессии осуществляется методами той отрасли знаний, к которой относятсяисследуемые явления. Всякая интерпретация начинается со статистической оценкиуравнения регрессии в целом и оценки значимости входящих в модель факторныхпризнаков, т.е. с изучения, как они влияют на величину результативногопризнака. Чем больше величина коэффициента регрессии, тем значительнее влияниеданного признака на моделируемую обработку биржевых ставок. Особое значение приэтом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессииговорят о характере влияния на результативный признак статистической обработкибиржевых ставок. Если факторный признак имеет плюс, то с увеличением данногофактора результативный признак возрастает; если факторный признак со знакомминус, то с его увеличением результативный признак уменьшается. Интерпретацияэтих знаков полностью определяется социально-экономическим содержаниеммоделируемого признака. Если его величина изменяется в сторону увеличения, топлюсовые знаки факторных признаков имеют положительное влияние. При изменениирезультативного признака в сторону снижения положительные значения имеютминусовые знаки факторных признаков. Если экономическая теория подсказывает,что факторный признак должен иметь положительное значение, а он со знакомминус, то необходимо проверить расчеты параметров уравнения регрессии.

Корреляционный ирегрессионный анализ позволяет определить зависимость между факторами, а так жепроследить влияние задействованных факторов. Эти показатели имеют широкоеприменение в обработке статистических данных для достижения наилучшихпоказателей биржевых ставок.

Литература

1.                В.А. Колемаев, О.В. Староверов, В.Б. Турундаевский «Теория

 вероятностей и математическая сатистика»/ М.,1991.

2.                «Теория Статистики» под редакцией Р.А. Шмойловой/ «ФиС», 1998.

3.                «Многомерный статистический анализ на ЭBM  с использованием

пакета  Microsoft Excel»/ М.,1997.

4.                А.А. Френкель, Е.В. Адамова «Корреляционно регрессионный

анализ в экономическихприложениях»/ М., 1987.

5.                И.Д.Одинцов «Теория статистики»/ М., 1998.

6.                А.Н. Кленин, К.К. Шевченко «Математическая статистика для

экономистов-статистиков»/М., 1990.

еще рефераты
Еще работы по экономико-математическому моделированию