Реферат: Регрессионный анализ

Содержание

Введение………………………………………………………………………..…2

1.Основные понятия …………………………………………………………......3

1.1.Функциональные и стохастические связи ……………………………….....8

1.2.Статистические методы моделирования связи …………………………...12

1.3.Статистическое моделирование связи методом  корреляционного и регрессионногоанализа ………………………………………………………...13

2.Проверка адекватности регрессионной модели ……………………………18

3.Практическая часть …………………………………………………………..25

3.1.Оценка значимости коэффициентов регрессии …………………………..27

3.2.Проверка адекватности модели по критерию Фишера …………………..29

3.3.Проверка адекватности модели по коэффициенту детерминации или множественнойкорреляции ……………………………………………………30

Заключение………………………………………………………………………34

Использованнаялитература ……………………………………………………35

Введение

Вэкономических исследованиях часто решают задачу выявления факторов,определяющих уровень и динамику экономического процесса. Такая задача чащевсего решается методами корреляционного, регрессионного, факторного икомпонентного анализа. Задача регрессионного анализа состоит в построении модели, позволяющейпо значениям независимых показателей получать оценки значений зависимой переменной.Регрессионный анализ является основным средством исследования зависимостей междусоциально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространеннойв статистических пакетах классической модели линейной регрессии. Специфика социологическихисследований состоит в том, что очень часто необходимо изучать и предсказывать социальныесобытия. Вторая часть данной главы будет посвящена регрессии, целью которой являетсяпостроение моделей, предсказывающих вероятности событий. Величина называется ошибкойрегрессии. Первые математические результаты, связанные с регрессионным анализом,сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами,ошибка для различных объектов считаются независимыми. Кроме того, в данной моделимы рассматриваем переменные как неслучайные значения. Такое, на практике, получается,когда идет активный эксперимент, в котором задают значения (например, назначилизарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Всемногообразие факторов, которые воздействуют на изучаемый процесс, можноразделить на две группы: главные (определяющие уровень изучаемого процесса) ивторостепенные. Последние часто имеют случайный характер, определяя специфическиеи индивидуальные особенности каждого объекта исследования. Однако при небольшой взаимосвязимежду переменными, если стандартизовать переменные и рассчитать уравнение регрессиидля стандартизованных переменных, то оценки коэффициентов регрессии позволят поих абсолютной величине судить о том, какой аргумент в большей степени влияет нафункцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты в последнемуравнении получены при одинаковых масштабах изменения всех переменных и сравнимы.В случае взаимосвязи между аргументами в правой части уравнения могут происходитьстранные вещи. Надежность и значимость коэффициента регрессии. Здесь  обозначенкоэффициент детерминации, получаемый при построении уравнения регрессии, в которомв качестве зависимой переменной взята другая переменная. Из выражения видно, чтовеличина коэффициента тем неустойчивее, чем сильнее переменная связана с остальнымипеременными. Эта статистика имеет распределение Стьюдента. В выдаче пакета печатаетсянаблюдаемая ее двусторонняя значимость — вероятность случайно при нулевом регрессионномкоэффициенте получить значение статистики, большее по абсолютной величине, чем выборочное.Значимость включения переменной в регрессию. При последовательном подборе переменныхпредусмотрена автоматизация, основанная на значимости включения и исключения переменных.

Взаимодействиеглавных и второстепенных факторов и определяет колеблемость исследуемогопроцесса. В этом взаимодействии синтезируется как необходимое, типическое,определяющее закономерность изучаемого явления, так и случайное,характеризующее отклонение от этой закономерности. Случайные отклонениянеизбежно сопутствуют любому закономерному явлению. За это иногда зависимую переменнуюназывают откликом. Теория регрессионных уравнений со случайными независимыми переменнымисложнее, но известно, что, при большом числе наблюдений, использование метода разработанногокорректно. Для получения оценок  коэффициентов  регрессии минимизируется сумма квадратовошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи.Существует ли линейная регрессионная зависимость? Для проверки одновременного отличиявсех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значенийзависимой переменной относительно среднего. Его можно разложить на две суммы следующимобразом. Статистика  в условиях гипотезы равенства нулю регрессионных коэффициентовимеет распределение Фишера и, естественно, по этой статистике проверяют, являютсяли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественнойкорреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным,полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициентадетерминации называется коэффициентом корреляции. Следует иметь в виду, что  являетсясмещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такойвывод.

Длядостоверного отображения объективно существующих в экономике процессовнеобходимо выявить существенные взаимосвязи и не только выявить, но и дать имколичественную оценку. Этот подход требует вскрытия причинных зависимостей. Подпричинной зависимостью понимается такая связь между процессами, когда изменениеодного из них является следствием изменения другого.[4]

Невсе факторы, влияющие на экономические процессы, являются случайнымивеличинами. Поэтому при анализе экономических явлений обычно рассматриваютсясвязи между случайными и неслучайными величинами. Такие связи называютсярегрессионными, а метод  математической статистики, их изучающий, называетсярегрессионным анализом. Рассмотрим, что представляет собой эта значимость. Обозначим  коэффициентдетерминации, полученный при исключении из правой части уравнения переменной. Приэтом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимостивключения переменной используется статистика, имеющая распределение Фишера при нулевомтеоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных,статистикой значимости исключения будет. Пошаговая процедура построения модели.Основным критерием отбора аргументов должно быть качественное представление о факторах,влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошореализован процесс построения регрессионной модели: на машину переложена значительнаядоля трудностей в решении этой задачи. Возможно построение последовательное построениемодели добавлением и удалением блоков переменных. Но мы рассмотрим только работус отдельными переменными. По умолчанию программа включает все заданные переменные.

1.Основные понятия.

Сцелью математического описания конкретного вида зависимостей с использованиемрегрессионного анализа  подбирают класс функций, связывающих результативныйпоказатель y и аргументы x1, x2,…, хk, отбирают наиболее информативные аргу­менты,вычисляют оценки неизвестных значений параметров уравнения связи и анализируютточность полученного уравнения.[8]

Функция f(x1, x2,…, хk ), описывающая зависимость условного среднего значениярезультативного признака у от заданных значений аргументов, называется функцией(уравнением) регрессии.

Термин «регрессия» (лат. — «regression» — отступление, возврат кчему-либо) введен английским психологом и антропологом Ф.Гальтпном и связантолько со спецификой одного из первых конкретных примеров,  в котором этопонятие было использовано.

Обрабатываястатистические данные в связи с вопросом о наследственности  роста, Ф.Гальтоннашел, что если отцы отклоняются от среднего роста всех отцов  на x дюймов, тоих сыновья отклоняются от среднего роста всех сыновей меньше, чем на x дюймов.Выявленная тенденция была названа «регрессией к среднему состоянию». Задача регрессионного анализасостоит в построении модели, позволяющей по значениям независимых показателей получатьоценки значений зависимой переменной. Регрессионный анализ является основным средствомисследования зависимостей между социально-экономическими переменными. Эту задачумы рассмотрим в рамках самой распространенной в статистических пакетах классическоймодели линейной регрессии. Специфика социологических исследований состоит в том,что очень часто необходимо изучать и предсказывать социальные события. Вторая частьданной главы будет посвящена регрессии, целью которой является построение моделей,предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первыематематические результаты, связанные с регрессионным анализом, сделаны в предположении,что регрессионная ошибка распределена нормально с параметрами, ошибка для различныхобъектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменныекак неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент,в котором задают значения (например, назначили зарплату работнику), а затем измеряют(оценили, какой стала производительность труда).

Дляточного описания уравнения регрессии необходимо знать услов­ный законраспределения результативного показателя у. В статистической практике такуюинформацию получить обычно не удается, поэтому ограничиваются поискомподходящих аппроксимаций для функции f( x1, x2,…, хk ), основанных на исходныхстатистических данных.

Врамках отдельных модельных допущений о типе распределения век­тора показателей(у, x1, x2,…, хk ) может быть получен общий вид уравнения регрессии f(x)=M(y/x)x=( x1, x2,…, хk )/>. Например, в предложении, чтоисследуемая совокупность показателей подчиняется (k + 1) — мерному нормальномузакону распределения с вектором математических ожиданий

M=/>,

гдеMx = />, my= MY

иковариационной матрицей S =  />,

гдеsyy= s2у= M (y-My)/>;

    Syx  = />;  Sxx =  />;

sij = M (xi – Mxi);(xj – Mxj); sjj = sj/>= M (xj – Mxj)/>.[12]

Изэтого следует, что уравнение регрессии (условное математическое ожидание) имеетвид:

M(y/x)= my+ />(x — Mx).

Такимобразом, если многомерная случайная величина (у, x1, x2,…, хk ) подчиняется (k+1)-мерному нормальному закону распределения, то уравнение  регрессиирезультативного показателя  у по объясняющим переменным x1, x2,…, хk  имеетлинейный по х вид. Метод включения и исключения переменных состоит в следующем. Из множествафакторов, рассматриваемых исследователем как возможные аргументы регрессионногоуравнения, отбирается один, который более всего связан корреляционной зависимостью.Далее проводится та же процедура при двух выбранных переменных, при трех и т.д.Процедура повторяется до тех пор, пока в уравнение не будут включены все аргументывыделенные исследователем, удовлетворяющие критериям значимости включения. Замечание:во избежание зацикливания процесса включения исключения значимость включения устанавливаетсяменьше значимости исключения. Переменные, порождаемые регрессионным уравнением.Сохранение переменных, порождаемых регрессией, производится подкомандой. Благодаряполученным оценкам коэффициентов уравнения регрессии могут быть оценены прогнозныезначения зависимой переменной, причем они могут быть вычислены и там, где значенияопределены, и там где они не определены.

Однаков статистической практике обычно приходится  ограничиваться поиском  подходящихаппроксимаций для неизвестной истинной функции регрессии f(x), так какисследователь не располагает точным знанием условного закона распределениявероятностей анализируемого результатирующего показателя у при заданныхэначениях аргументов х=х.

Рассмотримвзаимоотношение между истиной f(х)= M(y/x), модельной  у и оценкой у регрессии. Однакопри небольшой взаимосвязи между переменными, если стандартизовать переменные и рассчитатьуравнение регрессии для стандартизованных переменных, то оценки коэффициентов регрессиипозволят по их абсолютной величине судить о том, какой аргумент в большей степенивлияет на функцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты впоследнем уравнении получены при одинаковых масштабах изменения всех переменныхи сравнимы. В случае взаимосвязи между аргументами в правой части уравнения могутпроисходить странные вещи. Надежность и значимость коэффициента регрессии. Здесь обозначен коэффициент детерминации, получаемый при построении уравнения регрессии,в котором в качестве зависимой переменной взята другая переменная. Из выражениявидно, что величина коэффициента тем неустойчивее, чем сильнее переменная связанас остальными переменными. Эта статистика имеет распределение Стьюдента. В выдачепакета печатается наблюдаемая ее двусторонняя значимость — вероятность случайнопри нулевом регрессионном коэффициенте получить значение статистики, большее поабсолютной величине, чем выборочное. Значимость включения переменной в регрессию.При последовательном подборе переменных предусмотрена автоматизация, основаннаяна значимости включения и исключения переменных.

Пустьрезультативный показатель у связан с аргументом  х соотноше­нием::

y =  />+ e,

гдеe- случайная величина, имеющая нормальный закон распределения, при­чем М e= 0 и

De= />.

Истиннаяфункция регрессии в этом случае имеет вид:

F(x)= M(y/x) = 2x/>.

Предположим,что точный вид истинного уравнения регрессии нам не известен, но мырасполагаем  девятъю  наблюдениями над двумерной случайной величиной, связаннойсоотношением  уi = 2x/>+ ei, ипредcтавленной на рисунке:

/>        у

f(x)

  />      70

/>/>/>     60

/>      50

y

  />      40

/>/>     30

/>      20

/>/>/>/>/>/>     10

x

  />       0

                   0       2          4           6                    8         10                                                         

Взаимноерасположение истинной f(x) и теоритической у модели регрессии.

 Расположениеточек на рисунке позволяет ограничиться классом линейных зависимостей вида: у =b0+ b1x.[2]

Спомощью метода наименьших квадратов найдем оценку уравнения регрессии

 у= b0 +b1 x.

Длисравнения на рисунке приводятся графики истинной функции регрессии f{х) =2x/>, теоретическойаппроксимирующей функции рег­рессии />= b0 + b1x.  К последней сходится по вероятности оценка уравнения регрессии /> принеограниченном увеличении объема выборки (n />).

Посколькумы ошиблись в выборе класса функции регрессии, что, к сожалению, достаточночасто встречается в практике статистических исследований, то нашистатистические выводы и оценки не будут обла­дать свойством состоятельности,т.е., как бы

мыне увеличивали объем наблюдений, наша выборочная оценка />не будет сходиться кистинной функции регрессии f(х). Задача регрессионного анализа состоит в построениимодели, позволяющей по значениям независимых показателей получать оценки значенийзависимой переменной. Регрессионный анализ является основным средством исследованиязависимостей между социально-экономическими переменными. Эту задачу мы рассмотримв рамках самой распространенной в статистических пакетах классической модели линейнойрегрессии. Специфика социологических исследований состоит в том, что очень частонеобходимо изучать и предсказывать социальные события. Вторая часть данной главыбудет посвящена регрессии, целью которой является построение моделей, предсказывающихвероятности событий. Величина называется ошибкой регрессии. Первые математическиерезультаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионнаяошибка распределена нормально с параметрами, ошибка для различных объектов считаютсянезависимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайныезначения. Такое, на практике, получается, когда идет активный эксперимент, в которомзадают значения (например, назначили зарплату работнику), а затем измеряют (оценили,какой стала производительность труда).

Еслибы мы правильно выбрали класс функций регрессии, то неточность в описании f(x)с помощью /> объясняласьбы только ограниченностью выборки и, следовательно, она могла бы быть сделанасколько угодно малой при n />.

Сцелью наилучшего восстановления по исходным статистическим данным условногозначения результатирующего показателя у(х) и неизвестной функции регрессии f(x)= M(y/x) наиболее часто используют следующие критерии адекватности (функциипотерь).[7]

1.Метод наименьших квадратов, согласно которому минимизируется квадрат отклонениянаблюдаемых значений результативного показателя yi(i=1,2,…,n) от модельныхзначений />i= f(xi, b),где b= (b0,b1,…,bk)/> — коэффициентыуравнения регрессии, xi – значение вектора аргументов в i-м наблюдении:

/>.

Решаетсязадача отыскания оценки /> вектора b.Получаемая регрессия называется среднеквадратической. За это иногда зависимую переменнуюназывают откликом. Теория регрессионных уравнений со случайными независимыми переменнымисложнее, но известно, что, при большом числе наблюдений, использование метода разработанногокорректно. Для получения оценок  коэффициентов  регрессии минимизируется сумма квадратовошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи.Существует ли линейная регрессионная зависимость? Для проверки одновременного отличиявсех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значенийзависимой переменной относительно среднего. Его можно разложить на две суммы следующимобразом. Статистика  в условиях гипотезы равенства нулю регрессионных коэффициентовимеет распределение Фишера и, естественно, по этой статистике проверяют, являютсяли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественнойкорреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным,полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициентадетерминации называется коэффициентом корреляции. Следует иметь в виду, что  являетсясмещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такойвывод.

2.Метод наименьших модулей, согласно которому минимизируется сумма абсолютныхотклонений наблюдаемых значений результативного показателя от модульныхзначений /> =f(xi, b),т.е.

/>.

Получаемаярегрессия называется среднеабсолютной (медианой).

3.Метод минимакса сводится к минимизации максимума модуля отклонения наблюдаемогозначения результативного показателя yi от модельного значения f(xi, b),т.е.

/>.

Получаемаяпри этом регрессия называется минимаксной. Рассмотрим, что представляет собой эта значимость.Обозначим  коэффициент детерминации, полученный при исключении из правой части уравненияпеременной. При этом мы получим уменьшение объясненной дисперсии, на величину. Дляоценки значимости включения переменной используется статистика, имеющая распределениеФишера при нулевом теоретическом приросте. Вообще, если из уравнения регрессии исключаютсяпеременных, статистикой значимости исключения будет. Пошаговая процедура построениямодели. Основным критерием отбора аргументов должно быть качественное представлениео факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать.Очень хорошо реализован процесс построения регрессионной модели: на машину переложеназначительная доля трудностей в решении этой задачи. Возможно построение последовательноепостроение модели добавлением и удалением блоков переменных. Но мы рассмотрим толькоработу с отдельными переменными. По умолчанию программа включает все заданные переменные.

Впрактических положениях часто встречаются задачи, в которых изучается случайнаявеличина у, зависящая от некоторого множества переменных x1, x2,…, хk  инеизвестных параметров bj(j=0,1,2,…,k). Будем рассматривать (у,x1, x2,…, хk ) как

(k+1) – мерную генеральную совокупность, из которой взята случайная выборкаобъемов n, где (уi,xi1,xi2,…,xik) результат i-го наблюдения i=1,2,…,n.Требуется по результатам наблюдений оценить неизвестные параметры bj(j=0,1,2,…,k).[4]

1.1.Функциональные и стохастические связи.

Междуразличными явлениями и их признаками необходимо прежде всего выделить 2 типасвязей: функциональную (жестко детерминированную) и статистическую(стохастически детерминированную).

Всоответствии с жестко детерминистическим представлением о функционированииэкономических систем необходимость и закономерность однозначно проявляются вкаждом отдельном явлении, то есть любое действие вызывает строго определенныйрезультат; случайными (непредвиденными заранее) воздействиями при этомпренебрегают. Поэтому при заданных начальных условиях состояние такой системы можетбыть определено с вероятностью, равной 1. Разновидностью такой закономерностиявляется функциональная связь. Задача регрессионного анализа состоит в построении модели, позволяющейпо значениям независимых показателей получать оценки значений зависимой переменной.Регрессионный анализ является основным средством исследования зависимостей междусоциально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространеннойв статистических пакетах классической модели линейной регрессии. Специфика социологическихисследований состоит в том, что очень часто необходимо изучать и предсказывать социальныесобытия. Вторая часть данной главы будет посвящена регрессии, целью которой являетсяпостроение моделей, предсказывающих вероятности событий. Величина называется ошибкойрегрессии. Первые математические результаты, связанные с регрессионным анализом,сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами,ошибка для различных объектов считаются независимыми. Кроме того, в данной моделимы рассматриваем переменные как неслучайные значения. Такое, на практике, получается,когда идет активный эксперимент, в котором задают значения (например, назначилизарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Связьпризнака у с признаком х называется функциональной, если каждому возможномузначению независимого признака х соответствует 1 или несколько строго определенныхзначений зависимого признака у. Определение функциональной связи может бытьлегко обобщено для случая многих признаков  х1, х2 …хn. Метод включения и исключенияпеременных состоит в следующем. Из множества факторов, рассматриваемых исследователемкак возможные аргументы регрессионного уравнения, отбирается один, который болеевсего связан корреляционной зависимостью. Далее проводится та же процедура при двухвыбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнениене будут включены все аргументы, выделенные исследователем, удовлетворяющие критериямзначимости включения. Замечание: во избежание зацикливания процесса включения исключениязначимость включения устанавливается меньше значимости исключения. Переменные, порождаемыерегрессионным уравнением. Сохранение переменных, порождаемых регрессией, производитсяподкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могутбыть оценены прогнозные значения зависимой переменной, причем они могут быть вычисленыи там, где значения определены, и там где они не определены.

Характернойособенностью функциональных связей является то, что в каждом отдельном случаеизвестен полный перечень факторов, определяющих значение зависимого(результативного) признака, а также точный механизм их влияния, выраженныйопределенным уравнением.

Функциональнуюсвязь можно представить уравнением:

yi=Ä(xi),

гдеyi  — результативный признак ( i = 1, …, n);

    f(xi) — известная функция связи результативного и факторного признаков;

      xi   — факторный признак.[11]

Вреальной общественной жизни ввиду неполноты информации жестко детерминированнойсистемы, может возникнуть неопределенность, из-за которой эта система по своейприроде должна рассматриваться как вероятностная, при этом связь междупризнаками становится стахостической.

Стахостическаясвязь – это связь между величинами, при которой одна из них, случайная величинау, реагирует на изменение другой величины х или других величин х1, х2 …хn(случайных или неслучайных) изменением закона распределения. Этообуславливается тем, что зависимая переменная (результативный признак), кромерассматриваемых независимых, подвержена влиянию ряда неучтенных илинеконтролируемых (случайных) факторов, а также некоторых неизбежных ошибокизмерения переменных. Поскольку значения зависимой переменной подверженыслучайному разбросу, они не могут быть предсказаны с достаточной точностью, атолько указаны с определенной вероятностью.

Характернойособенностью стахостических связей является то, что они проявляются во всейсовокупности, а не в каждой ее единице. Причём неизвестен ни полный переченьфакторов, определяющих значение результативного признака, ни точный механизм ихфункционирования и взаимодействия с результативным признаком. Всегда имеетместо влияние случайного. Появляющиеся различные значения зависимой переменной– реализация случайной величины. Однако при небольшой взаимосвязи между переменными,если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованныхпеременных, то оценки коэффициентов регрессии позволят по их абсолютной величинесудить о том, какой аргумент в большей степени влияет на функцию. Стандартизацияпеременных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковыхмасштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументамив правой части уравнения могут происходить странные вещи. Надежность и значимостькоэффициента регрессии. Здесь  обозначен коэффициент детерминации, получаемый припостроении уравнения регрессии, в котором в качестве зависимой переменной взятадругая переменная. Из выражения видно, что величина коэффициента тем неустойчивее,чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределениеСтьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость — вероятностьслучайно при нулевом регрессионном коэффициенте получить значение статистики, большеепо абсолютной величине, чем выборочное. Значимость включения переменной в регрессию.При последовательном подборе переменных предусмотрена автоматизация, основаннаяна значимости включения и исключения переменных.

Модельстохастической связи может быть представлена в общем виде уравнением:

ŷi= Ä(xi)+ ei,

гдеŷi  — расчётное значение результативного признака;

    f(xi) — часть результативного признака, сформировавшаяся под воздействиемучтенных известных факторных признаков(одного или множества), находящихся встахостической связи с признаком;

     ei- часть результативного признака, возникшая в следствие действиянеконтролируемых или неучтенных факторов, а также измерения признаков,неизбежно сопровождающегося некоторыми случайными ошибками. За это иногда зависимую переменнуюназывают откликом. Теория регрессионных уравнений со случайными независимыми переменнымисложнее, но известно, что, при большом числе наблюдений, использование метода разработанногокорректно. Для получения оценок  коэффициентов  регрессии минимизируется сумма квадратовошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи.Существует ли линейная регрессионная зависимость? Для проверки одновременного отличиявсех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значенийзависимой переменной относительно среднего. Его можно разложить на две суммы следующимобразом. Статистика  в условиях гипотезы равенства нулю регрессионных коэффициентовимеет распределение Фишера и, естественно, по этой статистике проверяют, являютсяли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественнойкорреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным,полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициентадетерминации называется коэффициентом корреляции. Следует иметь в виду, что  являетсясмещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такойвывод.

Проявлениестохастических связей подвержено действию закона больших чисел: лишь вдостаточно большом числе единиц индивидуальные особенности сгладятся,случайности взаимопогасятся, и зависимость, если она имеет существенную силу,проявится достаточно отчётливо. [6]

Корреляционнаясвязь существует там, где взаимосвязанные явления характеризуются толькослучайными величинами. При такой связи среднее значение (математическоеожидание) случайной величины результативного признака у закономерно изменяетсяв зависимости от изменения другой величины х или других случайных величин х1, х2…хn. Корреляционная связь проявляется не в каждом отдельном случае, а во всейсовокупности в целом. Только при достаточно большом количестве случаев каждомузначению случайного признака х будет соответствовать распределение среднихзначений случайного признака у. Наличие корреляционных связей присуще многимобщественным явлениям. Задача регрессионного анализа состоит в построении модели, позволяющейпо значениям независимых показателей получать оценки значений зависимой переменной.Регрессионный анализ является основным средством исследования зависимостей междусоциально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространеннойв статистических пакетах классической модели линейной регрессии. Специфика социологическихисследований состоит в том, что очень часто необходимо изучать и предсказывать социальныесобытия. Вторая часть данной главы будет посвящена регрессии, целью которой являетсяпостроение моделей, предсказывающих вероятности событий. Величина называется ошибкойрегрессии. Первые математические результаты, связанные с регрессионным анализом,сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами,ошибка для различных объектов считаются независимыми. Кроме того, в данной моделимы рассматриваем переменные как неслучайные значения. Такое, на практике, получается,когда идет активный эксперимент, в котором задают значения (например, назначилизарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Корреляционнаясвязь – понятие более узкое, чем стохастическая связь. Последняя можетотражаться не только в изменении средней величины, но и в вариации одногопризнака в зависимости от другого, то есть любой другой характеристикивариации. Таким образом, корреляционная связь является частным случаемстохастической связи.

Прямыеи обратные связи. В зависимости от направления действия, функциональные истахостические связи могут быть прямые и обратные. При прямой связи направлениеизменения результативного признака совпадает с направлением измененияпризнака-фактора, то есть с увеличением факторного признака увеличивается ирезультативный, и, наоборот, с уменьшением факторного признака уменьшается ирезультативный признак. В противном случае между рассматриваемыми величинамисуществуют обратные связи. Например, чем выше квалификация рабочего (разряд),тем выше уровень производительности труда – прямая связь. А чем вышепроизводительность труда, тем ниже себестоимость единицы продукции – обратнаясвязь. Рассмотрим,что представляет собой эта значимость. Обозначим  коэффициент детерминации, полученныйпри исключении из правой части уравнения переменной. При этом мы получим уменьшениеобъясненной дисперсии, на величину. Для оценки значимости включения переменной используетсястатистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще,если из уравнения регрессии исключаются переменных, статистикой значимости исключениябудет. Пошаговая процедура построения модели. Основным критерием отбора аргументовдолжно быть качественное представление о факторах, влияющих на зависимую переменную,которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионноймодели: на машину переложена значительная доля трудностей в решении этой задачи.Возможно построение последовательное построение модели добавлением и удалением блоковпеременных. Но мы рассмотрим только работу с отдельными переменными. По умолчаниюпрограмма включает все заданные переменные.

Прямолинейныеи криволинейные связи. По аналитическому выражению (форме) связи могут бытьпрямолинейными и криволинейными. При прямолинейной связи с возрастаниемзначения факторного признака происходит непрерывное возрастание (или убывание)значений результативного признака. Математически такая связь представляетсяуравнением прямой, а графически – прямой линией. Отсюда ее более короткоеназвание – линейная связь. При криволинейных связях с возрастанием значенияфакторного признака возрастание (или убывание) результативного признакапроисходит неравномерно, или же направление его изменения меняется на обратное.Геометрически такие связи представляются кривыми линиями (гиперболой, параболойи т.д.).

Однофакторныеи многофакторные связи. По количеству факторов, действующих на результативныйпризнак, связи различаются: однофакторные (один фактор) и многофакторные (два иболее факторов). Однофакторные (простые) связи обычно называются парными (т.к.рассматривается пара признаков). Например, корреляционная связь между прибыльюи производительностью труда. В случае многофакторной (множественной) связиимеют в виду, что все факторы действуют комплексно, то есть одновременно и вовзаимосвязи. Например, корреляционная связь между производительностью труда иуровнем организации труда, автоматизации производства, квалификации рабочих,  производственнымстажем, простоями и другими факторными признаками. С помощью множественнойкорреляции можно охватить весь комплекс факторных признаков и объективноотразить существующие множественные связи. Метод включения и исключения переменных состоит вследующем. Из множества факторов, рассматриваемых исследователем как возможные аргументырегрессионного уравнения, отбирается один, который более всего связан корреляционнойзависимостью. Далее проводится та же процедура при двух выбранных переменных, притрех и т.д. Процедура повторяется до тех пор, пока в уравнение не будут включенывсе аргументы, выделенные исследователем, удовлетворяющие критериям значимости включения.Замечание: во избежание зацикливания процесса включения исключения значимость включенияустанавливается меньше значимости исключения. Переменные, порождаемые регрессионнымуравнением. Сохранение переменных, порождаемых регрессией, производится подкомандой.Благодаря полученным оценкам коэффициентов уравнения регрессии могут быть оцененыпрогнозные значения зависимой переменной, причем они могут быть вычислены и там,где значения определены, и там где они не определены.

1.2.Статистические методы моделирования связи.

Дляисследования стохастических связей широко используется метод сопоставления двухпараллельных рядов, метод аналитических группировок, корреляционный анализ,регрессионный анализ и некоторые непараметрические методы.[1]

Методсопоставления двух параллельных рядов  является одним из простейших методов.Для этого факторы, характеризующие результативный признак располагают ввозрастающем или убывающем порядке (в зависимости от эволюции процесса и целиисследования), а затем прослеживают изменение величины результативногопризнака. Сопоставление и анализ расположенных таким образом рядов значенийизучаемых величин позволяют установить наличие связи и ее направление.Зависимость между факторами и показателями может прослеживаться во времени(параллельные динамические ряды). Однако при небольшой взаимосвязи между переменными,если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованныхпеременных, то оценки коэффициентов регрессии позволят по их абсолютной величинесудить о том, какой аргумент в большей степени влияет на функцию. Стандартизацияпеременных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковыхмасштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументамив правой части уравнения могут происходить странные вещи. Надежность и значимостькоэффициента регрессии. Здесь  обозначен коэффициент детерминации, получаемый припостроении уравнения регрессии, в котором в качестве зависимой переменной взятадругая переменная. Из выражения видно, что величина коэффициента тем неустойчивее,чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределениеСтьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость — вероятностьслучайно при нулевом регрессионном коэффициенте получить значение статистики, большеепо абсолютной величине, чем выборочное. Значимость включения переменной в регрессию.При последовательном подборе переменных предусмотрена автоматизация, основаннаяна значимости включения и исключения переменных.

Методаналитических группировок  тоже относится к простейшим методам. Чтобы выявитьзависимость с помощью этого метода, нужно произвести группировку единицсовокупности по факторному признаку и для каждой группы вычислить среднее илиотносительное значение результативного признака. Сопоставляя затем изменениярезультативного признака по мере изменения факторного можно выявитьнаправление, характер и тесноту связи между ними. Задача регрессионного анализасостоит в построении модели, позволяющей по значениям независимых показателей получатьоценки значений зависимой переменной. Регрессионный анализ является основным средствомисследования зависимостей между социально-экономическими переменными. Эту задачумы рассмотрим в рамках самой распространенной в статистических пакетах классическоймодели линейной регрессии. Специфика социологических исследований состоит в том,что очень часто необходимо изучать и предсказывать социальные события. Вторая частьданной главы будет посвящена регрессии, целью которой является построение моделей,предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первыематематические результаты, связанные с регрессионным анализом, сделаны в предположении,что регрессионная ошибка распределена нормально с параметрами, ошибка для различныхобъектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменныекак неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент,в котором задают значения (например, назначили зарплату работнику), а затем измеряют(оценили, какой стала производительность труда).

Вобщем виде задача статистики в области изучения взаимосвязей состоит не тольков количественной оценке их наличия, направления и силы связи, но и вопределении формы (аналитического выражения) влияния факторных признаков нарезультативный. За это иногда зависимую переменную называют откликом. Теория регрессионныхуравнений со случайными независимыми переменными сложнее, но известно, что, прибольшом числе наблюдений, использование метода разработанного корректно. Для полученияоценок  коэффициентов  регрессии минимизируется сумма квадратов ошибок регрессии.В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейнаярегрессионная зависимость? Для проверки одновременного отличия всех коэффициентоврегрессии от нуля проведем анализ квадратичного разброса значений зависимой переменнойотносительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределениеФишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременнонулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качестварегрессии, оцененной по различным зависимым переменным, полезно исследовать долиобъясненной и необъясненной дисперсии. Корень из коэффициента детерминации называетсякоэффициентом корреляции. Следует иметь в виду, что  является смещенной оценкой.Абсолютные значения коэффициентов не позволяют сделать такой вывод.

1.3.Статистическое моделирование связи методом  корреляционного и регрессионногоанализа.

Задачикорреляционного анализа сводятся к измерению тесноты известной связи междуварьирующими признаками, определению неизвестных причинных связей (причинныйхарактер которых должен быть выяснен с помощью теоретического анализа) и оценкифакторов, оказывающих наибольшее влияние на результативный признак. [4]

Задачамирегрессионного анализа являются выбор типа модели (формы связи), установлениестепени влияния независимых переменных на зависимую и определение расчётныхзначений зависимой переменной (функции регрессии). Задача регрессионного анализасостоит в построении модели, позволяющей по значениям независимых показателей получатьоценки значений зависимой переменной. Регрессионный анализ является основным средствомисследования зависимостей между социально-экономическими переменными. Эту задачумы рассмотрим в рамках самой распространенной в статистических пакетах классическоймодели линейной регрессии. Специфика социологических исследований состоит в том,что очень часто необходимо изучать и предсказывать социальные события. Вторая частьданной главы будет посвящена регрессии, целью которой является построение моделей,предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первыематематические результаты, связанные с регрессионным анализом, сделаны в предположении,что регрессионная ошибка распределена нормально с параметрами, ошибка для различныхобъектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменныекак неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент,в котором задают значения (например, назначили зарплату работнику), а затем измеряют(оценили, какой стала производительность труда).

Решениевсех названных задач приводит к необходимости комплексного использования этихметодов. Рассмотрим,что представляет собой эта значимость. Обозначим  коэффициент детерминации, полученныйпри исключении из правой части уравнения переменной. При этом мы получим уменьшениеобъясненной дисперсии, на величину. Для оценки значимости включения переменной используетсястатистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще,если из уравнения регрессии исключаются переменных, статистикой значимости исключениябудет. Пошаговая процедура построения модели. Основным критерием отбора аргументовдолжно быть качественное представление о факторах, влияющих на зависимую переменную,которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионноймодели: на машину переложена значительная доля трудностей в решении этой задачи.Возможно построение последовательное построение модели добавлением и удалением блоковпеременных. Но мы рассмотрим только работу с отдельными переменными. По умолчаниюпрограмма включает все заданные переменные.

Корреляционныйи регрессионный анализ. Исследование связей в условиях массового наблюдения идействия случайных факторов осуществляется, как правило, с помощьюэкономико-статистических моделей. В широком смысле модель – это аналог,условный образ (изображение, описание, схема, чертёж и т.п.) какого-либообъекта, процесса или события, приближенно воссоздающий «оригинал». Модельпредставляет собой логическое или математическое описание компонентов ифункций, отображающих существенные свойства моделируемого объекта или процесса,даёт возможность установить основные закономерности изменения оригинала. Вмодели оперируют показателями, исчисленными для качественно однородных массовыхявлений (совокупностей). Выражение и модели в виде функциональных уравненийиспользуют для расчёта средних значений моделируемого показателя по набору заданныхвеличин и для выявления степени влияния на него отдельных факторов. Метод включения и исключенияпеременных состоит в следующем. Из множества факторов, рассматриваемых исследователемкак возможные аргументы регрессионного уравнения, отбирается один, который болеевсего связан корреляционной зависимостью. Далее проводится та же процедура при двухвыбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнениене будут включены все аргументы, выделенные исследователем, удовлетворяющие критериямзначимости включения. Замечание: во избежание зацикливания процесса включения исключениязначимость включения устанавливается меньше значимости исключения. Переменные, порождаемыерегрессионным уравнением. Сохранение переменных, порождаемых регрессией, производитсяподкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могутбыть оценены прогнозные значения зависимой переменной, причем они могут быть вычисленыи там, где значения определены, и там где они не определены.

Поколичеству включаемых факторов модели могут быть однофакторными имногофакторными (два и более факторов).

Взависимости от познавательной цели статистические модели подразделяются наструктурные, динамические и модели связи.

Двухмернаялинейная модель корреляционного и регрессионного анализа (однофакторныйлинейный корреляционный и регрессионный анализ). Наиболее разработанной втеории статистики является методология так называемой парной корреляции,рассматривающая влияние вариации факторного анализа х на результативный признаку и представляющая собой однофакторный корреляционный и регрессионный анализ.Овладение теорией и практикой построения и анализа двухмерной моделикорреляционного и регрессионного анализа представляет собой исходную основу дляизучения многофакторных стохастических связей. Однако при небольшой взаимосвязи между переменными,если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованныхпеременных, то оценки коэффициентов регрессии позволят по их абсолютной величинесудить о том, какой аргумент в большей степени влияет на функцию. Стандартизацияпеременных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковыхмасштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументамив правой части уравнения могут происходить странные вещи. Надежность и значимостькоэффициента регрессии. Здесь  обозначен коэффициент детерминации, получаемый припостроении уравнения регрессии, в котором в качестве зависимой переменной взятадругая переменная. Из выражения видно, что величина коэффициента тем неустойчивее,чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределениеСтьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость — вероятностьслучайно при нулевом регрессионном коэффициенте получить значение статистики, большеепо абсолютной величине, чем выборочное. Значимость включения переменной в регрессию.При последовательном подборе переменных предусмотрена автоматизация, основаннаяна значимости включения и исключения переменных.

Важнейшимэтапом построения регрессионной модели (уравнения регрессии) являетсяустановление в анализе исходной информации математической функции. Сложностьзаключается в том, что из множества функций необходимо найти такую, котораялучше других выражает реально существующие связи между анализируемыми признаками.Выбор типов функции может опираться на теоретические знания об изучаемомявлении, опят предыдущих аналогичных исследований, или осуществлятьсяэмпирически – перебором и оценкой функций разных типов и т.п. [10]

Приизучении связи экономических показателей производства (деятельности) используютразличного вида уравнения прямолинейной и криволинейной связи. Внимание клинейным связям объясняется ограниченной вариацией переменных и тем, что вбольшинстве случаев нелинейные формы связи для выполнения расчётов преобразуют(путём логарифмирования или замены переменных) в линейную форму. Уравнениеоднофакторной (парной) линейной корреляционной связи имеет вид:

ŷ= a0 + a1x ,

гдеŷ — теоретические значения результативного признака, полученные поуравнению регрессии;

    a0, a1 -  коэффициенты (параметры) уравнения регрессии. Задача регрессионного анализасостоит в построении модели, позволяющей по значениям независимых показателей получатьоценки значений зависимой переменной. Регрессионный анализ является основным средствомисследования зависимостей между социально-экономическими переменными. Эту задачумы рассмотрим в рамках самой распространенной в статистических пакетах классическоймодели линейной регрессии. Специфика социологических исследований состоит в том,что очень часто необходимо изучать и предсказывать социальные события. Вторая частьданной главы будет посвящена регрессии, целью которой является построение моделей,предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первыематематические результаты, связанные с регрессионным анализом, сделаны в предположении,что регрессионная ошибка распределена нормально с параметрами, ошибка для различныхобъектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменныекак неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент,в котором задают значения (например, назначили зарплату работнику), а затем измеряют(оценили, какой стала производительность труда).

Посколькуa0 является средним значением у в точке х=0, экономическая интерпретация частозатруднена или вообще невозможна. За это иногда зависимую переменную называют откликом.Теория регрессионных уравнений со случайными независимыми переменными сложнее, ноизвестно, что, при большом числе наблюдений, использование метода разработанногокорректно. Для получения оценок  коэффициентов  регрессии минимизируется сумма квадратовошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи.Существует ли линейная регрессионная зависимость? Для проверки одновременного отличиявсех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значенийзависимой переменной относительно среднего. Его можно разложить на две суммы следующимобразом. Статистика  в условиях гипотезы равенства нулю регрессионных коэффициентовимеет распределение Фишера и, естественно, по этой статистике проверяют, являютсяли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественнойкорреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным,полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициентадетерминации называется коэффициентом корреляции. Следует иметь в виду, что  являетсясмещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такойвывод.

Коэффициентпарной линейной регрессии a1  имеет смысл показателя силы связи между вариациейфакторного признака х и вариацией результативного признака у. Вышеприведенноеуравнение показывает среднее значение изменения результативного признака у приизменении факторного признака х на одну единицу его измерения, то есть вариациюу, приходящуюся на единицу вариации х. Знак a1 указывает направление этогоизменения.

Параметрыуравнения a0, a1 находят методом наименьших квадратов (метод решения системуравнений, при котором в качестве решения принимается точка минимума суммыквадратов отклонений), то есть в основу этого метода положено требованиеминимальности сумм квадратов отклонений эмпирических данных yi от выравненных ŷ:

S(yi– ŷ)2 = S(yi – a0 – a1xi)2 ®min [9]

Длянахождения минимума данной функции приравняем к нулю ее частные производные иполучим систему двух линейных уравнений, которая называется системой нормальныхуравнений:

/>

   .

/> <td/> />
Решимэту систему в общем виде:

/>

/> /> /> /> /> /> /> /> <td/> /> <td/> /> /> />
Параметрыуравнения парной линейной регрессии иногда удобно исчислять по следующимформулам, дающим тот же результат:/> <td/> />
Определивзначения a0, a1  и подставив их в уравнение связи   ŷ = a0 + a1x,находим значения ŷ, зависящие только от заданного значения х.

Рассмотримпостроение однофакторного уравнения регрессии зависимости работающих активов уот капитала х (см. таблица 1). Рассмотрим, что представляет собой эта значимость. Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменной.При этом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимостивключения переменной используется статистика, имеющая распределение Фишера при нулевомтеоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных,статистикой значимости исключения будет. Пошаговая процедура построения модели.Основным критерием отбора аргументов должно быть качественное представление о факторах,влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошореализован процесс построения регрессионной модели: на машину переложена значительнаядоля трудностей в решении этой задачи. Возможно построение последовательное построениемодели добавлением и удалением блоков переменных. Но мы рассмотрим только работус отдельными переменными. По умолчанию программа включает все заданные переменные.

Здесьпредставлены показатели 32 банков: размер капитала и работающих активов. Передомной стоит задача определить, есть ли зависимость между этими двумя признакамии, если она существует, определить форму этой зависимости, то есть уравнениерегрессии.

Зафакторный признак я взяла размер капитала банка, а за результативный признак –работающие активы. [11]

Сопоставлениеданных параллельных рядов признаков х и у показывает, что с убыванием признаках (капитал), в большинстве случаев убывает и признак у (работающие активы). Задача регрессионного анализасостоит в построении модели, позволяющей по значениям независимых показателей получатьоценки значений зависимой переменной. Регрессионный анализ является основным средствомисследования зависимостей между социально-экономическими переменными. Эту задачумы рассмотрим в рамках самой распространенной в статистических пакетах классическоймодели линейной регрессии. Специфика социологических исследований состоит в том,что очень часто необходимо изучать и предсказывать социальные события. Вторая частьданной главы будет посвящена регрессии, целью которой является построение моделей,предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первыематематические результаты, связанные с регрессионным анализом, сделаны в предположении,что регрессионная ошибка распределена нормально с параметрами, ошибка для различныхобъектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменныекак неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент,в котором задают значения (например, назначили зарплату работнику), а затем измеряют(оценили, какой стала производительность труда).

Следовательно,можно предположить, что между х и у существует прямая зависимость, пустьнеполная, но выраженная достаточно ясно.

Дляуточнения формы связи между рассматриваемыми признаками я использовалаграфический метод. Я нанес на график точки, соответствующие значениям х и у, иполучила корреляционное поле (см. график 1). Метод включения и исключения переменных состоитв следующем. Из множества факторов, рассматриваемых исследователем как возможныеаргументы регрессионного уравнения, отбирается один, который более всего связанкорреляционной зависимостью. Далее проводится та же процедура при двух выбранныхпеременных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнение небудут включены все аргументы, выделенные исследователем, удовлетворяющие критериямзначимости включения. Замечание: во избежание зацикливания процесса включения исключениязначимость включения устанавливается меньше значимости исключения. Переменные, порождаемыерегрессионным уравнением. Сохранение переменных, порождаемых регрессией, производитсяподкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могутбыть оценены прогнозные значения зависимой переменной, причем они могут быть вычисленыи там, где значения определены, и там где они не определены.

Анализируяполе корреляции, можно предположить, что возрастание признака у идетпропорционально признаку х. В основе этой зависимости лежит прямолинейнаясвязь, которая может быть выражена простым линейным уравнением регрессии:

 

ŷ= a0 + a1x,

гдеŷ — теоретические расчётные значения результативного признака (работающиеактивы), полученные по уравнению регрессии;

    a0, a1 -  коэффициенты (параметры) уравнения регрессии;

    х – капитал исследуемых банков.

Пользуясьвышеуказанными формулами для вычисления параметров линейного уравнениярегрессии и расчётными значениями из таблицы 1, получаем:

/>

Следовательно,регрессионная модель зависимости работающих активов от капитала банков можетбыть записана в виде конкретного простого уравнения регрессии:

/>.[4]

Этоуравнение характеризует зависимость работающих активов от капитала банка.Расчётные значения ŷ, найденные по этому уравнению, приведены в таблице1. Правильность расчёта параметров уравнения регрессии может быть проверенасравниванием сумм ∑у = ∑ŷ. В моем случае эти суммы равны. Однако при небольшой взаимосвязимежду переменными, если стандартизовать переменные и рассчитать уравнение регрессиидля стандартизованных переменных, то оценки коэффициентов регрессии позволят поих абсолютной величине судить о том, какой аргумент в большей степени влияет нафункцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты в последнемуравнении получены при одинаковых масштабах изменения всех переменных и сравнимы.В случае взаимосвязи между аргументами в правой части уравнения могут происходитьстранные вещи. Надежность и значимость коэффициента регрессии. Здесь  обозначенкоэффициент детерминации, получаемый при построении уравнения регрессии, в которомв качестве зависимой переменной взята другая переменная. Из выражения видно, чтовеличина коэффициента тем неустойчивее, чем сильнее переменная связана с остальнымипеременными. Эта статистика имеет распределение Стьюдента. В выдаче пакета печатаетсянаблюдаемая ее двусторонняя значимость — вероятность случайно при нулевом регрессионномкоэффициенте получить значение статистики, большее по абсолютной величине, чем выборочное.Значимость включения переменной в регрессию. При последовательном подборе переменныхпредусмотрена автоматизация, основанная на значимости включения и исключения переменных.

Нодля того, чтобы применить мою формулу, надо рассчитать, насколько онаприближенна к реальности, то есть проверить ее адекватность.

2.Проверка адекватности регрессионной модели.

Дляпрактического использования моделей регрессии большое значение имеет ихадекватность, т.е. соответствие фактическим статистическим данным.

Корреляционныйи регрессионный анализ обычно (особенно в условиях так называемого малого исреднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтомупоказатели регрессии и корреляции – параметры уравнения регрессии, коэффициентыкорреляции и детерминации могут быть искажены действием случайных факторов.Чтобы проверить, насколько эти показатели характерны для всей генеральнойсовокупности, не являются ли они результатом стечения случайных обстоятельств,необходимо проверить адекватность построенных статистических моделей.

Причисленности объектов анализа до 30 единиц возникает необходимость проверкизначимости (существенности) каждого коэффициента регрессии. При этом выясняютнасколько вычисленные параметры характерны для отображения комплекса условий:не являются ли полученные значения параметров результатами действия случайныхпричин. Задачарегрессионного анализа состоит в построении модели, позволяющей по значениям независимыхпоказателей получать оценки значений зависимой переменной. Регрессионный анализявляется основным средством исследования зависимостей между социально-экономическимипеременными. Эту задачу мы рассмотрим в рамках самой распространенной в статистическихпакетах классической модели линейной регрессии. Специфика социологических исследованийсостоит в том, что очень часто необходимо изучать и предсказывать социальные события.Вторая часть данной главы будет посвящена регрессии, целью которой является построениемоделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии.Первые математические результаты, связанные с регрессионным анализом, сделаны впредположении, что регрессионная ошибка распределена нормально с параметрами, ошибкадля различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваемпеременные как неслучайные значения. Такое, на практике, получается, когда идетактивный эксперимент, в котором задают значения (например, назначили зарплату работнику),а затем измеряют (оценили, какой стала производительность труда).

/> <td/> />
Значимостькоэффициентов простой линейной регрессии (применительно к совокупностям, укоторых n<30) осуществляют с помощью t-критерия Стьюдента. При этомвычисляют расчетные (фактические) значения t-критерия/> <td/> />
дляпараметра a0:/> <td/> />
 дляпараметра a1 :          

  где n — объём выборки;

— среднее квадратическое отклонение результативного признака от выравненныхзначений ŷ;

/>    или    />

— среднее квадратическое отклонение факторного признака x от общей средней />. [8]

Вычисленныепо вышеприведенным формулам значения сравнивают с критическими t, которыеопределяют по таблице Стьюдента с учетом принятого уровня значимости  α  ичислом степеней свободы вариации />. В социально-экономическихисследованиях уровень значимости α обычно принимают равным 0,05. Параметрпризнаётся значимым (существенным) при условии, если tрасч> tтабл. В такомслучае практически невероятно, что найденные значения параметров обусловленытолько случайными совпадениями. За это иногда зависимую переменную называют откликом. Теория регрессионныхуравнений со случайными независимыми переменными сложнее, но известно, что, прибольшом числе наблюдений, использование метода разработанного корректно. Для полученияоценок  коэффициентов  регрессии минимизируется сумма квадратов ошибок регрессии.В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейнаярегрессионная зависимость? Для проверки одновременного отличия всех коэффициентоврегрессии от нуля проведем анализ квадратичного разброса значений зависимой переменнойотносительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределениеФишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременнонулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качестварегрессии, оцененной по различным зависимым переменным, полезно исследовать долиобъясненной и необъясненной дисперсии. Корень из коэффициента детерминации называетсякоэффициентом корреляции. Следует иметь в виду, что  является смещенной оценкой.Абсолютные значения коэффициентов не позволяют сделать такой вывод.

/> <td/> />
Теперья рассчитаю t-критерий Стьюдента для моей модели регрессии.

— это средние квадратические отклонения.

/>

/> <td/> />
Расчетныезначения t-критерия Стьюдента:

Потаблице распределения Стьюдента я нахожу критическое значение t-критерия для ν= 32-2 = 30. Вероятность α я принимаю 0,05. tтабл равно 2,042. Таккак, оба значения ta0 и ta1 больше tтабл, то оба параметра а0 и а1 признаютсязначимыми и отклоняется гипотеза о том, что каждый из этих параметров вдействительности равен 0, и лишь в силу случайных обстоятельств оказалсяравным проверяемой величине.

Проверкаадекватности регрессионной модели  может быть дополнена корреляционныманализом. Для этого необходимо определить тесноту       корреляционной связимежду переменными х и у. Теснота корреляционной связи, как и любой другой,может быть измерена эмпирическим корреляционным отношением ηэ, когдаδ2 (межгрупповая дисперсия) характеризует отклонения групповых среднихрезультативного признака от общей средней:/>. 

Говоряо корреляционном отношении как о показателе измерения тесноты зависимости, следуетотличать от эмпирического корреляционного отношения – теоретическое. Рассмотрим, что представляетсобой эта значимость. Обозначим  коэффициент детерминации, полученный при исключениииз правой части уравнения переменной. При этом мы получим уменьшение объясненнойдисперсии, на величину. Для оценки значимости включения переменной используетсястатистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще,если из уравнения регрессии исключаются переменных, статистикой значимости исключениябудет. Пошаговая процедура построения модели. Основным критерием отбора аргументовдолжно быть качественное представление о факторах, влияющих на зависимую переменную,которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионноймодели: на машину переложена значительная доля трудностей в решении этой задачи.Возможно построение последовательное построение модели добавлением и удалением блоковпеременных. Но мы рассмотрим только работу с отдельными переменными. По умолчаниюпрограмма включает все заданные переменные.

Теоретическоекорреляционное отношение η представляет собой относительную величину,получающуюся в результате сравнения среднего квадратического отклонениявыравненных значений результативного признака  δ, то есть рассчитанных поуравнению регрессии, со средним квадратическим отношением эмпирических(фактических) значений результативности признака σ:

/>  ,

где/>;       />.

Тогда/>.[2]

Изменениезначения η объясняется влиянием факторного признака. Метод включения и исключенияпеременных состоит в следующем. Из множества факторов, рассматриваемых исследователемкак возможные аргументы регрессионного уравнения, отбирается один, который болеевсего связан корреляционной зависимостью. Далее проводится та же процедура при двухвыбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнениене будут включены все аргументы, выделенные исследователем, удовлетворяющие критериямзначимости включения. Замечание: во избежание зацикливания процесса включения исключениязначимость включения устанавливается меньше значимости исключения. Переменные, порождаемыерегрессионным уравнением. Сохранение переменных, порождаемых регрессией, производитсяподкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могутбыть оценены прогнозные значения зависимой переменной, причем они могут быть вычисленыи там, где значения определены, и там где они не определены.

Воснове расчёта корреляционного отношения лежит правило сложения дисперсий, тоесть />, где/>   -  отражает вариацию у за счёт всех остальных факторов, кроме х, то есть являютсяостаточной дисперсией:

/>/>.

Тогдаформула теоретического корреляционного отношения примет вид:

/>,

или       />.

Подкоренноевыражение корреляционного выражения представляет собой коэффициент детерминации(мера определенности, причинности).

Коэффициентдетерминации показывает долю вариации результативного признака под влияниемвариации признака-фактора. Задача регрессионного анализа состоит в построении модели, позволяющейпо значениям независимых показателей получать оценки значений зависимой переменной.Регрессионный анализ является основным средством исследования зависимостей междусоциально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространеннойв статистических пакетах классической модели линейной регрессии. Специфика социологическихисследований состоит в том, что очень часто необходимо изучать и предсказывать социальныесобытия. Вторая часть данной главы будет посвящена регрессии, целью которой являетсяпостроение моделей, предсказывающих вероятности событий. Величина называется ошибкойрегрессии. Первые математические результаты, связанные с регрессионным анализом,сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами,ошибка для различных объектов считаются независимыми. Кроме того, в данной моделимы рассматриваем переменные как неслучайные значения. Такое, на практике, получается,когда идет активный эксперимент, в котором задают значения (например, назначилизарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Теоретическоекорреляционное выражение применяется для измерения тесноты связи при линейной икриволинейной зависимостях между результативным и факторным признаком.

Каквидно из вышеприведенных формул корреляционное отношение может находиться от 0до 1. Чем ближе корреляционное отношение к 1, тем связь между признакамитеснее.

Теоретическоекорреляционное отношение применительно к  моему анализу я рассчитаю двумяспособами:

/>

/>[5]

Полученноезначение теоретического корреляционного отношения свидетельствует о возможномналичии среднестатистической связи между рассматриваемыми признаками.Коэффициент детерминации равен 0,62. Отсюда я заключаю, что 62% общей вариацииработающих активов изучаемых банков обусловлено вариацией фактора – капиталабанков (а 38% общей вариации нельзя объяснить изменением размера капитала).

Крометого, при линейной форме уравнения применяется другой показатель тесноты связи– линейный коэффициент корреляции:

/>,

гдеn – число наблюдений.

Дляпрактических вычислений при малом числе наблюдений (n≤20÷30)линейный коэффициент корреляции удобнее исчислять по следующей формуле:

/>.

Значениелинейного коэффициента корреляции важно для исследованиясоциально-экономических явлений и процессов, распределение которых близко кнормальному. Он принимает значения в интервале: -1≤ r ≤ 1.

Отрицательныезначения указывают на обратную связь, положительные – на прямую. При r = 0линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютнойвеличине к единице, тем теснее связь между признаками. И, наконец, при r = ±1 –связь функциональная. Задача регрессионного анализа состоит в построении модели, позволяющейпо значениям независимых показателей получать оценки значений зависимой переменной.Регрессионный анализ является основным средством исследования зависимостей междусоциально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространеннойв статистических пакетах классической модели линейной регрессии. Специфика социологическихисследований состоит в том, что очень часто необходимо изучать и предсказывать социальныесобытия. Вторая часть данной главы будет посвящена регрессии, целью которой являетсяпостроение моделей, предсказывающих вероятности событий. Величина называется ошибкойрегрессии. Первые математические результаты, связанные с регрессионным анализом,сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами,ошибка для различных объектов считаются независимыми. Кроме того, в данной моделимы рассматриваем переменные как неслучайные значения. Такое, на практике, получается,когда идет активный эксперимент, в котором задают значения (например, назначилизарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Используяданные таблицы 1 я рассчитала линейный коэффициент корреляции r. Но чтобыиспользовать формулу для линейного коэффициента корреляции рассчитаем дисперсиюрезультативного признака σy:

/>

/>

Квадратлинейного коэффициента корреляции r2 называется линейным коэффициентомдетерминации. Из определения коэффициента детерминации очевидно, что егочисловое значение всегда заключено в пределах от 0 до 1, то есть 0 ≤ r2 ≤1. Степень тесноты связи полностью соответствует теоретическому корреляционномуотношению, которое является более универсальным показателем тесноты связи посравнению с линейным коэффициентом корреляции. Однако при небольшой взаимосвязи между переменными,если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованныхпеременных, то оценки коэффициентов регрессии позволят по их абсолютной величинесудить о том, какой аргумент в большей степени влияет на функцию. Стандартизацияпеременных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковыхмасштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументамив правой части уравнения могут происходить странные вещи. Надежность и значимостькоэффициента регрессии. Здесь  обозначен коэффициент детерминации, получаемый припостроении уравнения регрессии, в котором в качестве зависимой переменной взятадругая переменная. Из выражения видно, что величина коэффициента тем неустойчивее,чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределениеСтьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость — вероятностьслучайно при нулевом регрессионном коэффициенте получить значение статистики, большеепо абсолютной величине, чем выборочное. Значимость включения переменной в регрессию.При последовательном подборе переменных предусмотрена автоматизация, основаннаяна значимости включения и исключения переменных.

Фактсовпадений и несовпадений значений теоретического корреляционного отношенияη и линейного коэффициента корреляции r используется для оценки формысвязи. [4]

Вышеотмечалось, что посредством теоретического корреляционного отношения измеряетсятеснота связи любой формы, а с помощью линейного коэффициента корреляции –только прямолинейной. Следовательно, значения η и r совпадают только приналичии прямолинейной связи. Несовпадение этих величин свидетельствует, чтосвязь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено,что если разность квадратов η и r не превышает 0,1, то гипотезу опрямолинейной форме связи можно считать подтвержденной. В моем случаенаблюдается примерное совпадение линейного коэффициента детерминации итеоретического корреляционного отношения, что дает мне основание считать связьмежду капиталом банков и их работающими активами прямолинейной.

Прилинейной однофакторной связи t-критерий можно рассчитать по формуле:

/>,

где(n — 2) – число степеней свободы при заданном уровне значимости α и объемевыборки n. Задачарегрессионного анализа состоит в построении модели, позволяющей по значениям независимыхпоказателей получать оценки значений зависимой переменной. Регрессионный анализявляется основным средством исследования зависимостей между социально-экономическимипеременными. Эту задачу мы рассмотрим в рамках самой распространенной в статистическихпакетах классической модели линейной регрессии. Специфика социологических исследованийсостоит в том, что очень часто необходимо изучать и предсказывать социальные события.Вторая часть данной главы будет посвящена регрессии, целью которой является построениемоделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии.Первые математические результаты, связанные с регрессионным анализом, сделаны впредположении, что регрессионная ошибка распределена нормально с параметрами, ошибкадля различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваемпеременные как неслучайные значения. Такое, на практике, получается, когда идетактивный эксперимент, в котором задают значения (например, назначили зарплату работнику),а затем измеряют (оценили, какой стала производительность труда).

Так,для коэффициента корреляции между капиталом и работающими активами получается:

/>

Еслисравнить полученное tрасч с критическим значением из таблицы Стьюдента, гдеν=30, а α=0,01 (tтабл=2,750), то полученное значение t-критерия будетбольше табличного, что свидетельствует о значимости коэффициента корреляции исущественной связи между капиталом и работающими активами.

Такимобразом, построенная регрессионная модель ŷ=245,75+1,42x  в целомадекватна, и выводы полученные по результатам малой выборки можно с достаточнойвероятностью распространить на всю гипотетическую генеральную совокупность. За это иногда зависимую переменнуюназывают откликом. Теория регрессионных уравнений со случайными независимыми переменнымисложнее, но известно, что, при большом числе наблюдений, использование метода разработанногокорректно. Для получения оценок  коэффициентов  регрессии минимизируется сумма квадратовошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи.Существует ли линейная регрессионная зависимость? Для проверки одновременного отличиявсех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значенийзависимой переменной относительно среднего. Его можно разложить на две суммы следующимобразом. Статистика  в условиях гипотезы равенства нулю регрессионных коэффициентовимеет распределение Фишера и, естественно, по этой статистике проверяют, являютсяли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественнойкорреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным,полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициентадетерминации называется коэффициентом корреляции. Следует иметь в виду, что  являетсясмещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такойвывод.

3.Практическаячасть

/> — уравнениерегрессии.

x 1 2 3 4 5 6 7 8 9 10 y 1.35 1.09 6.46 3.15 5.80 7.2 8.07 8.12 8.97 10.66

Приведемквадратное уравнение к линейной форме:

/>;/>

/>

Запишемматрицу X.

/>

Составимматрицу Фишера.

/>

/>

/>Система нормальныхуравнений.

/>

Решимее методом Гаусса.

/>

Уравнениерегрессии имеет вид:

/> [7]

3.1.Оценка значимости коэффициентов регрессии.

Дляпроверки нулевой гипотезы используем критерий Стьюдента.

/>   />

/>

/>

/>

/>

/>

/>

/>

/>/>

/>

/>

Коэффициенты/> значимые коэффициенты.[6]

3.2.Проверка адекватности модели по критерию Фишера.

/>

/>

/>

/>

/>  гипотеза оравенстве математического ожидания  отвергается. [4]

3.3.Проверка адекватности модели по коэффициенту детерминации или множественнойкорреляции.

Коэффициентдетерминации :

/>

/> — регрессионнаямодель адекватна.

Коэффициентмножественной корреляции />

Рассчитатьи построить график уравнения прямолинейной регрессии для относительных значенийPWC170 и времени челночного бега 3х10 м у 13 исследуемых и сделать вывод оточности расчета уравнений, если данные выборок таковы:

xi,кГ м/мин/кг ~ 15,6; 13,4; 17,9; 12,8; 10,7; 15,7; 11,7; 12,3; 12,3; 11,1; 14,3;12,7; 14,4 yi, с ~ 6,9; 7,2; 7,1; 6,7; 7,6; 7,0; 6,4; 6,9; 7,7; 7,6; 7,9; 8,2;6,8

Решение

1.Занести данные тестирования в рабочую таблицу и сделать соответствующиерасчеты.

xi

xi — />

(xi — />)2

yi

yi – />

(yi – />)2

(xi — />)(yi – />)

15.6 2.1 4.41 6.9 -0.3 0.09 -0.63 13.4 -0.1 0.01 7.2 17.9 4.4 19.36 7.1 -0.1 0.01 -0.44 12.8 -0.7 0.49 6.7 -0.5 0.25 0.35 10.7 -2.8 7.84 7.6 0.4 0.16 -1.12 15.7 2.2 4.84 7.0 -0.2 0.04 -0.44 11.7 -1.8 3.24 6.4 -0.8 0.64 1.44 12.3 -1.2 1.44 6.9 -0.3 0.09 0.36 12.3 -1.2 1.44 7.7 0.5 0.25 -0.60 11.1 -2.4 5.76 7.6 0.4 0.16 -0.96 14.3 0.8 0.64 7.9 0.7 0.49 0.56 12.7 -0.8 0.64 8.2 1 1 -0.80 14.4 0.9 0.81 6.8 -0.4 0.16 -0.36

/>= 13.5

/>

/>=50,92

/>= 7,2

/>

/>=3,34

/>= -2,64

1.Рассчитать значение нормированного коэффициента корреляции по формуле:

/>

2.Рассчитать конечный вид уравнений прямолинейной регрессии по формулам (2) и(3):

/>(2)
/>(3)

/>

Т.е.

/>

4.Рассчитать абсолютные погрешности уравнений регрессии по формулам (4) и (5):

/>

5.Рассчитать относительные погрешности уравнений регрессии по формулам (6) и (7):

/>


6. Для графического представления корреляционной зависимости между признакамирассчитать координаты линий регрессии, подставив в конечный вид уравнений (1) и(2) данные любого исследуемого (например, четвертого из списка).
Тогда:

прих = 12,8 кГм/мин/кг у =7,235 с » 7,2 с;

приу = 6,7 с х = 13,895 с » 13,9 кГм/мин/кг.

7.Представить графически данное уравнение регрессии.

/>

8.На основании произведенных расчетов и графического изображения уравнениярегрессии сделать вывод.

Вывод:
1) в исследуемой группе наблюдается недостоверная обратная взаимосвязь междуданными относительных значений PWC170 и времени челночного бега 3х10 м, т.к.rху = -0,20 < rst = 0,55 для К= 11 при = 95%;
2) относительная погрешность функции ух = 7,875 – 0,05х меньше (7,22%), а,следовательно, прогноз результата в челночном беге по данным относительныхзначений пробы PWC170 более точен;
3) на графике линии уравнения регрессии расположены почти под прямым углом, таккак значения коэффициента корреляции близки к нулю.[3]

Заключение

Висследуемой группе наблюдается недостоверная обратная взаимосвязь между даннымиотносительных значений PWC170 и времени челночного бега 3х10 м, т.к. rху =-0,20 < rst = 0,55 для К= 11 при = 95%;
 - относительная погрешность функции ух = 7,875 – 0,05х меньше (7,22%), а,следовательно, прогноз результата в челночном беге по данным относительныхзначений пробы PWC170 более точен;
 - на графике линии уравнения регрессии расположены почти под прямым углом, таккак значения коэффициента корреляции близки к нулю.

Такжев работе показана корреляционная зависимость  показателей 32 российских банков,проведен регрессионный анализ и нашли регрессионную модель данной взаимосвязипоказателей. Задачарегрессионного анализа состоит в построении модели, позволяющей по значениям независимыхпоказателей получать оценки значений зависимой переменной. Регрессионный анализявляется основным средством исследования зависимостей между социально-экономическимипеременными. Эту задачу мы рассмотрим в рамках самой распространенной в статистическихпакетах классической модели линейной регрессии. Специфика социологических исследованийсостоит в том, что очень часто необходимо изучать и предсказывать социальные события.Вторая часть данной главы будет посвящена регрессии, целью которой является построениемоделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии.Первые математические результаты, связанные с регрессионным анализом, сделаны впредположении, что регрессионная ошибка распределена нормально с параметрами, ошибкадля различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваемпеременные как неслучайные значения. Такое, на практике, получается, когда идетактивный эксперимент, в котором задают значения (например, назначили зарплату работнику),а затем измеряют (оценили, какой стала производительность труда).

Полученноеуравнение ŷ=245,75+1,42х позволяет проиллюстрировать зависимость размераработающих активов банков от размера их капитала.

Итак, с помощью корреляционно-регрессионного анализа, можно исследовать показателибанков.[8]

Использованнаялитература

1.  АверкинА.Н., Батыршин И.З., Блишун А.Ф. и др. Нечеткие множества в моделях управленияи искусственного интеллекта // Под ред. Д.А. Поспелова. – М.: Наука, 1986. –312 с.

2.  АветисянД.О. Проблемы информационного поиска: (Эффективность, автоматическое кодирование,поисковые стратегии) — М.: Финансы и статистика, 1981. — 207 с.

3.  АйвазянС.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. – М.:Статистика, 1974. – 240 с.

4.  АйвазянС.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования ипервичная обработка данных. Справочное издание. – М.: Финансы и статистика,1983. – 472 с.

5.  АйвазянС.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследованиезависимостей: Справочник. – М.: Финансы и статистика, 1985. – 182с.

6.  АйвазянС.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М. Юнити,1998. – 1024 с.

7.  Вандер Варден Б.Л. Математическая статистика. – М.: Изд-во иностр. лит., 1960. –302 с.

8.  ГайдышевИ.П. Анализ и обработка данных: специальный справочник. — СПб.: Питер, 2001. — 752 с.

9.  ГмурманВ.С. Теория вероятностей и математическая статистика. – М.: Высш. шк., 1972. –368 с.

10.      КалининаВ.Н., Панкин В.Ф. Математическая статистика. – М.: Высш. шк., 2001. – 336 с.

11.      КендаллМ., Стьюарт А. Теория распределений. – М.: Наука, 1966. – 566 с.

12.      КендаллМ., Стьюарт А. Статистические выводы и связи. – М .: Наука, 1973. – 899 с.

еще рефераты
Еще работы по математике