Реферат: 7.Статистическое изучение вариации социально-экономических явлений

--PAGE_BREAK--
1.8.2    Способы формирования выборочной совокупности

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки:

§         собственно-случайная;

§         механическая;

§         типическая;

§         серийная;

§         многоступенчатая;

§         многофазная.

Собственно-случайная выборказаключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или невключение в нее отдельных единиц не вызывало сомнений.

Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел. Для жеребьевки необходимо подготовить достаточное количество жребиев – фишек, шаров, карточек, соответствующее объему генеральной совокупности. Каждый жребий должен содержать информацию об отдельной единице совокупности – номер, фамилию лица или адрес, название или какой-либо другой отличительный признак. Необходимое в соответствии с установленным процентом отбора количество жребиев извлекается из общей их совокупности в случайном порядке.

При отборе по таблицам случайных чисел каждая единица генеральной совокупности должна иметь порядковый номер. Таблицы случайных чисел получаются с помощью датчика случайных чисел на ПК и представляют собой абсолютно произвольные столбцы цифр. В соответствии с объектом генеральной совокупности выбирается любой столбец с числами необходимой значимости. Например, если генеральная совокупность включает 5000 единиц, потребуются четырехзначные столбцы, при этом числа больше 5000 не будут приниматься во внимание. В выборочную совокупность отбираются единицы с порядковыми номерами, соответствующими числам выбранного столбца.

Собственно-случайный отбор может быть как повторным, так и бесповторным. Для проведения бесповторного отбора в процессе жеребьевки выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют. При использовании таблиц случайных чисел бесповторность отбора достигается пропуском чисел в случае их повторения в выбранном столбце или столбцах. После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки. Формулы расчета ошибок выборки и основные характеристики параметров генеральной и выборочной совокупности представлены в таблице 1.8.1.

Как видно из формул (табл. 1.8.1), размер предельной ошибки зависит от вариации признака <img width=«21» height=«24» src=«ref-2_1352882819-124.coolpic» v:shapes="_x0000_i1068">, объема выборки n
и ее доли в генеральной совокупности <img width=«19» height=«37» src=«ref-2_1352882943-115.coolpic» v:shapes="_x0000_i1069">, а также принятого уровня вероятности (р), которому соответствует коэффициент кратности t. Так, t=1 для вероятности  0,683; t=2 для вероятности 0,954; t=3 для вероятности 0,997.

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для генеральной средней такие пределы устанавливаются на основе следующих соотношений:                               <img width=«63» height=«24» src=«ref-2_1352883058-157.coolpic» v:shapes="_x0000_i1070">     (1.8.1)

 
<img width=«115» height=«21» src=«ref-2_1352883215-220.coolpic» v:shapes="_x0000_i1071">
,   (1.8.2)

где  
<img width=«12» height=«16» src=«ref-2_1352883435-84.coolpic» v:shapes="_x0000_i1072"> 
и<img width=«13» height=«17» src=«ref-2_1352883519-84.coolpic» v:shapes="_x0000_i1073">
  —
генеральная и выборочная средняя соответственно;

              <img width=«21» height=«24» src=«ref-2_1352883603-106.coolpic» v:shapes="_x0000_i1074">  — предельная ошибка генеральной средней.
Доверительные интервалы для генеральной доли:
                  <img width=«67» height=«21» src=«ref-2_1352883709-158.coolpic» v:shapes="_x0000_i1075">    (1.8.3)

<img width=«127» height=«20» src=«ref-2_1352883867-232.coolpic» v:shapes="_x0000_i1076">    (1.8.4)
Таблица 1.8.1

Формулы расчета  ошибок выборки и основные характеристики

 параметров генеральной и выборочной совокупности


Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в расположении единиц (табельные номера работников, списки избирателей, телефонные номера респондентов, номера домов и квартир и т.п.).

Отбор элементов осуществляется через одинаковые интервалы, шаг интервала зависит от доли выборки. Так, при <img width=«19» height=«37» src=«ref-2_1352882943-115.coolpic» v:shapes="_x0000_i1091">= 0,05 шаг интервала составляет <img width=«31» height=«39» src=«ref-2_1352887263-144.coolpic» v:shapes="_x0000_i1092"> = 20. Ошибка механической выборки вычисляется по формуле бесповторной выборки. Для моментных наблюдений, фиксирующих состояние непрерывного процесса на определенные моменты времени, используют формулу ошибки повторной выборки.

При типическом отборе генеральная совокупность разбивается на несколько типических групп по существенному признаку.При обследовании населения такими группами могут быть, например, районы, социальные, возрастные или образовательные группы, при обследовании предприятий – отрасль или подотрасль, форма собственности и т.п. Затем из каждой группы путем собственно-случайного или механического отбора отбираются единицы в выборочную совокупность.
При вычислении ошибки типической выборки используют среднюю из групповых дисперсий:

   для средней:  <img width=«81» height=«40» src=«ref-2_1352887407-302.coolpic» v:shapes="_x0000_i1093">   (1.8.5);

                            для доли:  <img width=«119» height=«45» src=«ref-2_1352887709-371.coolpic» v:shapes="_x0000_i1094">   (1.8.6)


Средняя ошибка типической выборкиопределяется следующим образом:

для средней:  <img width=«113» height=«45» src=«ref-2_1352888080-398.coolpic» v:shapes="_x0000_i1095">
  
(1.8.7);

 для доли:  <img width=«128» height=«40» src=«ref-2_1352888478-409.coolpic» v:shapes="_x0000_i1096">    (1.8.8)

Как правило, <img width=«20» height=«32» src=«ref-2_1352888887-142.coolpic» v:shapes="_x0000_i1097"> < <img width=«20» height=«19» src=«ref-2_1352889029-128.coolpic» v:shapes="_x0000_i1098">, следовательно, ошибка типической выборки меньше, чем механической или простой случайной. Чаще всего используют отбор, пропорциональный численности составляющих совокупности, т. е. доля выборки для всех составляющих одинакова.

Серийный отборудобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. В качестве таких серий могут рассматриваться районы, поселки, фирмы, акционерные общества, студенческие группы, бригады, а также упаковки с определенным количеством готовой продукции, партии товара и т.д. Сущность серийной выборки заключается в собственно-случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка серийной выборки (при отборе равновеликих серий) зависит от величины только межгрупповой (межсерийной) дисперсии и определяется по следующим формулам:

<img width=«67» height=«41» src=«ref-2_1352889157-248.coolpic» v:shapes="_x0000_i1099">
 
-повторный отбор   (1.8.9);
          
<img width=«108» height=«45» src=«ref-2_1352889405-368.coolpic» v:shapes="_x0000_i1100">
 
— бесповторный отбор   (1.8.10),
где
r
– число отобранных серий;

      R– общее число серий.
Межгрупповую дисперсиювычисляют следующим образом:

<img width=«96» height=«39» src=«ref-2_1352889773-297.coolpic» v:shapes="_x0000_i1101">
  
(1.8.11),

где <img width=«15» height=«20» src=«ref-2_1352890070-115.coolpic» v:shapes="_x0000_i1102">  — средняя i-й серии;

       <img width=«13» height=«17» src=«ref-2_1352883519-84.coolpic» v:shapes="_x0000_i1103">  — общая средняя по всей выборочной совокупности.
При серийном отборе ошибка будет меньше, чем при механическом отборе.

Многоступенчатая выборка предполагает извлечение из генеральной совокупности сначала укрупненных групп единиц, затем групп, меньших по объему, и так до тех пор, пока не будут отобраны те группы (серии) или отдельные единицы, которые будут подвергнуты наблюдению. Выборка может быть двухступенчатой, когда генеральная совокупность разбивается на группы и производится отбор групп, а затем внутри групп – отбор единиц наблюдения. На обеих ступенях отбор может вестись в случайном порядке. В этом случае ошибка рассчитывается следующим образом:
<img width=«160» height=«57» src=«ref-2_1352890269-526.coolpic» v:shapes="_x0000_i1104">    (1.8.12)
В отличие от типического отбора, где отбор производится из всех без исключения групп, при многоступенчатом отборе производится отбор самих групп, и, следовательно, не все они попадают в выборку.

Число ступеней отбора может быть и более трех. Если число ступеней отбора больше двух, то средняя ошибка выборки определяется по формуле:

<img width=«160» height=«52» src=«ref-2_1352890795-530.coolpic» v:shapes="_x0000_i1105">    (1.8.13)

где <img width=«19» height=«23» src=«ref-2_1352891325-124.coolpic» v:shapes="_x0000_i1106">, <img width=«20» height=«23» src=«ref-2_1352891449-128.coolpic» v:shapes="_x0000_i1107">, <img width=«19» height=«23» src=«ref-2_1352891577-127.coolpic» v:shapes="_x0000_i1108">  — средние ошибки выборки на отдельных ступенях отбора;

                    <img width=«43» height=«27» src=«ref-2_1352891704-182.coolpic» v:shapes="_x0000_i1109">   — численность выборок на соответствующих ступенях.

Многофазная выборка отличается от многоступенчатой тем, что на каждой стадии сохраняется одна и та же единица отбора, но изменяется программа наблюдения. Причем расширенная программа обязательно содержит вопросы краткой программы, что делает возможным проверить репрезентативность выборки. Расчет ошибки многофазной выборки производится для каждой фазы в отдельности.

1.8.3     Определение необходимого объема выборки

В практике проектирования выборочного наблюдения возникает вопрос о необходимой численности выборки, которая необходима для обеспечения определенной точности расчета генеральных характеристик – средней и доли. Эта численность может быть определена на базе допустимой ошибки при выборочном наблюдении, исходя из вероятности, на основе которой можно гарантировать величину устанавливаемой ошибки, и, наконец, на базе способа отбора.

Формулы необходимого объема выборки для различных способов формирования выборочной совокупности могут быть выведены из соответствующих соотношений, используемых при расчете предельных ошибок выборки.

При случайном повторном отборечисленность выборки определяется по формуле:

<img width=«56» height=«41» src=«ref-2_1352891886-227.coolpic» v:shapes="_x0000_i1110">    (1.8.14)  


При случайном бесповторном и механическом отборечисленность выборки вычисляется по формуле:
<img width=«95» height=«37» src=«ref-2_1352892113-326.coolpic» v:shapes="_x0000_i1111">
  
(1.8.15)
Для типической выборки:

               


   
<img width=«57» height=«44» src=«ref-2_1352892439-234.coolpic» v:shapes="_x0000_i1112">
  — повторный отбор   (1.8.16);
<img width=«95» height=«40» src=«ref-2_1352892673-338.coolpic» v:shapes="_x0000_i1113">  — бесповторный отбор   (1.8.17)
Для серийной выборки:
   
<img width=«55» height=«41» src=«ref-2_1352893011-225.coolpic» v:shapes="_x0000_i1114">
  — повторный отбор   (1.8.18);
 
<img width=«91» height=«37» src=«ref-2_1352893236-320.coolpic» v:shapes="_x0000_i1115">
 
— бесповторный отбор   (1.8.19)
При этом в зависимости от целей исследования дисперсии и ошибки выборки могут быть рассчитаны для средней величины или доли признака.
Основные вопросы, решаемые при расчете численности выборки:

1)необходимо принять решение о размере допустимой   погрешности;

2)коэффициент кратности tопределяется согласно принятой вероятности результата исследований;

3)в приведенных формулах вместо фактических значений дисперсии и доли используются приблизительные значения, полученные на основе ранее проводимых исследований, либо на основе пробных выборок.

4)если планируется выборка для исследования доли альтернативного признака, то в формулы   подставляется максимально возможное значение дисперсии;

5)расчет численности выборки производится несколько раз, исходя из требований точности для всех изучаемых признаков. В качестве окончательного решения выбирается наибольшее из полученных значений;

6)если полученные значения  n
 различаются в 6, 7 и более раз, то выборка организуется как многоступенчатая;

7)если объем генеральной совокупности достаточно велик (более 100 тыс.), то используются формулы для повторного отбора независимо от типа планируемой выборки.

9    Статистические методы изучения взаимосвязей

социально-экономических явлений

1.9.1    Причинность, регрессия, корреляция

Исследование объективно существующих зависимостей и взаимосвязей между явлениями и процессами — важнейшая задача теории статистики, которая играет в экономике значительную роль и позволяет глубже понять сложный механизм причинно-следственных отношений между явлениями. Причинно-следственные отношения — это такая связь явлений и процессов, когда изменение одного из них — причины ведет к изменению другого — следствия.

Все социально-экономические явления взаимосвязаны ипредставляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

Признаки по их значению для изучения взаимосвязи делятся на два класса. Признаки, характеризующие причины и условия связи, называются факторными (х), а признаки, которые характеризуют следствия связи, – результативными (у).

 Между признаками хи у возникают разные по природе и характеру связи, а именно: функциональные и стохастические. При функциональной связикаждому значению признака хсоответствует одно определенное значение у. Эта связь проявляется однозначно в каждом отдельном случае. При стохастической связи каждому значению признака хсоответствует определенное множество значений у, образующих так называемое условное распределение.Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условное распределение средней величиной <img width=«13» height=«19» src=«ref-2_1352893556-90.coolpic» v:shapes="_x0000_i1116">, то образуется разновидность стохастической связи – корреляционная.В случае корреляционной связи каждому значению признака х соответствует среднее значение результативного признака <img width=«13» height=«19» src=«ref-2_1352893556-90.coolpic» v:shapes="_x0000_i1117">.

Связи между явлениями и их признаками классифицируются:

§         по степени тесноты;

§         по направлению;

§         по аналитическому выражению.

По степени теснотысвязи представлены в таблице 1.9.1.

По направлениювыделяют:

§         Прямую
связь
— это такая связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности труда способствует увеличению уровня рентабельности производства.

§         Обратную связь – это такая связь, при которой значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.
Таблица 1.9.1
    продолжение
--PAGE_BREAK--
Количественные критерии оценки тесноты связи


По аналитическому выражениювыделяют связи:

§         прямолинейные (или просто линейные);

§         нелинейные.

Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют линейной связью вида:
<img width=«77» height=«20» src=«ref-2_1352893736-224.coolpic» v:shapes="_x0000_i1118">
 
   (1.9.1)
Если же связь может быть выражена уравнением какой-либо кривой линии, например, параболы, то такую связь называют нелинейной или криволинейной:
<img width=«113» height=«21» src=«ref-2_1352893960-289.coolpic» v:shapes="_x0000_i1119">
  
(1.9.2)


Для выявления наличия связи, ее характера и направления в статистике используются методы:

§         приведения параллельных данных;

§         аналитических группировок;

§         графический;

§         корреляции.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменение двух величин:




Мы видим, что с увеличением величины X величина Y также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой или уравнением параболы второго порядка.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат — результативного.

Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Корреляция — это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению среднего значения другой.

Варианты корреляционной зависимости:

1) парная корреляция — связь между двумя признаками (результативным и факторным, или двумя факторными).

2) частная корреляция — зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3)  множественная корреляция — зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии.

Регрессия тесно связана с корреляцией:первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму.

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторов).

Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.

Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.

При построении моделей регрессии должны соблюдаться

следующие требования:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (цифровое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.

6. Отсутствие количественных ограничений на параметры модели связи.

7. Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные явления и процессы.
1.9.2         
    Парная регрессия  на основе метода наименьших


квадратов и метода группировок

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:
прямой                                                 <img width=«77» height=«20» src=«ref-2_1352893736-224.coolpic» v:shapes="_x0000_i1120">
гиперболы                                           <img width=«83» height=«37» src=«ref-2_1352894473-270.coolpic» v:shapes="_x0000_i1121">                                         


параболы                                             <img width=«105» height=«21» src=«ref-2_1352894743-286.coolpic» v:shapes="_x0000_i1122">
   
(1.9.3)
показательной функции                    <img width=«72» height=«23» src=«ref-2_1352895029-233.coolpic» v:shapes="_x0000_i1123">

полулогарифметической функции   <img width=«93» height=«20» src=«ref-2_1352895262-253.coolpic» v:shapes="_x0000_i1124">
   
и так далее.
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи — гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии (<img width=«43» height=«25» src=«ref-2_1352895515-185.coolpic» v:shapes="_x0000_i1125"> и <img width=«16» height=«20» src=«ref-2_1352895700-118.coolpic» v:shapes="_x0000_i1126"> — в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (<img width=«43» height=«25» src=«ref-2_1352895515-185.coolpic» v:shapes="_x0000_i1127">), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
<img width=«131» height=«24» src=«ref-2_1352896003-276.coolpic» v:shapes="_x0000_i1128">     (1.9.4)
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
<img width=«128» height=«44» src=«ref-2_1352896279-497.coolpic» v:shapes="_x0000_i1129">
  
(1.9.5)
где n — объем исследуемой совокупности (число единиц наблюдения).
В уравнениях регрессии параметр a<img width=«9» height=«20» src=«ref-2_1352896776-101.coolpic» v:shapes="_x0000_i1130">показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков; коэффициент регрессии a<img width=«8» height=«13» src=«ref-2_1352896877-94.coolpic» v:shapes="_x0000_i1131">показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Множественная (многофакторная) регрессия

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:
<img width=«129» height=«21» src=«ref-2_1352896971-334.coolpic» v:shapes="_x0000_i1132">
  
(1.9.6)
Построение моделей множественной регрессии включает несколько этапов:

1. Выбор формы связи (уравнения регрессии);

2. Отбор факторных признаков;

3. Обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется на сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R
<img width=«9» height=«19» src=«ref-2_1352877816-98.coolpic» v:shapes="_x0000_i1133">
). Одновременно используется и обратный метод, то есть исключение факторов, ставших незначимыми. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель (<img width=«21» height=«24» src=«ref-2_1352897403-132.coolpic» v:shapes="_x0000_i1134">> 0,8).

Наличие мультиколлинеарностимежду признаками приводит к:

§         искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков;

§         изменению смысла экономической интерпретации коэффициентов регрессии.
В качестве причин возникновения мультиколлинеарности между признаками, можно выделить следующие:

§         изучаемые факторные признаки являются характеристикой одной и той же стороны явления или процесса. Например: показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

§         факторные признаки являются составляющими элементами друг друга;

§         факторные признаки по экономическому смыслу дублируют друг друга.
Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании качественного и логического анализа изучаемого явления.

Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

Аналитическая форма связи результативного признака от ряда факторных выражается и называется многофакторным (множественным) уравнением регрессии или моделью связи.
Линейное уравнение множественной регрессии имеет вид:
<img width=«197» height=«21» src=«ref-2_1352897535-397.coolpic» v:shapes="_x0000_i1135">
  
(1.9.7)
где <img width=«40» height=«21» src=«ref-2_1352897932-196.coolpic» v:shapes="_x0000_i1136"> — теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

<img width=«65» height=«20» src=«ref-2_1352898128-203.coolpic» v:shapes="_x0000_i1137">  — факторные признаки;

<img width=«65» height=«20» src=«ref-2_1352898331-209.coolpic» v:shapes="_x0000_i1138">  — параметры модели (коэффициенты регрессии).
Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и так далее.
1.9.4    Собственно-корреляционные параметрические методы изучения связи

Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных) факторных.

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.

В теории разработаны и на практике применяются различные модификации формулы расчета данного коэффициента:
<img width=«85» height=«44» src=«ref-2_1352898540-262.coolpic» v:shapes="_x0000_i1139">    (1.9.8)
Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:
<img width=«224» height=«45» src=«ref-2_1352898802-659.coolpic» v:shapes="_x0000_i1140">    (1.9.9)
Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:
<img width=«64» height=«44» src=«ref-2_1352899461-233.coolpic» v:shapes="_x0000_i1141">    (1.9.10)

где    a<img width=«8» height=«13» src=«ref-2_1352873385-96.coolpic» v:shapes="_x0000_i1142"> — коэффициент регрессии в уравнении связи;

               <img width=«24» height=«23» src=«ref-2_1352899790-129.coolpic» v:shapes="_x0000_i1143"> — среднеквадратическое отклонение соответствующего, статистически существенного, факторного признака.
Линейный коэффициент корреляции изменяется в пределах от -1 до 1: <img width=«56» height=«15» src=«ref-2_1352899919-134.coolpic» v:shapes="_x0000_i1144">. Знаки коэффициентов регрессии и корреляции совпадают.
При этом интерпретацию выходных значений коэффициента корреляции можно представить в следующей таблице 1.9.3:


Таблица 1.9.3

Оценка линейного коэффициента корреляции



Пример.По исходным данным, представленным в таблице 1.9.2, оценим тесноту связи с помощью коэффициента корреляции (см. табл. 1.9.4).

Таблица 1.9.4

Расчетная таблица для определения

 коэффициента корреляции



1. Используя формулу (1.9.8) получаем:
<img width=«309» height=«31» src=«ref-2_1352900372-603.coolpic» v:shapes="_x0000_i1148">

<img width=«427» height=«35» src=«ref-2_1352900975-795.coolpic» v:shapes="_x0000_i1149">
<img width=«299» height=«44» src=«ref-2_1352901770-661.coolpic» v:shapes="_x0000_i1150">
2. По формуле (1.9.9) значение коэффициента корреляции составило:    продолжение
--PAGE_BREAK--
<img width=«385» height=«45» src=«ref-2_1352902431-1006.coolpic» v:shapes="_x0000_i1151">
Таким образом, результат по всем формулам одинаков и свидетельствует о сильной прямой зависимости между изучаемыми признаками.

В случае наличия нелинейной зависимости между двумя признаками для измерения тесноты связи применяют  теоретическое корреляционное отношение:
<img width=«137» height=«64» src=«ref-2_1352903437-544.coolpic» v:shapes="_x0000_i1152">    (1.9.11)

где  <img width=«20» height=«24» src=«ref-2_1352903981-124.coolpic» v:shapes="_x0000_i1153">  — дисперсия выравненных значений результативного   признака, то есть рассчитанных по уравнению регрессии;

       <img width=«21» height=«24» src=«ref-2_1352882819-124.coolpic» v:shapes="_x0000_i1154">  — дисперсия эмпирических (фактических) значений результативного признака.
Для оценки тесноты связи также рассчитывается коэффициент детерминации:

<img width=«56» height=«51» src=«ref-2_1352880152-230.coolpic» v:shapes="_x0000_i1155">    (1.9.12)
Коэффициент детерминации показывает, какая доля вариации результативного признака объясняется вариацией изучаемого фактора х.
Корреляционное отношение (<img width=«13» height=«17» src=«ref-2_1352904459-88.coolpic» v:shapes="_x0000_i1156">) изменяется в пределах от 0 до 1 (<img width=«52» height=«19» src=«ref-2_1352904547-146.coolpic» v:shapes="_x0000_i1157">)  и анализ степени тесноты связи полностью соответствует линейному коэффициенту корреляции (таблица 1.9.1).

Для измерения тесноты связи при множественной корреляционной зависимости, то есть при исследовании трех и более признаков одновременно, вычисляется множественный и частные коэффициенты корреляции.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков. Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле:
<img width=«227» height=«64» src=«ref-2_1352904693-725.coolpic» v:shapes="_x0000_i1158">    (1.9.13)
где <img width=«25» height=«27» src=«ref-2_1352905418-136.coolpic» v:shapes="_x0000_i1159">  — парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: <img width=«53» height=«19» src=«ref-2_1352905554-144.coolpic» v:shapes="_x0000_i1160">.

Приближение R к единице свидетельствует о сильной зависимости между признаками.

Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками x<img width=«8» height=«13» src=«ref-2_1352896877-94.coolpic» v:shapes="_x0000_i1161"> и x<img width=«9» height=«20» src=«ref-2_1352905792-98.coolpic» v:shapes="_x0000_i1162"> при фиксированном значении других (k − 2) факторных признаков, то есть когда влияние x<img width=«8» height=«20» src=«ref-2_1352905890-98.coolpic» v:shapes="_x0000_i1163"> исключается, то есть оценивается связь между x<img width=«8» height=«13» src=«ref-2_1352896877-94.coolpic» v:shapes="_x0000_i1164"> и x<img width=«9» height=«20» src=«ref-2_1352905792-98.coolpic» v:shapes="_x0000_i1165"> в «чистом виде».

В случае зависимости y от двух факторных признаков x<img width=«8» height=«13» src=«ref-2_1352896877-94.coolpic» v:shapes="_x0000_i1166"> и x<img width=«9» height=«20» src=«ref-2_1352905792-98.coolpic» v:shapes="_x0000_i1167"> коэффициенты частной корреляции имеют вид:
<img width=«192» height=«71» src=«ref-2_1352906372-748.coolpic» v:shapes="_x0000_i1168">

                                                                                                   (1.9.14)               

<img width=«191» height=«71» src=«ref-2_1352907120-758.coolpic» v:shapes="_x0000_i1169">
где   r — парные коэффициенты корреляции между указанными в индексе переменными.
В первом случае исключено влияние факторного признака x<img width=«9» height=«20» src=«ref-2_1352905792-98.coolpic» v:shapes="_x0000_i1170">, во втором — x<img width=«8» height=«13» src=«ref-2_1352896877-94.coolpic» v:shapes="_x0000_i1171">. Эти показатели могут быть и отрицательными, так как они показывают, какая существует связь между признаками: прямая или обратная.
1.9.5    Принятие решений на основе уравнений регрессии

Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к которой относится исследуемое явление. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков.

Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый.

 Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается.

Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он имеет знак минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь в виду, что когда рассматривается совокупное влияние факторов, то в силу наличия взаимосвязей между ними характер их влияния может меняться.

С целью расширения возможностей экономического анализа, используются частные коэффициенты эластичности, определяемые по формуле:

<img width=«72» height=«40» src=«ref-2_1352908070-265.coolpic» v:shapes="_x0000_i1172">    (1.9.15)

где <img width=«15» height=«20» src=«ref-2_1352908335-114.coolpic» v:shapes="_x0000_i1173"> — среднее значение соответствующего факторного признака;

      <img width=«13» height=«19» src=«ref-2_1352893556-90.coolpic» v:shapes="_x0000_i1174"> — среднее значение результативного признака;

      <img width=«15» height=«20» src=«ref-2_1352908539-112.coolpic» v:shapes="_x0000_i1175">  — коэффициент регрессии при соответствующем факторном признаке.
Коэффициент эластичности показывает на сколько процентов в среднем изменится значение результативного признака при изменении соответствующего факторного признака на 1%, при исключении влияния других факторов, учтенных в модели.

Частный коэффициент детерминации:
<img width=«84» height=«24» src=«ref-2_1352908651-221.coolpic» v:shapes="_x0000_i1176">    (1.9.16)
где <img width=«23» height=«23» src=«ref-2_1352908872-127.coolpic» v:shapes="_x0000_i1177"> — парный коэффициент корреляции между результативным и i-ым факторным признаком;

       <img width=«23» height=«24» src=«ref-2_1352908999-136.coolpic» v:shapes="_x0000_i1178"> — соответствующий стандартизованный коэффициент уравнения множественной регрессии:

<img width=«84» height=«52» src=«ref-2_1352909135-313.coolpic» v:shapes="_x0000_i1179">    (1.9.17)

Частный коэффициент детерминации показывает на сколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии.

Наиболее полная экономическая интерпретация моделей регрессии позволяет выявить резервы развития и повышения деловой активности субъектов экономики.
1.9.6    Методы изучения связи качественных признаков

При наличии соотношения между вариацией качественных признаков говорят об их ассоциации, взаимосвязанности. Для оценки связи в этом случае используют ряд показателей.

Коэффициент ассоциации и контингенции. Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции.

Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, то есть состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой).

Таблица 1.9.5

Таблица для вычисления коэффициентов

ассоциации и контингенции

Коэффициенты вычисляются по формулам:
ассоциации:  
<img width=«79» height=«35» src=«ref-2_1352909448-239.coolpic» v:shapes="_x0000_i1180">
    (1.9.18)
контингенции: <img width=«211» height=«41» src=«ref-2_1352909687-505.coolpic» v:shapes="_x0000_i1181">    (1.9.19)
Причем, всегда коэффициент контингенции меньше коэффициента ассоциации (<img width=«21» height=«20» src=«ref-2_1352910192-102.coolpic» v:shapes="_x0000_i1182">><img width=«21» height=«20» src=«ref-2_1352910294-101.coolpic» v:shapes="_x0000_i1183">).

Связь считается подтвержденной, если <img width=«21» height=«20» src=«ref-2_1352910192-102.coolpic» v:shapes="_x0000_i1184"> <img width=«12» height=«15» src=«ref-2_1352910497-86.coolpic» v:shapes="_x0000_i1185"> 0,5 или <img width=«21» height=«20» src=«ref-2_1352910294-101.coolpic» v:shapes="_x0000_i1186"> <img width=«12» height=«15» src=«ref-2_1352910497-86.coolpic» v:shapes="_x0000_i1187"> 0,3.

Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона и Чупрова. Эти коэффициенты вычисляются по следующим формулам:

коэффициент Пирсона: <img width=«83» height=«44» src=«ref-2_1352910770-346.coolpic» v:shapes="_x0000_i1188">
 
                   (1.9.20);
коэффициент Чупрова: <img width=«141» height=«49» src=«ref-2_1352911116-489.coolpic» v:shapes="_x0000_i1189">    (1.9.21)


где  <img width=«19» height=«21» src=«ref-2_1352911605-125.coolpic» v:shapes="_x0000_i1190">
  —
показатель взаимной сопряженности;

 
<img width=«13» height=«16» src=«ref-2_1352911730-88.coolpic» v:shapes="_x0000_i1191">
  —
определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот, соответствующего столбца и строки. Вычитая из этой суммы «1», получим величину <img width=«19» height=«21» src=«ref-2_1352911605-125.coolpic» v:shapes="_x0000_i1192">: <img width=«100» height=«44» src=«ref-2_1352911943-383.coolpic» v:shapes="_x0000_i1193">;   

 K<img width=«8» height=«13» src=«ref-2_1352896877-94.coolpic» v:shapes="_x0000_i1194">  — число значений (групп) первого признака;

 K<img width=«9» height=«20» src=«ref-2_1352905792-98.coolpic» v:shapes="_x0000_i1195">  — число значений (групп) второго признака.
Чем ближе величина коэффициента Пирсона и коэффициента Чупрова к 1, тем теснее связь.

Таблица 1.9.7

Вспомогательная таблица для расчета коэффициента

взаимной сопряженности


<img width=«160» height=«65» src=«ref-2_1352913183-504.coolpic» v:shapes="_x0000_i1203">
  
(1.9.22)


Ранговые коэффициенты связи

Исследуя экономику, необходимо считаться с взаимосвязью наблюдаемых показателей и величин. При этом полнота описания, так или иначе, определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенной из них, а также воздействия одних факторов на другие является одной из основных задач статистики. Формы проявления взаимосвязей разнообразны. Одна из основных форм корреляционная (неполная, статистическая) связь.

Задачи корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Ранжирование— упорядочение единиц совокупности по значению признака.

При ранжировании каждой единице совокупности присваивается ранг.
 Ранг— это  порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической из соответствующих номеров мест, которые определяют. Данные ранги называются связными.

Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена (<img width=«29» height=«29» src=«ref-2_1352913687-129.coolpic» v:shapes="_x0000_i1204">) и Кендалла (τ). Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле:

<img width=«107» height=«40» src=«ref-2_1352913816-425.coolpic» v:shapes="_x0000_i1205">
  
(1.9.23)
          
d
разность рангов признаков Х и Y;

          
n

число наблюдаемых единиц.
В случае отсутствия связи  <img width=«29» height=«29» src=«ref-2_1352913687-129.coolpic» v:shapes="_x0000_i1206">=0.  При прямой связи коэффициент <img width=«29» height=«29» src=«ref-2_1352913687-129.coolpic» v:shapes="_x0000_i1207">  — положительная дробь, при обратной – отрицательная.
Коэффициент Спирмена принимает любые значения в интервале [−1; 1] .

Сущность метода Спирменасостоит в следующем:

1) располагают варианты факторного признака по возрастанию — ранжируют единицы по значению признака y;

2) для каждой единицы совокупности указывают ранг с точки зрения результативного признака y.

Если связь между признаками прямая, то с увеличением ранга признака xранг признака yтакже будет возрастать; при тесной связи ранги признаков xи yв основном совпадут. При обратной связи возрастанию рангов признака xбудет, как правило, соответствовать убывание рангов признака y. В случае отсутствия связи последовательность рангов признака yне будет обнаруживать никакого порядка возрастания или убывания.

Ранговый коэффициент корреляции Кендалла (τ) также может использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты и ранжированные по одному принципу. Расчет рангового коэффициента Кендалла осуществляется по формуле:
<img width=«67» height=«39» src=«ref-2_1352914499-213.coolpic» v:shapes="_x0000_i1208">    (1.9.24)
   где n — число наблюдений;

     S — сумма разностей между числом последовательностей и числом   инверсий по второму признаку.


Расчет данного коэффициентавыполняется в следующей последовательности:

1. Значения x
ранжируются в порядке возрастания или убывания;

2. Значения y
располагаются в порядке, соответствующем значениям x;
3. Для каждого ранга y
определяется число следующих за ним значений рангов, превышающих его величину. Суммируя, таким образом, числа определяется величина P, как мера соответствия последовательностей рангов по x
и y
и учитывается со знаком (+);

4. Для каждого ранга y
определяется число следующих за ним значений рангов, меньших его величины. Суммарная величина обозначается через Q и фиксируется со знаком (-);

5. Определяется сумма баллов по всем членам ряда.

Как правило, коэффициент Кендалла меньше коэффициента Спирмена. При достаточно большом объеме совокупности значения данных коэффициентов имеют следующую зависимость:

<img width=«63» height=«40» src=«ref-2_1352914712-199.coolpic» v:shapes="_x0000_i1209">

Связь между признаками признается статистически значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла больше 0,5.

Статистическое изучение динамики социально-

экономических явлений

1.10. 1     Понятие рядов динамики и их классификация

Среди основных задач статистики важное место занимает описание изменений показателей во времени, изучение процесса развития, динамики социально-экономических явлений. Для отображения динамики строят ряды динамики (хронологические, временные).

Ряд динамики(или динамический ряд) представляет собой ряд расположенных в хронологическом порядке числовых значений статистического показателя, характеризующих изменение общественных явлений во времени.

Составными элементами ряда динамики являются показатели уровней ряда — «y» и показатели времени (годы, кварталы, месяцы, сутки) или моменты (даты) времени — «t».

Построение и анализ рядов динамики позволяют выявить и измерить закономерности развития общественных явлений во времени. Эти закономерности не проявляются четко на каждом конкретном уровне, а лишь в тенденции, в достаточно длительной динамике. На основную закономерность динамики накладываются другие, прежде всего случайные, иногда сезонные влияния. Выявление основной тенденции в изменении уровней, именуемой трендом, является одной из главных задач анализа рядов динамики.
Классификация рядов динамики:


       1) В зависимости от характера временного параметра ряды делятся на:
§         моментныехарактеризуют значения показателя по состоянию на определенные моменты времени (см. табл. 1.10.1);

§         интервальныеряды динамики характеризуют значение показателя за определенные интервалы (периоды) времени (см. табл. 1.10.2).
Таблица 1.10.1
    продолжение
--PAGE_BREAK--
Число общеобразовательных учреждений в Белгородской области

(на начало учебного года)



// Белгородская область в цифрах в 2004 году. Крат. стат. сб./ Белгородстат. – 2005, с. 77
Таблица 1.10.2

Инвестиции в основной капитал, направленные на охрану и рациональное использование земель



// Белгородская область в цифрах в 2004 году. Крат. стат. сб./ Белгородстат. – 2005, с. 32
Из различного характера интервальных и моментных рядов динамики вытекают некоторые особенности уровней соответствующих рядов.

Уровни интервального ряда динамики абсолютных величин характеризуют собой суммарный итог какого-либо явления за определенный отрезок времени. Они зависят от продолжительности этого периода времени и поэтому их можно суммировать, как не содержащие повторного счета.

Отдельные же уровни моментного ряда динамики абсолютных величин содержат элементы повторного счета и это делает бессмысленным суммирование уровней рядов динамики.

        2)В зависимости от содержания уровней ряды динамики подразделяются на:

§         динамические ряды абсолютных показателей;

§         динамические ряды относительных показателей;

§         динамические рядысредних показателей.

Так, в рассмотренных рядах динамики (табл. 1.10.1 и 1.10.2) уровни выражены абсолютными показателями. Средними показателями могут выражаться уровни, характеризующие динамику средней заработной платы работников предприятия, динамику урожайности винограда и т.д. Относительными показателями характеризуются, например, динамика доли городского и сельского населения (%) и уровня безработицы.

        3) В зависимости от расстояния между уровнями, ряды динамики подразделяются на:

§         динамические ряды с равноотстоящими уровнями;

§         динамические ряды снеравноотстоящими уровнями.

Например, ранее приведенные данные о числе общеобразовательных учреждений в Белгородской области за 2000 – 2005 гг. представляют собой ряд динамики с равностоящими уровнями, так как представлены через равные, следующие друг за другом интервалы времени. Если же в рядах даются прерывающиеся периоды или неравномерные интервалы времени, то ряды называются неравноотстоящими (см. пример в таблице 1.10.2).

        4) В зависимости от наличия основной тенденции изучаемого процесса ряды динамики подразделяются на:

§         стационарные ряды динамики;

§         нестационарные ряды динамики.

Важнейшим условием правильного построения ряда динамики являются сопоставимость всех входящих в него уровней; данное условие решается либо в процессе сбора и обработки данных, либо путем их пересчета.

Для того, чтобы привести уровни ряда динамики к сопоставимому виду, иногда приходится прибегать к приему, который носит название смыкания рядов динамики.

Под смыканием понимают объединение в один ряд (более длинный) двух или нескольких рядов динамики, уровни которых исчислены по разной методологии или в разных территориальных границах. Для осуществления смыкания необходимо, чтобы для одного из периодов (переходного) имелись данные, исчисленные по разной методологии (или в разных границах).

Та же проблема приведения к сопоставимому виду возникает и при параллельном анализе развития во времени экономических показателей отдельных стран, административных и территориальных районов.

Это, во-первых, вопрос о сопоставимости цен сравниваемых стран, во-вторых, вопрос о сопоставимости методики расчета сравниваемых показателей. В таких случаях ряды динамики приводятся к одному основанию, то есть к одному и тому же периоду или моменту времени, уровень которого принимается за базу сравнения, а все остальные уровни выражаются в виде коэффициентов или в процентах по отношению к нему.



1.10. 2      Аналитические показатели изменения уровней

 ряда динамики

При изучении динамики общественных явлений возникает проблема описания интенсивности изменения и расчета средних показателей динамики.

Анализ скорости и интенсивности развития явления во времени осуществляется с помощью статистических показателей, которые получаются в результате сравнения уровней между собой. К таким показателям относятся: абсолютный прирост, темп роста и прироста, абсолютное значение одного процента прироста (см. табл. 1.10.3). При этом принято сравниваемый уровень называть отчетным, а уровень, с которым происходит сравнение — базисным.
Таблица 1.10.3

Аналитические показатели изменения уровней ряда



Для иллюстрации расчетов статистических показателей, представленных в таблице 1.10.3, рассмотрим динамический ряд производства цемента в экономическом регионе за 1991 – 2002 гг. (табл. 1.10.4.).

Абсолютный прирост (<img width=«21» height=«24» src=«ref-2_1352917901-106.coolpic» v:shapes="_x0000_i1222">)-это разность между последующим уровнем ряда и предыдущим (или  базисным). Если разность между последующим и предыдущим, то это цепной абсолютный прирост:
<img width=«77» height=«24» src=«ref-2_1352918007-235.coolpic» v:shapes="_x0000_i1223">
  
(1.10.1)

если между последующим и базисным, то базисный:
 
<img width=«73» height=«24» src=«ref-2_1352915158-230.coolpic» v:shapes="_x0000_i1224">
  
(1.10.2)

Подставив значения выпуска цемента из графы 1 (табл. 1.10.4) в формулу (1.10.1), получим абсолютные цепные приросты (графа 2 табл. 1.10.4), в формулу (1.10.2) — базисные приросты (графа 3 табл.1.10.4).
Средний абсолютный приростисчисляется двумя способами:
1) как средняя арифметическая простая годовых цепных приростов:

<img width=«64» height=«44» src=«ref-2_1352915388-204.coolpic» v:shapes="_x0000_i1225">   (1.10.3)
Подставив в формулу (1.10.3) значения из графы 2 (табл. 1.10.4) в числитель и n=11 (количество сравниваемых лет или  число  периодов) в знаменатель, получим:
2) как отношение базисного прироста к числу периодов:
<img width=«73» height=«44» src=«ref-2_1352915592-270.coolpic» v:shapes="_x0000_i1226">    (1.10.4)

Цепной темп роста— это отношение последующего уровня к предыдущему, умноженному на 100%, если исчисление идет в процентах, как в нашем случае:                  

<img width=«83» height=«45» src=«ref-2_1352918946-298.coolpic» v:shapes="_x0000_i1227">     (1.10.5)
Подставив в формулу (1.10.5) соответствующие  данные графы 1 табл.1.10.4, получим значения цепного темпа роста, см. графу 4 табл. 1.10.4.

Базисный темп роста— это  отношение каждого последующего уровня к одному уровню, принятому за базу сравнения:
<img width=«76» height=«45» src=«ref-2_1352919244-290.coolpic» v:shapes="_x0000_i1228">     (1.10.6)
Подставив в формулу (1.10.6) те же данные, что и в предыдущую, получим значения базисного темпа роста, см. графу 5 табл.1.10.4.

Следует отметить, что  между цепными и базисными темпами роста есть взаимосвязь. Зная базисные темпы, можно исчислить цепные делением каждого последующего базисного темпа на предыдущий.
Средний темп ростаисчисляется по формуле средней геометрической из цепных коэффициентов роста:
<img width=«113» height=«28» src=«ref-2_1352919534-309.coolpic» v:shapes="_x0000_i1229">   (1.10.7)
Для этого показатели графы 4, выраженные в процентах, переведем в коэффициенты, подставив в формулу (1.10.7), получим:
<img width=«395» height=«31» src=«ref-2_1352919843-641.coolpic» v:shapes="_x0000_i1230">

Средний темп ростаможет быть исчислен вторым способом, исходя из конечного и начального уровней  по формуле:
<img width=«279» height=«51» src=«ref-2_1352920484-760.coolpic» v:shapes="_x0000_i1231">

Из этого расчета можно сделать вывод, что среднегодовой темп роста составил за 1991-<metricconverter productid=«2002 г» w:st=«on»>2002 г. — 100,75%.
 Наряду с темпом роста можно рассчитать показатель темпа прироста, характеризующий относительную скорость изменения уровня ряда в единицу времени. Темп прироста показывает, на какую долю (или процент) уровень данного периода или момента времени больше (или меньше) базисного уровня.

Темп прироста есть отношение абсолютного прироста к уровню ряда, принятого за базу. Темп прироста – величина положительная, если сравниваемый уровень больше базисного, и наоборот.

Определяется как разность между темпами роста и 100%, если темпы роста выражены в процентах:
                                   цепной — <img width=«87» height=«25» src=«ref-2_1352921244-223.coolpic» v:shapes="_x0000_i1232">     (1.10.8)

                            

                              базисный — <img width=«91» height=«24» src=«ref-2_1352921467-230.coolpic» v:shapes="_x0000_i1233">     (1.10.9)

Для определения темпа прироста цепного берем разность между темпом роста цепным (графа 4 табл. 1.10.4) и ста процентами, для базисного — между темпом роста базисным (графа 5 табл. 1.10.4) и ста процентами.

Подставив все соответствующие данные в формулы (1.10.8 и 1.10.9), получим значения темпов прироста цепных (графа 6 табл. 1.10.4) и базисных (графа 7 табл. 1.10.4).

Среднегодовой темп приростаисчисляется подобно темпу прироста по формуле:

<img width=«209» height=«29» src=«ref-2_1352921697-369.coolpic» v:shapes="_x0000_i1234">

Таким образом, производство цемента за исследуемые годы увеличивалось в среднем за год на 0,75%.

В статистической практике часто вместо расчета и анализа темпов роста и прироста рассматривают абсолютное значение одного процента прироста. Оно представляет собой одну сотую часть базисного уровня и в то же время — отношение абсолютного прироста к соответствующему темпу прироста:

<img width=«56» height=«37» src=«ref-2_1352917652-249.coolpic» v:shapes="_x0000_i1235">     (1.10.10)

Подставив данные графы 1 за предыдущий год, деленные на 100% (1942:100=19,4) в формулу (1.10.10), получим абсолютное значение 1% прироста (см. графу 8 табл. 1.10.4).

Средний уровень ряда динамики (<img width=«13» height=«19» src=«ref-2_1352893556-90.coolpic» v:shapes="_x0000_i1236">) рассчитывается по средней хронологической. Средней хронологической называется средняя, исчисленная из значений, изменяющихся во времени. Такие средние обобщают хронологическую вариацию. В хронологической средней отражается совокупность тех условий, в которых развивалось изучаемое явление в данном промежутке времени.

Методы расчета среднего уровня интервального и моментного рядов динамики различны. Для интервальных равноотстоящих рядов средний уровень находится по формуле средней арифметической простой и для неравноотстоящих рядов по средней арифметической взвешенной:
 
<img width=«53» height=«37» src=«ref-2_1352922405-202.coolpic» v:shapes="_x0000_i1237">
    (1.10.11)
<img width=«61» height=«43» src=«ref-2_1352922607-248.coolpic» v:shapes="_x0000_i1238">    (1.10.11)

где  <img width=«16» height=«20» src=«ref-2_1352922855-116.coolpic» v:shapes="_x0000_i1239">  — уровень ряда динамики;

          
n
— число уровней;

       <img width=«11» height=«20» src=«ref-2_1352922971-110.coolpic» v:shapes="_x0000_i1240"> — длительность интервала времени между уровнями.
Так, в таблице 1.10.4 приведен интервальный ряд динамики с равноотстоящими уровнями. По этим данным можно рассчитать среднегодовой уровень производства цемента за 1991-2002 гг. Он будет равен:

<img width=«163» height=«36» src=«ref-2_1352923081-339.coolpic» v:shapes="_x0000_i1241">
Средний уровень моментного ряда динамики так исчислить нельзя, так как отдельные уровни содержат элементы повторного счета.

Средний уровень моментного равноотстоящего ряда динамики находится по формуле средней хронологической:
<img width=«179» height=«37» src=«ref-2_1352923420-462.coolpic» v:shapes="_x0000_i1242">    (1.10.12)

Средний уровень моментных рядов динамики с неравноотстоящими уровнями определяется по формуле средней хронологической взвешенной:
      
<img width=«331» height=«40» src=«ref-2_1352923882-820.coolpic» v:shapes="_x0000_i1243">
    (1.10.13)

  

где <img width=«16» height=«20» src=«ref-2_1352922855-116.coolpic» v:shapes="_x0000_i1244">, <img width=«17» height=«20» src=«ref-2_1352924818-116.coolpic» v:shapes="_x0000_i1245">   — уровни ряда динамики;

               <img width=«11» height=«20» src=«ref-2_1352922971-110.coolpic» v:shapes="_x0000_i1246"> — длительность интервала времени между уровнями.

Методы выравнивания рядов динамики

Важной задачей статистики при анализе рядов динамики является определение основной тенденции развития, присущей тому или иному ряду динамики. Например, за колебаниями урожайности какой-либо сельскохозяйственной культуры в отдельные годы тенденция роста (уменьшения) урожайности может не просматриваться непосредственно, и поэтому должна быть выявлена статистическими методами.

Методы анализа основной тенденции в рядах динамики разделяются на две основные группы:

1) сглаживание или механическое выравнивание отдельных членов ряда динамики с использованием фактических значений соседних уровней;

2) выравнивание с применением кривой, проведенной между конкретными уровнями таким образом, чтобы она отображала тенденцию, присущую ряду и одновременно освободила его от незначительных колебаний.

Рассмотрим методы каждой группы.

Метод укрупнения интервалов. Если рассматривать уровни экономических показателей за короткие промежутки времени, то в силу влияния различных факторов, действующих в разных направлениях, в рядах динамики наблюдается снижение и повышение этих уровней. Это мешает видеть основную тенденцию развития изучаемого явления. В этом случае для наглядного представления тренда применяется метод укрупнения интервалов, который основан на укрупнении периодов времени, к которым относятся уровни ряда. Например, ряд ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т.д.

Метод простой скользящей средней. Сглаживание ряда динамики с помощью скользящей средней заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем средний уровень из такого же числа уровней, начиная со второго, далее — начиная с третьего и т.д. Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень вначале и добавляя один следующий. Отсюда название — скользящая средняя.

Сглаженный ряд урожайности по трехлетиям короче фактического на один член ряда в начале и в конце, по пятилетиям – на два в начале и в конце ряда. Он меньше, чем фактический подвержен колебаниям из-за случайных причин, и четче выражает основную тенденцию роста урожайности за изучаемый период, связанную с действием долговременно существующих причин и условий развития

Недостаток метода простой скользящей средней состоит в том, что сглаженный ряд динамики сокращается ввиду невозможности получить сглаженные уровни для начала и конца ряда. Этот недостаток устраняется применением метода аналитического выравнивания для анализа основной тенденции.
Аналитическое выравнивание предполагает представление уровней данного ряда динамики в виде функции времени — y<img width=«8» height=«19» src=«ref-2_1352925044-77.coolpic» v:shapes="_x0000_i1247">=f(t).

Для отображения основной тенденции развития явлений во времени применяются различные функции: полиномы степени, экспоненты, логистические кривые и другие виды. Полиномы имеют следующий вид:
полином первой степени:         <img width=«73» height=«20» src=«ref-2_1352925121-224.coolpic» v:shapes="_x0000_i1248"> 

полином второй степени:         <img width=«107» height=«23» src=«ref-2_1352925345-296.coolpic» v:shapes="_x0000_i1249"> 

полином третьей степени:        <img width=«141» height=«23» src=«ref-2_1352925641-355.coolpic» v:shapes="_x0000_i1250">

полином n-ой степени:             <img width=«163» height=«23» src=«ref-2_1352925996-366.coolpic» v:shapes="_x0000_i1251">
Здесь <img width=«44» height=«23» src=«ref-2_1352926362-185.coolpic» v:shapes="_x0000_i1252"><img width=«16» height=«20» src=«ref-2_1352895700-118.coolpic» v:shapes="_x0000_i1253">,...<img width=«16» height=«20» src=«ref-2_1352926665-115.coolpic» v:shapes="_x0000_i1254">— параметры полиномов, t — условное обозначение времени. В статистической практике параметры полиномов невысокой степени иногда имеют конкретную интерпретацию характеристик динамического ряда. Так, параметр <img width=«16» height=«20» src=«ref-2_1352926780-147.coolpic» v:shapes="_x0000_i1255"> трактуется как характеристика средних условий ряда динамики, параметры <img width=«15» height=«20» src=«ref-2_1352926927-113.coolpic» v:shapes="_x0000_i1256">, <img width=«16» height=«20» src=«ref-2_1352895700-118.coolpic» v:shapes="_x0000_i1257">,  <img width=«16» height=«20» src=«ref-2_1352927158-117.coolpic» v:shapes="_x0000_i1258"> — как изменения ускорения.

В статистике выработано правило выбора степени полинома модели развития, основанное на определении величин конечных разностей уровней динамических рядов. Согласно этому правилу полином первой степени (прямая) применяется как модель такого ряда динамики, у которого первые разности (абсолютные приросты) постоянны, полиномы второй степени — для отражения ряда динамики с постоянными вторыми разностями (ускорениями), полиномы третьей степени — с постоянными третьими разностями и т.д.

Рассмотрим «технику» выравнивания ряда динамики по прямой (полином первой степени): <img width=«73» height=«20» src=«ref-2_1352925121-224.coolpic» v:shapes="_x0000_i1259">. Параметры <img width=«44» height=«23» src=«ref-2_1352926362-185.coolpic» v:shapes="_x0000_i1260"> согласно методу наименьших квадратов находятся решением следующей системы нормальных уравнений:     продолжение
--PAGE_BREAK--
<img width=«129» height=«44» src=«ref-2_1352927684-498.coolpic» v:shapes="_x0000_i1261">     (1.10.14)
где у – фактические (эмпирические) уровни ряда;

       t
– время (порядковый номер периода или момента времени).
Расчет параметров значительно упрощается, если за начало отсчета времени   (t=0) принять центральный интервал (момент).
При четном числе уровней значения t– условного обозначения времени будут такими:

…-5, -3, -1, +1, +3, +5,…
При нечетном числе уровней значения устанавливаются по-другому:

…-3, -2, -1, 0, +1, +2, +3, …
В обоих случаях <img width=«21» height=«19» src=«ref-2_1352928182-100.coolpic» v:shapes="_x0000_i1262">=0, так что система нормальных уравнений (1.10.14) принимает вид:

<img width=«85» height=«44» src=«ref-2_1352928282-382.coolpic» v:shapes="_x0000_i1263">
 
   (1.10.15)

Из первого уравнения <img width=«55» height=«37» src=«ref-2_1352928664-229.coolpic» v:shapes="_x0000_i1264">    (1.10.16),

                 из второго — <img width=«57» height=«44» src=«ref-2_1352928893-257.coolpic» v:shapes="_x0000_i1265">    (1.10.17).

Проиллюстрируем на примере динамического ряда производства цемента в экономическом регионе за 1991 – 2002 гг. (см. табл. 1.10.4, расчетные значения – табл. 1.10.6) выравнивание ряда динамики по прямой. Для выравнивания данного ряда используем линейную трендовую модель – уравнение прямой: <img width=«73» height=«20» src=«ref-2_1352925121-224.coolpic» v:shapes="_x0000_i1266">. В нашем примере n= 12 – четное число. Для упрощения расчетов обозначим время так, чтобы начало его отсчета приходилось на середину рассматриваемого периода.

Методы выявления сезонной компоненты

При рассмотрении квартальных или месячных данных многих социально-экономических явлений часто обнаруживаются определенные, постоянно повторяющиеся колебания, которые существенно не изменяются за длительный период времени. Они являются результатом влияния природно-климатических условий, общих экономических факторов, а также ряда многочисленных разнообразных факторов, которые частично являются регулируемыми. В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название «сезонных колебаний» или «сезонных волн», а динамический ряд в этом случае называют тренд-сезонным, или просто сезонным рядом динамики.

Сезонные колебания характеризуются специальным показателями, которые называются индексами сезонности (<img width=«17» height=«21» src=«ref-2_1352929374-97.coolpic» v:shapes="_x0000_i1267">). Совокупность этих показателей отражает сезонную волну. Индексами сезонности являются процентные отношения фактических внутригодовых уровней к постоянной или переменной средней.

Для выявления сезонных колебаний обычно берут данные за несколько лет, распределенные по месяцам. Данные за несколько лет (обычно не менее трех) берутся для того, чтобы выявить устойчивую сезонную волну, на которой не отражались бы случайные условия одного года.

Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их предварительного выравнивания.

Для каждого месяца рассчитывается средняя величина уровня, например, за три года (<img width=«16» height=«20» src=«ref-2_1352929471-118.coolpic» v:shapes="_x0000_i1268">), затем из них рассчитывается среднемесячный уровень для всего ряда (<img width=«13» height=«19» src=«ref-2_1352893556-90.coolpic» v:shapes="_x0000_i1269">) и в заключение определяется процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда, то есть:

<img width=«96» height=«40» src=«ref-2_1352929679-274.coolpic» v:shapes="_x0000_i1270">     (1.10.18)
Если же ряд динамики содержит определенную тенденцию в развитии, то прежде чем вычислить сезонную волну, фактические данные должны быть обработаны так, чтобы была выявлена общая тенденция.

Обычно для этого прибегают к аналитическому выравниванию ряда динамики.

При использовании способа аналитического выравниванияход вычислений индексов сезонности следующий:

§         по соответствующему полиному вычисляются для каждого месяца (квартала) выровненные уровни на момент времени (t);

§         вычисляются отношения фактических месячных (квартальных) данных (<img width=«16» height=«20» src=«ref-2_1352922855-116.coolpic» v:shapes="_x0000_i1271">) к соответствующим выровненным данным (<img width=«19» height=«23» src=«ref-2_1352930069-123.coolpic» v:shapes="_x0000_i1272">): <img width=«96» height=«40» src=«ref-2_1352930192-265.coolpic» v:shapes="_x0000_i1273">;

§         находятся средние арифметические из процентных соотношений, рассчитанных по одноименным периодам в процентах  <img width=«163» height=«24» src=«ref-2_1352930457-404.coolpic» v:shapes="_x0000_i1274">, где n– число одноименных периодов.

В общем виде формулу расчета индекса сезонности данным способом можно записать так:
<img width=«99» height=«40» src=«ref-2_1352930861-284.coolpic» v:shapes="_x0000_i1275">    (1.10.19)
Расчет заканчивается проверкой правильности вычислений индексов, так как средний индекс сезонности для всех месяцев (кварталов) должен быть 100 процентов, то сумма полученных индексов по месячным данным равна 1200, а сумма по четырем кварталам — 400.
1.10.5      
    Элементы прогнозирования. Интерполяция и


экстраполяция в рядах динамики

Необходимым условием регулирования рыночных отношений является составление надежных прогнозов развития социально–экономических явлений.

 Важное место в системе методов прогнозирования занимают статистические методы. Применение прогнозирования предполагает, что закономерность развития, действующая в прошлом (внутри ряда динамики), сохранится и в прогнозируемом будущем, то есть прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называется перспективой и в прошлое — ретроспективой. Обычно, говоря об экстраполяции рядов динамики, подразумевает чаще всего перспективную экстраполяцию.

Применение экстраполяции в прогнозированиибазируется на следующих предпосылках:

§         развитие исследуемого явления в целом описывается плавной кривой;

§         общая тенденция развития явления в прошлом и настоящем не претерпет серьезных изменений в будущем.

Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения, а также как точно удастся охарактеризовать выявленную в прошлом закономерность. Экстраполяцию следует рассматривать как начальную стадию построения окончательных прогнозов.

В зависимости от того, какие принципы и какие исходные данные положены в основу прогноза, можно выделить следующие элементарные методы экстраполяции: среднего абсолютного прироста, среднего темпа роста и экстраполяция на основе выравнивания рядов по какой-либо аналитической формуле.

Прогнозирование по среднему абсолютному приросту может быть выполнено в том случае, если есть уверенность считать общую тенденцию линейной, то есть метод основан на предположении о равномерном изменении уровня (под равномерностью понимается стабильность абсолютных приростов).

Для нахождения интересующего нас аналитического выражения тенденции на любую дату t необходимо определить средний абсолютный прирост и последовательно прибавить его к последнему уровню ряда столько раз, на сколько периодов, экстраполируется ряд, то есть экстраполяцию можно сделать по следующей формуле:
<img width=«91» height=«24» src=«ref-2_1352931145-219.coolpic» v:shapes="_x0000_i1276">     (1.10.20)
где   <img width=«27» height=«20» src=«ref-2_1352931364-108.coolpic» v:shapes="_x0000_i1277">  — экстраполируемый уровень, (n
+t
) — номер этого уровня (года);

            
n
— номер последнего уровня (года) исследуемого периода, за который рассчитан  <img width=«16» height=«20» src=«ref-2_1352931472-93.coolpic» v:shapes="_x0000_i1278">;

                t — срок прогноза (период упреждения);

          <img width=«16» height=«20» src=«ref-2_1352931472-93.coolpic» v:shapes="_x0000_i1279">  — средний абсолютный прирост.
Так, по данным табл. 1.10.6, на основе исчисленного ранее уравнения <img width=«108» height=«20» src=«ref-2_1352931658-218.coolpic» v:shapes="_x0000_i1280">
,
экстраполяцией при  t=13 можно определить ожидаемое производство цемента в <metricconverter productid=«2003 г» w:st=«on»>2003 г., млн. т:
<img width=«172» height=«20» src=«ref-2_1352931876-291.coolpic» v:shapes="_x0000_i1281">
Прогнозирование по среднему темпу роста можно осуществлять в случае, когда есть основание считать, что общая тенденция ряда характеризуется показательной (экспоненциальной) кривой. Для нахождения тенденции в этом случае необходимо определить средний коэффициент роста, возведенный в степень, соответствующую периоду экстраполяции, то есть по формуле:

<img width=«80» height=«27» src=«ref-2_1352932167-208.coolpic» v:shapes="_x0000_i1282">     (1.10.21)

где <img width=«16» height=«20» src=«ref-2_1352932375-116.coolpic» v:shapes="_x0000_i1283">  — последний уровень ряда динамики;

          t — срок прогноза;

      <img width=«16» height=«20» src=«ref-2_1352932491-94.coolpic» v:shapes="_x0000_i1284">  — средний коэффициент роста.
Если же ряду динамики свойственна иная закономерность, то данные, полученные при экстраполяции на основе среднего темпа роста, будут отличаться от данных, полученных другими способами экстраполяции.

Рассмотренные способы экстраполяции тренда, будучи простейшими, в то же время являются и самыми приближенными.

Поэтому наиболее распространенным методом прогнозирования является аналитическое выражение тренда. При этом для выхода за границы исследуемого периода достаточно продолжить значения независимой переменной времени (t).

При таком подходе к прогнозированию предполагается, что размер уровня, характеризирующего явление, формируется под воздействием множества факторов, причем не представляется возможным выделить отдельно их влияние. В связи с этим, ход развития связывается не с какими-либо конкретными факторами, а с течением времени, то естьy=f(t). Поэтому целесообразно определение доверительных интервалов прогноза. Величина доверительного интервала определяется следующим образом:

<img width=«81» height=«27» src=«ref-2_1352932585-214.coolpic» v:shapes="_x0000_i1285">     (1.10.22)

                      

                где  <img width=«16» height=«23» src=«ref-2_1352932799-95.coolpic» v:shapes="_x0000_i1286"> — коэффициент доверия по распределению Стьюдента;

  <img width=«125» height=«49» src=«ref-2_1352932894-442.coolpic» v:shapes="_x0000_i1287">  — остаточное среднее квадратическое отклонение от тренда, скорректированное по    числу степеней    свободы (n-m);

                          
n
-
число уровней ряда динамики;

                         
m
— число параметров адекватной модели тренда (для уравнения прямой m=2).
Рассчитаем прогнозируемые доверительные интервалы производства цемента на <metricconverter productid=«2003 г» w:st=«on»>2003 г.

Если  n=12 и m=2, то число степеней свободы равно 10. Тогда при доверительной вероятности, равной 0,95 (то есть при уровне значимости случайностей  <img width=«15» height=«13» src=«ref-2_1352933336-82.coolpic» v:shapes="_x0000_i1288">=0,5), коэффициент доверия  <img width=«16» height=«23» src=«ref-2_1352932799-95.coolpic» v:shapes="_x0000_i1289">=2,306 (по таблице Стьюдента), <img width=«71» height=«25» src=«ref-2_1352933513-219.coolpic» v:shapes="_x0000_i1290">=44719,3648 (см. табл. 1.10.6).
Тогда <img width=«185» height=«49» src=«ref-2_1352933732-471.coolpic» v:shapes="_x0000_i1291">.
Зная точечную оценку прогнозируемого значения производства цемента <img width=«69» height=«20» src=«ref-2_1352934203-163.coolpic» v:shapes="_x0000_i1292">
 
млн. т, определяем вероятностные границы интервала:

 

<img width=«296» height=«20» src=«ref-2_1352934366-554.coolpic» v:shapes="_x0000_i1293">, отсюда
                             <img width=«141» height=«20» src=«ref-2_1352934920-358.coolpic» v:shapes="_x0000_i1294">.
Следовательно, с вероятностью 0,95, можно утверждать, что производство цемента в <metricconverter productid=«2003 г» w:st=«on»>2003 г. не менее чем 2082,49, но и не более чем 2390,91 млн. т.

При анализе рядов динамики иногда приходится прибегать к определению некоторых неизвестных уровней внутри данного ряда динамики, то есть к интерполяции.

Как и экстраполяция, интерполяция может производиться на основе среднего абсолютного прироста, среднего темпа роста, а также с помощью аналитического выравнивания.

Интерполяция также основана на том или ином предположении о тенденции изменения уровней, но здесь уже не приходится предполагать, что тенденция, характерная для прошлого, сохранится и в будущем. При интерполяции предполагается, что ни выявленная тенденция, ни ее характер не претерпели существенных изменений в том промежутке времени, уровень (уровни) которого нам неизвестны.

Экономические индексы

1.11.1     Понятие экономических индексов и их классификация

Индексы относятся к важнейшим обобщающим показателям. «Индекс» в переводе с латинского — указатель или показатель. Он используется как понятие в математике, экономике, в метеорологии и других науках.

В статистике индексом называют относительный показатель, который выражает соотношение величин какого-либо явления во времени, в пространстве или дает сравнение фактических данных с любым эталоном (план, прогноз, норматив и т.д.).

Как относительная величина индекс выражается в форме коэффициента, либо в процентах или промилле. Название индекса отражает его социально-экономическое содержание, а числовое значение – интенсивность изменения или степень отклонения.

Индексы выполняют две функции:

§         синтетическую – используется как обобщающая характеристика изменения явления;

§          аналитическую служит для изучения влияния отдельных факторов на изменение явления.

Большинство индексов выполняет обе функции одновременно.
В целом  индексный метод направленна решение следующих задач:

1) характеристика общего изменения уровня сложного социально-экономического явления;

2) анализ влияния каждого из факторов на изменение индексируемой величины путем элиминирования воздействия прочих факторов;

3) анализ влияния структурных сдвигов на изменение индексируемой величины.
В международной практике индексы принято обозначать символами iи I. Буквой «i» обозначаются индивидуальные (частные) индексы, буквой «I» — общие индексы. Подстрочный знак внизу справа означает период: 0 – базисный; 1 – отчетный.
Используются определенные символы для обозначения индексируемых показателей:

p— цена;

q— количество;

p q– стоимость продукции или товарооборот;

z— себестоимость;

z q– издержки производства;

t– трудоемкость;

t

q
– затраты рабочего времени на производство продукции.
Классификация индексов:

       1. По степени обобщения данных:

§    индивидуальные;

§    сводные (общие);

2. По форме построения:

§    агрегатные;

§    средние: — арифметические;

                     — гармонические;

     3. По отношению ко времени:

§    динамические индексы: — цепные;

                                              — базисные;

§    территориальные;

                  4. По виду весов:

§    индексы с переменными весами;

§    индексы с постоянными весами;

    5. В зависимости от структуры совокупности:

§    индексы переменного состава;

§    индексы постоянного состава.
Простейшим показателем, используемым в индексном анализе, является индивидуальный индекс, который характеризует изменение во времени экономических величин, относящихся к одному объекту:

<img width=«48» height=«40» src=«ref-2_1352935278-232.coolpic» v:shapes="_x0000_i1295">  — индекс цены,   (1.11.1)

где  <img width=«16» height=«20» src=«ref-2_1352935510-117.coolpic» v:shapes="_x0000_i1296">  — цена товара в текущем периоде;

        <img width=«17» height=«20» src=«ref-2_1352935627-150.coolpic» v:shapes="_x0000_i1297">  — цена товара в базисном периоде;

<img width=«45» height=«40» src=«ref-2_1352935777-226.coolpic» v:shapes="_x0000_i1298">
 
— индекс физического объема реализации;   (1.11.2)

                     
<img width=«65» height=«40» src=«ref-2_1352936003-296.coolpic» v:shapes="_x0000_i1299">
 
— индекс товарооборота    (1.11.3)

Агрегатные и средние  индексы

В тех случаях, когда исследуются не единичные объекты, а состоящие из нескольких элементов совокупности, используются сводные индексы. Исходной формой сводного индекса является агрегатная.

Агрегатный индекс– это сложный относительный показатель, служащий для соизмерения явления, составные части которых непосредственно несоизмеримы.

Сводный индекс товарооборота:
<img width=«88» height=«52» src=«ref-2_1352936299-460.coolpic» v:shapes="_x0000_i1300">
  
(1.11.4)
Показывает во сколько раз увеличится или уменьшится товарооборот отчетного периода по сравнению с базисным.

1.11.3      
Индексный анализ взвешенной средней. Индекс


структурных сдвигов

При анализе динамики взвешенной средней используется система индексов, включающая:

1) индекс переменного состава;

2) индекс структурных сдвигов;

3) индекс фиксированного состава.

Сравнением полученных средних значений получают индекс цен переменного состава:
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по маркетингу