Реферат: Анализ временных рядов

Введение

 

В данной главе рассматриваются задачи описания упорядоченных данных,полученных последовательно (во времени). Вообще говоря, упорядоченность можетиметь место не только во времени, но и в пространстве, например, диаметр нитикак функция её длины (одномерный случай), значение температуры воздуха какфункция пространственных координат (трёхмерный случай).

В отличие от регрессионного анализа, где порядок строк в матриценаблюдений может быть произвольным, во временных рядах важна упорядоченность, аследовательно, интерес представляет взаимосвязь значений, относящихся к разныммоментам времени.

Если значения ряда известны в отдельные моменты времени, то такой рядназывают дискретным, в отличие от непрерывного, значения которогоизвестны в любой момент времени. Интервал между двумя последовательнымимоментами времени назовём тактом (шагом). Здесь будутрассматриваться в основном дискретные временные ряды с фиксированнойпротяжённостью такта, принимаемой за единицу счёта. Заметим, что временные рядыэкономических показателей, как правило, дискретны.

Значения ряда могут быть измеряемыми непосредственно (цена,доходность, температура), либо агрегированными (кумулятивными),например, объём выпуска; расстояние, пройдённое грузоперевозчиками за временнойтакт.

Если значения ряда определяются детерминированной математической функцией,то ряд называютдетерминированным. Если эти значения могут быть описанылишь с привлечением вероятностных моделей, то временной ряд называют случайным.

Явление, протекающее во времени, называют процессом, поэтому можноговорить о детерминированном или случайном процессах. В последнем случаеиспользуют часто термин “стохастический процесс”. Анализируемый отрезоквременного ряда может рассматриваться как частная реализация (выборка)изучаемого стохастического процесса, генерируемого скрытым вероятностныммеханизмом.

Временные ряды возникают во многих предметных областях и имеют различнуюприроду. Для их изучения предложены различные методы, что делает теориювременных рядов весьма разветвленной дисциплиной. Так, в зависимости от видавременных рядов можно выделить такие разделы теории анализа временных рядов:

– стационарные случайные процессы, описывающие последовательностислучайных величин, вероятностные свойства которых не изменяются во времени.Подобные процессы широко распространены в радиотехнике, метереологии,сейсмологии и т. д.

– диффузионные процессы, имеющие место при взаимопроникновении жидкостейи газов.

– точечные процессы, описывающие последовательности событий, таких какпоступление заявок на обслуживание, стихийных и техногенных катастроф. Подобныепроцессы изучаются в теории массового обслуживания.

Мы ограничимся рассмотрением прикладных аспектов анализа временных рядов,которые полезны при решении практических задач в экономике, финансах. Основнойупор будет сделан на методы подбора математической модели для описаниявременного ряда и прогнозирования его поведения.


/>/>1.Цели,методы и этапы анализа временных рядов

Практическое изучение временного ряда предполагает выявление свойств рядаи получение выводов о вероятностном механизме, порождающем этот ряд. Основныецели при изучении временного ряда следующие:

– описание характерных особенностей ряда в сжатой форме;

– построение модели временного ряда;

– предсказание будущих значений на основе прошлых наблюдений;

– управление процессом, порождающим временной ряд, путем выборкисигналов, предупреждающих о грядущих неблагоприятных событиях.

Достижение поставленных целей возможно далеко не всегда как из-занедостатка исходных данных (недостаточная длительность наблюдения), так из-заизменчивости со временем статистической структуры ряда.

Перечисленные цели диктуют в значительной мере, последовательность этапованализа временных рядов:

1)  графическое представление и описание поведения ряда;

2)  выделение и исключение закономерных, неслучайныхсоставляющих ряда, зависящих от времени;

3)  исследование случайной составляющей временного ряда,оставшейся после удаления закономерной составляющей;

4)  построение (подбор) математической модели для описанияслучайной составляющей и проверка ее адекватности;

5)  прогнозирование будущих значений ряда.

При анализе временных рядов используются различные методы, наиболеераспространенными из которых являются :

1)  корреляционный анализ, используемый для выявленияхарактерных особенностей ряда (периодичностей, тенденций и т. д.);

2)  спектральный анализ, позволяющий находитьпериодические составляющие временного ряда;

3)  методы сглаживания и фильтрации, предназначенные дляпреобразования временных рядов с целью удаления высокочастотных и сезонныхколебаний;

4)  модели авторегрессии и скользящего среднего дляисследование случайной составляющей временного ряда ;

5)  методы прогнозирования.


/>/>2.Структурныекомпоненты временного ряда

Как уже отмечалось, в модели временного ряда принято выделять двеосновные составляющие: детерминированную и случайную (рис.). Поддетерминированной составляющей временного ряда /> понимают числовуюпоследовательность />, элементы которой вычисляются поопределенному правилу как функция времени t. Исключив детерминированную составляющую из данных,мы получим колеблющийся вокруг нуля ряд, который может в одном предельномслучае представлять чисто случайные скачки, а в другом – плавное колебательноедвижение. В большинстве случаев будет нечто среднее: некоторая иррегулярность иопределенный систематический эффект, обусловленный зависимостьюпоследовательных членов ряда.

В свою очередь, детерминированная составляющая может содержать следующиеструктурные компоненты:

1)  тренд g,представляющий собой плавное изменение процесса во времени и обусловленныйдействием долговременных факторов. В качестве примера таких факторов вэкономике можно назвать: а) изменение демографических характеристик популяции(численности, возрастной структуры); б) технологическое и экономическоеразвитие; в) рост потребления.

2)  сезонный эффект s, связанный с наличием факторов, действующих циклическис заранее известной периодичностью. Ряд в этом случае имеет иерархическую шкалувремени (например, внутри года есть сезоны, связанные с временами года,кварталы, месяцы) и в одноименных точках ряда имеют место сходные эффекты.


/>

Рис. Структурные компоненты временного ряда.

Типичные примеры сезонного эффекта: изменение загруженности автотрассы втечение суток, по дням недели, временам года, пик продаж товаров для школьниковв конце августа — начале сентября. Сезонная компонента со временем можетменяться, либо носить плавающий характер. Так на графике объема перевозокавиалайнерами (см рис.) видно, что локальные пики, приходящиеся на праздникПасхи «плавают» из-за изменчивости ее сроков.

Циклическая компонента c,описывающая длительные периоды относительного подъема и спада и состоящая изциклов переменной длительности и амплитуды. Подобная компонента весьмахарактерна для рядов макроэкономических показателей. Циклические изменения обусловленыздесь взаимодействием спроса и предложения, а также наложением таких факторов,как истощение ресурсов, погодные условия, изменения в налоговой политике и т.п. Отметим, что циклическую компоненту крайне трудно идентифицироватьформальными методами, исходя только из данных изучаемого ряда.

«Взрывная» компонента i,иначе интервенция, под которой понимают существенное кратковременноевоздействие на временной ряд. Примером интервенции могут служить события«черного вторника» 1994г., когда курс доллара за день вырос на несколькодесятков процентов.

Случайная составляющая ряда отражает воздействие многочисленных факторовслучайного характера и может иметь разнообразную структуру, начиная отпростейшей в виде «белого шума» до весьма сложных, описываемых моделямиавторегрессии-скользящего среднего (подробнее дальше).

После выделения структурных компонент необходимо специфицировать форму ихвхождения во временной ряд. На верхнем уровне представления с выделением лишьдетерминированной и случайной составляющих обычно используют аддитивную либомультипликативную модели.

Аддитивная модель имеет вид

/>;

мультипликативная –

/>,

где /> -значение ряда в момент t;

/> -значение детерминированной составляющей;

/>-значение случайной составляющей.

В свою очередь, детерминированная составляющая может быть представленакак аддитивная комбинация детерминированных компонент:

/>,

как мультипликативная комбинация:


/>,

либо как смешанная комбинация, например,

/>


/>/>3.Моделикомпонентов детерминированной составляющей временного ряда/>/>3.1.Модели тренда

Тренд отражает действие постоянных долговременных факторов и носитплавный характер, так что для описания тренда широко используют полиномиальныемодели, линейные по параметрам

/>,

где значения степени k полинома редко превышает 5.

Наряду с полиномиальными моделями экономические данные, описывающиепроцессы роста, часто аппроксимируются следующими моделями:

– экспоненциальной

/>.

Эта модель описывает процесс с постоянным темпом прироста, то есть

/> 

– логистической

/>

У процесса, описываемого логистической кривой, темп прироста изучаемойхарактеристики линейно падает с увеличением y, то есть

/>

– Гомперца

/>.

Эта модель описывает процесс, в котором темп прироста исследуемойхарактеристики пропорционален ее логарифму

/>.

Две последние модели задают кривые тренда S-образной формы,представляя процессы с нарастающим темпом роста в начальной стадии с постепеннымзамедлением в конце.

При подборе подходящей функциональной зависимости, иначе спецификациитренда, весьма полезным является графическое представление временного ряда.

Отметим также, что тренд, отражая действие долговременных факторов,является определяющим при построении долговременных прогнозов.

/>/> 3.2 Модели сезонной компоненты

Сезонный эффект во временном ряде проявляется на «фоне» тренда и еговыделение оказывается возможным после предварительной оценки тренда. (Здесь нерассматриваются методы спектрального анализа, позволяющего выделить вкладсезонной компоненты в спектр без вычисления других компонент ряда).Действительно, линейно растущий ряд помесячных данных будет иметь схожиеэффекты в одноименных точках – наименьшее значение в январе и наибольшее вдекабре; однако вряд ли здесь уместно говорить о сезонном эффекте: исключивлинейный тренд, мы получим ряд, в котором сезонность полностью отсутствует. Вто же время ряд, описывающий помесячные объемы продаж новогодних открыток, хотяи будет иметь такую же особенность (минимум продаж в январе и максимум вдекабре) будет носить скорее всего колебательный характер относительно тренда,что позволяет специфицировать эти колебания как сезонный эффект.

В простейшем случае сезонный эффект может проявляться в виде строгопериодической зависимости.

/>,для любого t, где t — период сезонности.

В общем случае значения, отстоящие на tмогут быть связаны функциональной зависимостью, тоесть

/>.

К примеру, сезонный эффект сам может содержать трендовую составляющую,отражающую изменение амплитуды колебаний .

Если сезонный эффект входит в ряд аддитивно, то />модель сезонного эффекта можнозаписать как

/>,


где /> -булевы, иначе индикаторные, переменные, по одной на каждый такт внутри периода t сезонности. Так, для ряда месячныхданных />=0для всех t, кроме января каждого года, для которого />=1 и так далее.Коэффициент /> при/> показываетотклонение январских значений от тренда, /> — отклонение февральских значенийи так далее до />. Чтобы снять неоднозначность взначениях коэффициентов сезонности />, вводят дополнительноеограничение, так называемое условие репараметризации, обычно

/>.

В том случае, когда сезонный эффект носит мультипликативный характер, тоесть

/>

модель ряда с использованием индикаторных переменных можно записать ввиде

/>

Коэффициенты />, в этой модели принято называтьсезонными индексами.

Для полностью мультипликативного ряда

/>


обычно проводят процедуру линеаризации операцией логарифмирования

/>.

Условимся называть представленные модели сезонного эффекта«индикаторными». Если сезонный эффект достаточно «гладкий» – близок кгармонике, используют «гармоническое» представление

/>,

где d — амплитуда, w — условия частоты (в радианах вединицу времени), a — фаза волны. Поскольку фаза обычно заранее неизвестна. Последнее выражениезаписывают как

/>,

где />,/>.

Параметры А и В можно оценить с помощью обычно регрессии.Угловая частота wсчитаетсяизвестной. Если качество подгонки окажется неудовлетворительным, наряду сгармоникой wосновной волны в модель включаютдополнительно первую гармонику (с удвоенной основной частотой 2w), при необходимости и вторую и такдалее гармоники. В принципе, из двух представлений: индикаторного игармоничного – следует выбирать то, которое потребует меньшего числапараметров.


/>/>3.3 Модель интервенции

Интервенция, представляющая собой воздействие, существенно превышающеефлуктуации ряда, может носить характер «импульса» или «ступеньки».

Импульсное воздействие кратковременно: начавшись, оно почти тут жезаканчивается. Ступенчатое воздействие длительно, носит устойчивый характер.Обобщенная модель интервенции имеет вид

/>,

где />-значение детерминированной компоненты ряда, описываемой как интервенция;

/> -коэффициенты типа авторегрессии;

/> -коэффициенты типа скользящего среднего;

/>-экзогенная переменная одного из двух типов;

/> («ступень»),или /> («импульс»)

где /> --фиксированный момент времени, называемый моментом интервенции.


/>/>4.Методывыделения тренда

Приведенные в п.3.1 спецификации ряда являются параметрическими функциямивремени. Оценивание параметров может быть проведено по методу наименьшихквадратов так же, как в регрессионном анализе. Хотя статистические предпосылкирегрессионного анализа (см п. ) во временных рядах часто не выполняются(особенно п.5 – некоррелированность возмущений), тем не менее оценки трендаоказываются приемлемыми, если модель специфицирована правильно и срединаблюдений нет больших выбросов. Нарушение предпосылок регрессионного анализа сказываетсяне столько на оценках коэффициентов, сколько на их статистических свойствах, вчастности, искажаются оценки дисперсии случайной составляющей и доверительныеинтервалы для коэффициентов модели.

В литературе описываются методы оценивания в условиях коррелированностивозмущений, однако их применение требует дополнительной информации о корреляциинаблюдений.

Главная проблема при выделении тренда состоит в том, что подобрать единуюспецификацию для всего временного часто невозможно, поскольку меняются условияпротекания процесса. Учет этой изменчивости особенно важен, если трендвычисляется для целей прогнозирования. Здесь сказывается особенность именновременных рядов: данные относящиеся к «далекому прошлому» будут неактуальными,бесполезными или даже «вредными» для оценивания параметров модели текущегопериода. Вот почему при анализе временных рядов широко используются процедурывзвешивания данных.

Для учета изменчивости условий модель ряда часто наделяют свойствомадаптивности, по крайней мере, на уровне оценок параметров. Адаптивность понимаетсяв том смысле, что оценки параметров легко пересчитываются по мере поступленияновых наблюдений. Конечно, и обычному методу наименьших квадратов можно придатьчерты адаптивности, пересчитывая оценки каждый раз, вовлекая в процессвычислений старые данные плюс свежие наблюдения. Однако при этом каждый новыйпересчет ведет к изменению прошлых оценок, тогда как адаптивные алгоритмысвободны от этого недостатка.

/>/> 4.1 Скользящие средние

Метод скользящих средних – один из самых старых и широко известныхспособов выделения детерминированной составляющей временного ряда. Суть методасостоит в усреднении исходного ряда на интервале времени, длина котороговыбрана заранее. При этом сам выбранный интервал скользит вдоль ряда, сдвигаяськаждый раз на один такт вправо (отсюда название метода). За счет усредненияудается существенно уменьшить дисперсию случайной составляющей.

Ряд новых значений становится более гладким, вот почему подобнуюпроцедуру называют сглаживанием временного ряда.

Процедуру сглаживания рассмотрим вначале для ряда, содержащего лишьтрендовую составляющую, на которую аддитивно наложен случайных компонент.

Как известно, гладкая функция может быть локально представлена в видеполинома с довольно высокой степенью точности. Отложим от начала временногоряда интервал времени длиной (2m+1) точек и построим полином степени m для отобранных значений и используем этот полином дляопределения значения тренда в (m+1)-й,средней, точке группы.

Построим для определенности полином 3-го порядка для интервала из семинаблюдений. Для удобства дальнейших преобразований занумеруем моменты временивнутри выбранного интервала так, чтобы его середина имела нулевое значение,т.е. t= -3, -2, -1, 0, 1, 2, 3. Запишемискомый полином:


/>.

Константы /> находим методом наименьшихквадратов:

/>.

Дифференцируем по коэффициентам />:

/>

/>;

/>;

/>.

Суммы нечетных порядков t от-3 до +3 равны 0, и уравнения сводятся к виду:

/> />;

/> /> />;

/> />;

/> /> />.


Используя первое и третье из уравнений, получаем при t=0:

/>

/> (1)

Следовательно, значение тренда в точке t= 0 равно средневзвешенному значению семи точек сданной точкой в качестве центральной и весами

/>,которые в силу симметрии можно записать короче:

/>.

Для того чтобы вычислить значение тренда в следующей, (m+2)-й точке исходного ряда (в нашемслучае пятой), следует воспользоваться формулой (1), где значения наблюденийберутся из интервала, сдвинутого на такт вправо, и т.д. до точки N-m .

Далее приводятся формулы для подсчета скользящего среднего подборомполиномов второго и третьего порядка к отрезкам ряда длиной до 9 точек:

количество точек формула

5 />

7 />

9 />.

 

Свойства скользящих средних:

1)  сумма весов равна единице (т.к. сглаживание ряда, всечлены которого равны одной и той же константе, должно приводить к той жеконстанте);

2)  веса симметричны относительно серединного значения ;

3)  формулы не позволяют вычислить значения тренда дляпервых и последних m значений ряда;

4)  можно вывести формулы для построения трендов на четномчисле точек, однако при этом были бы получены значения трендов в серединахвременных тактов. Значение тренда в точках наблюдений можно определить в этомслучая как полусумма двух соседних значений тренда.

Следует отметить, что при четном числе 2mтактовв интервале усреднения (двадцать четыречаса в сутки, четыре недели в месяце, двенадцать месяцев в году), широкопрактикуется простое усреднение с весами />. Пусть имеются, например,наблюдения на последний день каждого месяца с января по декабрь. Простоеусреднение 12 точек с весами /> дает значение тренда в серединеиюля. Чтобы получить значение тренда на конец июля надо взять среднее значениетренда в середине июля и середине августа. Оказывается, это эквивалентноусреднению 13-месячных данных, но значения на краях интервала берут с весами />. Итак, еслиинтервал сглаживания содержит четное число 2m точек, в усреднении задействуют не 2m, а 2m+1 значений ряда :

/>.

Скользящие средние, сглаживая исходный ряд, оставляют в нем трендовую ициклическую составляющие. Выбор величины интервала сглаживания должен делатьсяиз содержательных соображений. Если ряд содержит сезонный компонент, товеличина интервала сглаживания выбирается равной или кратной периодусезонности. В отсутствии сезонности интервал сглаживания берется обычно вдиапазоне три-семь

Эффект Слуцкого-Юла

Рассмотрим, как влияет процесс сглаживания на случайную составляющуюряда, относительно которой будем полагать, что она центрирована и соседниечлены ряда некоррелированы.

Скользящее среднее случайного ряда x есть:

/>.

В силу центрированности xиотсутствия корреляций между членами исходного ряда имеем:

/> и />.

Далее, />.

Из полученных соотношений видно, что усреднение приводит к уменьшениюдисперсии колебаний. Кроме того члены ряда, полученные в результате усреднения,не являются теперь независимыми. Производный, сглаженный, ряд имеет ненулевыеавтокорреляции (корреляции между членами ряда, разделенных k-1 наблюдениями) вплоть до порядка 2m. Таким образом производный ряд будетболее гладким, чем исходный случайный ряд, и в нем могут проявлятьсясистематические колебания. Этот эффект называется эффектом Слуцкого-Юла .


/>/>4.2 Определение порядка полинома методом последовательныхразностей

Если имеется ряд, содержащий полином (или локально представляемый полиномом)с наложенным на него случайным элементом, то было бы естественно исследовать,нельзя ли исключить полиномиальную часть вычислением последовательных разностейряда. Действительно, разности полинома порядка k представляют собой полином порядка k-1. Далее, если ряд содержит полином порядка p, то переход к разностям,повторенный (p+1) раз, исключает его и оставляетэлементы, связанные со случайной компонентой исходного ряда.

Рассмотрим, к примеру, переход к разностям в ряде, содержащим полиномтретьего порядка.

/> 0 18 27 64 125

/> 1 719 37 61

/> 6 1218 24

/> 6 66

/> 0 0

Взятие разностей преобразует случайную составляющую ряда.

В общем случае получаем :

/>;

/>;

/>;

/>;

/>.

Из последнего соотношения получаем

/> .

Следовательно, метод последовательных разностей переменной состоит ввычислении первых, вторых, третьих и т.д. разностей, определении суммквадратов, делении на /> и т.д. и обнаружения момента,когда это отношение становится постоянным. Таким образом мы получаем оценкипорядка полинома, содержащегося в исходном ряде, и дисперсии случайногокомпонента.

/>/>4.3.Методы экспоненциального сглаживания

Методы построения функций для описания наблюдений до сих пор основывалсяна критерии наименьших квадратов, в соответствии с которым все наблюдения имеютравный вес. Однако, можно предположить, что недавним точкам следует придавать внекотором смысле больший вес, а наблюдения, относящиеся к далекому прошлому,должны иметь по сравнению с ними меньшую ценность. До некоторой степени мыучитывали это в скользящих средних с конечной длиной отрезка усреднения, гдезначения весов, приписываемых группе из 2m+1 значений, не зависят от предшествующих значений. Теперьобратимся к другому методу выделения более «свежих» наблюдений.

Рассмотрим ряд весов, пропорциональных множителю b, а именно /> и т.д. Так как сумма весов должнаравняться единице, т.е. />, весами фактически будут /> и т.д. (предполагается, что 0<b<1.)

/>/> 4.3.1 Простое экспоненциальное сглаживание

Рассмотрим простейший ряд />, равный сумме постоянной /> (уровень) ислучайной компоненты />:

/>.

Будем считать, что ряд имеет бесконечную предысторию, т. е. времяпринимает значения t,t-1,t-2,..., — ¥. Найдем оценку /> уровня ряда />, воспользовавшись минимизациейвзвешенной суммы квадратов:

/>.

В приведенном выражении расхождения между наблюденными значениями ряда иоценкой уровня берутся с экспоненциально убывающими весами в зависимости отвозраста данных.

/> ; /> ; /> .

Полученную оценку /> на момент t обозначим />(t). Сглаженное значение в момент t можно выразить через сглаженноезначение в прошлый момент t-1и новое наблюдение />:

/>/> />

Полученное соотношение

/>(t) =/>

Перепишем несколько иначе, введя так называемую постоянную сглаживания /> (0 £ a£1).

/>(t) />,

Из полученного соотношения видно, что новое сглаженное значениеполучается из предыдущего коррекцией последнего на долю ошибки,рассогласования, между новым и прогнозным значениями ряда. Происходит своегорода адаптация уровня ряда к новым данным.

/>/> 4.3.2 Экспоненциальное сглаживание высоких порядков

Обобщим метод экспоненциального сглаживания на случай, когда модельпроцесса определяется линейной функцией />. Как и прежде, при заданном b минимизируем:

/>.

(Здесь для удобства представления знаки ~ и Ù опущены).

/>,

/>

/>

С учетом того что

/> , /> ,

получаем

/>

Запишем: />.

Эту операцию можно рассматривать как сглаживание 1-го порядка. Поаналогии построим сглаживание 2-го порядка:

/>

/>.

ß

/>

/> ; />.

/> ;

/> ;

/> ;

/> ;

/> ;

/>.

Рассмотренную выше процедуру можно обобщить на случай полиномиальныхтрендов более высокого порядка n,при этом алгебраические выражения будут сложнее. Например, если модельописывается параболой, то используется метод тройного экспоненциальногосглаживания.


/>5. Оценивание и исключениесезонной компоненты

Сезонные компоненты могут представлять самостоятельный интерес либовыступать в роли мешающего фактора. В первом случае необходимо уметь выделятьих из ряда и оценивать параметры соответствующей модели. Что же касаетсяудаления сезонной компоненты из ряда, то здесь возможны несколько способов.

Рассмотрим сначала процедуру оценивания сезонных эффектов. Пусть исходныйряд является полностью аддитивным, то есть

/>.

Необходимо оценить /> по наблюденным />. Иными словами, необходимополучить оценки /> коэффициентов /> индикаторной модели.

Как уже отмечалось, сезонный эффект проявляется на фоне тренда, поэтомувначале необходимо оценить трендовую составляющую одним из рассмотренныхметодов. Затем для каждого сезона /> вычисляют все относящиеся к немуразности

/>

где, как обычно, /> — наблюденное значение ряда, /> — оцененноезначение тренда.

Каждая из этих разностей дает совместную оценку сезонного эффекта и случайногокомпонента, отличного, правда, от исходного /> в силу взятия разностей.

Производя усреднение полученных разностей, получают оценки эффектов.Полагая, что исходный ряд содержит целое число k периодов сезонности и ограничиваясь простым средним,имеем

/>

С учетом условия репараметризации, требующим, чтобы сумма сезонныхэффектов равнялась нулю, получаем скорректированные оценки

/>.

В случае мультипликативного сезонного эффекта, когда модель ряда имеетвид

/>,

вычисляют уже не разности, а отношения

/>.

В качестве оценки сезонного индекса /> выступает среднее

/>.

На практике считается, что для оценки сезонных эффектов временной ряддолжен содержать не менее пяти-шести периодов сезонности.

Перейдем теперь к способам удаления сезонного эффекта из ряда. Таких способовдва. Первый из них назовем «послетрендовый». Он является логическим следствиемрассмотренной выше процедуры оценивания. Для аддитивной модели удалениесезонной компоненты сводится к вычитанию оцененной сезонной компоненты изисходного ряда. Для мультипликативной модели значения ряда делят насоответствующие сезонные индексы.

Второй способ не требует предварительной оценки ни трендовой, ни сезоннойкомпонент, а основывается на использовании разностных операторов.

Разностные операторы.

При исследовании временных рядов часто имеется возможность представитьдетерминированные функции времени простыми рекуррентными уравнениями. Кпримеру, линейный тренд

/> (1)

можно записать как

/> (2)

Последнее соотношение получается из (1) сравнением двух значений ряда длясоседних моментов t-1и t. Учитывая, что соотношение (2)справедливо и для моментов t-2и t-1, так что />, модель (1) можно записать и ввиде

/> (3)


Модель (3) не содержит явно параметров, описывающих тренд. Болеекомпактно описанные преобразования можно описать, используя операторы взятияразности назад

/>.

/>.

Модели (2) и (3) можно записать как

/>, />.

Выходит, разность второго порядка полностью исключает из исходного рядалинейный тренд. Легко видеть, что разность порядка dисключает из ряда полиномиальный тренд порядка d-1. Пусть теперь ряд содержитсезонный эффект с периодом t, так что

/> (4).

Процедура перехода от ряда /> (t= 1,2,...,T) к ряду /> называется взятием первойсезонной разности, а оператор /> сезонным разностным оператором спериодом t. Из (4)следует, что

/>.

Выходит, взятие сезонной разности /> исключает из временного ряда /> любуюдетерминированную сезонную компоненту.

Иногда оказываются полезными сезонные операторы более высоких порядков.Так, сезонный оператор второго порядка с периодом t есть

/>.

Если ряд содержит и тренд, и сезонную составляющую, их можно исключить,последовательно применяя операторы /> и />.

Легко показать, что порядок применения этих операторов не существенен:

/>.

Отметим также, что детерминированный тренд, состоящий из тренда исезонной компоненты, после применения операторов /> и /> полностью вырождается, то есть />. Однакозаписав последнее уравнение в рекуррентной форме, получаем

/>.

Из последнее соотношения видно, каким образом ряд можно неограниченнопродолжать, имея вначале по крайней мере t+1 последовательных значения.


/>/>6.Модели случайной составляющей временного ряда

линейный ряд временной система

Для удобства изложения условимся обозначать здесь случайные величины так,как это принято в математической статистике – строчными буквами.

Случайным процессом X(t) на множестве Т называют функцию, значения которойслучайны при каждом t Î T. Если элементы Тсчетные (дискретное время), то случайный процесс часто называют случайнойпоследовательностью.

Полное математическое описание случайного процесса предполагает заданиесистемы функций распределения:

– для каждого t Î T />, (1)

– для каждой пары элементов />

/> (2)

и вообще для любого конечного числа элементов

/>

/> (3).

Функции (1),(2),(3) называют конечномерными распределениями случайногопроцесса.

Построить такую систему функции для произвольного случайного процессапрактически невозможно. Обычно случайные процессы задают с помощью априорныхпредположений о его свойствах, таких как независимость приращений, марковскийхарактер траекторий и т. п.

Процесс, у которого все конечномерные распределения нормальны, называетсянормальным (гауссовским). Оказывается, что для полного описания такого процессадостаточно знания одно- и двумерного распределений (1), (2), что важно спрактической точки зрения, поскольку позволяет ограничиться исследованиемматематического ожидания и корреляционной функцией процесса.

В теории временных рядов используются ряд моделей случайной составляющей,начиная от простейшей – «белого шума», до весьма сложных типа авторегрессии –скользящего среднего и других, которые строятся на базе белого шума.

Прежде чем определять процесс белого шума рассмотрим последовательностьнезависимых случайных величин, для которой функция распределения есть

/>.

Из последнего соотношения следует, что все конечномерные распределенияпоследовательности определяются с помощью одномерных распределений.

Если к тому же в такой последовательности составляющие ее случайныевеличины X(t) имеют нулевое математическое ожидание и распределеныодинаково при всех t Î T, то это – «белыйшум». В случая нормальности распределения X(t)говорят о гауссовском белом шуме. Итак, гауссовский белый шум – последовательностьнезависимых нормально распределенных случайных величин с нулевым математическиможиданием и одинаковой (общей) дисперсией.

Более сложными моделями, широко используемыми в теории и практике анализавременных рядов, являются линейные модели: процессы скользящего среднего,авторегрессии и смешанные.

Процесс скользящего среднего порядка q/> представляет собой взвешенную сумму случайныхвозмущений:

/> (4),

где /> – независимые одинаковораспределенные случайные величины (белый шум);

/> – числовые коэффициенты.

Легко видеть из определения, что у процесса скользящего среднего порядка q (сокращенно CC(q))статистически зависимыми являются (q+1) подряд идущих величин X(t), X(t-1),...,X(t-q). Члены ряда, отстоящие друг от друга больше чем на (q+1) такт, статистически независимы,поскольку в их формировании участвуют разные слагаемые />.

Процессом авторегрессии порядка p (сокращенно АР(р)) называют взвешеннуювозмущенную сумму pпрошлых значений временного ряда

/> (5),

где /> – случайное возмущение, действующеев текущий момент t;

/> – числовые коэффициенты.

Выражая последовательно в соответствии с соотношением (5) X(t-1) через X(t-2),..., X(t-p-1), затем X(t-2) через X(t-3),..., X(t-p-2) и т.д.получим, что X(t) есть бесконечная сумма прошлыхвозмущений /> Из этого следует, члены процессаавторегрессии X(t) и X(t-k) статистически зависимы при любомk.

Процесс АР(1) часто называют процессом Маркова, АР(2) – процессом Юла. Вобщем случае марковским называют такой процесс, будущее которого определяетсятолько его состоянием в настоящем и воздействиями на процесс, которые будутоказываться в будущем, тогда как его состояние до настоящего момента при этомнесущественно. Процесс АР(1)

/>

является марковским, поскольку его состояние в любой момент /> определяетсячерез значения процесса />, если известна величина /> в момент />. Формальнопроцесс авторегресси произвольного порядка /> также можно считать марковским,если его состоянием в момент tсчитать набор

(X(t),X(t-1),..., X(t-p-1)) .

Более полно модели СС, АР, а также их композиция: модели авторегрессии –скользящего среднего рассматриваются далее (п.10.1.5 ). Заметим только, что всеони представляются частными случаями общей линейной модели

/> (6)

где /> – весовые коэффициенты, числокоторых, вообще-то говоря, бесконечно.

Среди моделей случайной составляющей выделим важный класс – стационарныепроцессы, такие, свойства которых не меняются во времени. Случайный процесс Y(t) называется стационарным, если для любых n, /> распределения случайных величин /> и />одинаковы. Иными словами, функции конечномерныхраспределений не меняются при сдвиге времени:


/>.

Образующие стационарную последовательность случайные величины распределеныодинаково, так что определенный выше процесс белого шума является стационарным.

/>/> 7.Числовые характеристики случайной составляющей

При анализе временных рядов используются числовые характеристики,аналогичные характеристикам случайных величин:

– математическое ожидание (среднее значение процесса)

/>;

– автоковариационная функция

/>;

– дисперсия

/>;

– стандартное отклонение

/>

– автокорреляционная функция

/> 

– частная автокорреляционная функция

Заметим, что в операторе функции /> усреднение происходит при неизменном t, то есть имеется математическоеожидание по множеству реализаций (вообще-то говоря, потенциальных поскольку «вреку времени нельзя войти дважды»).

Рассмотрим введенные числовые характеристики для стационарных процессов.Из определения стационарности следует, что для любых s, t и /> 

/>

положив /> = — t, получаем

/> (1)

Выходит, у стационарного процесса математическое ожидание и дисперсияодинаковы при любом t,а автоковариационная и автокорреляционная функции зависят не от момента времениsилиt, а лишь от их разности (лага).

Отметим, что выполнение свойств (1) еще не влечет стационарности в смыслеопределения из п.6. Тем не менее постоянство первых двух моментов, а такжезависимость автокорреляционной функции только от лага определенно отражаетнекоторую неизменность процесса во времени. Если выполнены условия (1), тоговорят о стационарности процесса в широком смысле, тогда как выполнениеусловий ( ) означает стационарность в узком (строгом) смысле.

Данное выше определение белого шума надо трактовать в узком смысле. Напрактике часто ограничиваются белым шумом в широком смысле, под которымпонимают временной ряд (случайный процесс), у которого />=0 и

/>

Отметим, что гаусовский процесс,стационарный в узком смысле, стационарен и в широком смысле.

О стационарности в широком смыслесудить гораздо проще. Для этого используют различные статистические критерии,базирующиеся на одной реализации случайного процесса.


/>/>8.Оцениваниечисловых характеристик временного ряда

Оценивание числовых характеристик случайного временного ряда в каждыймомент времени требует набора реализаций (траекторий) соответствующегослучайного процесса. Хотя время и не воспроизводимо, однако условия протеканияпроцесса иногда можно считать повторяющимися. Особенно это характерно длятехнических приложений, например, колебания напряжения в электрической сети втечении суток. Временные ряды, наблюдаемые в разные сутки, можно считатьнезависимыми реализациями одного случайного процесса.

Иная ситуация при исследовании процессов социально-экономической природы.Как правило, здесь доступна единственная реализация процесса, повторить которуюне представляется возможным. Следовательно, получить оценки среднего,дисперсии, ковариации нельзя. Однако для стационарных процессов подобные оценкивсе-таки возможны. Пусть /> наблюденные значения временного ряда в моменты /> соответственно. Традиционная оценка среднего /> может служить оценкой математического ожиданиястационарного (в широком смысле) случайного процесса.

Ясно, что такая оценка для стационарного ряда будет несмещенной. Состоятельностьэтой оценки устанавливается теоремой Слуцкого, которая в качестве необходимогои достаточного условия требует чтобы

/>,

где /> – автокорреляционная функцияпроцесса.

Точность оценивания среднего зависит от длины N ряда. Считается, что длина N всегда должна быть не меньше такназываемого времени корреляции, под которым понимают величину

 

T =/>.

Величина Т дает представление о порядке величины промежуткавремени />, на котором сохраняется заметная корреляциямежду двумя значениями ряда.

Рассмотрим теперь получение оценок значений автокорреляционной функции.Как и прежде, /> – наблюденные значения временногоряда. Образуем (N-1) пар />. Эти пары можно рассматривать как выборку двухслучайных величин, для которых можно определить оценку стандартногокоэффициента корреляции />. Затем составим (N-2) пар /> и определим оценку /> и т.д. Поскольку при подсчетеочередного /> объемвыборки меняется, меняется значение среднего и стандартного отклонения длясоответствующего набора значений. Для упрощения принято измерять все переменныеотносительно среднего значения всего ряда /> и заменять дисперсионные члены в знаменателе надисперсию ряда в целом, то есть

/>,

где />-среднее, равное />.

При больших Nрасхождение в оценках незначительные. На практике kберут не выше N/4.

Если ряд рассматривается как генеральная совокупность бесконечной длины,то говорят об автокорреляциях (теоретических) и обозначают их />. Массив коэффициентов /> илисоответствующих им выборочных коэффициентов /> содержат весьма ценную информациюо внутренней структуре ряда. Совокупность коэффициентов корреляции, нанесеннаяна график с координатами k(лаг) по оси абсцисс и /> либо /> по оси ординат, называюткоррелограммой (теоретической или выборочной соответственно).

Точностные характеристики оценки /> получены для гауссовскихпроцессов. В частности, для гаусовского белого шума, у которого все корреляцииравны нулю, />.Математическое ожидание /> для гауссовского белого шумаоказывается не равным нулю, а именно, />, то есть оценка /> оказывается смещенной.Величина смещения убывает с ростом объема выборки и не столь существенна вприкладном анализе.

Оценка /> асимптотически нормальна при />, что даетоснование для построения приблизительного доверительного интервала. Широкоприменяемый 95%-интервал есть />.

Границы доверительного интервала, нанесенные на график, называютдоверительной трубкой. Если коррелограмма некоторого случайного процесса невыходит за пределы доверительной трубки, то этот процесс близок к белому шуму.Правда, это условие можно считать лишь достаточным. Нередко выборочнаякоррелограмма гауссовского белого шума содержит один, а то и два выброса средипервых 20 оценок />, что естественно затрудняетинтерпретацию подобной коррелограммы.

Наряду с автокорреляционной функцией при анализе структуры случайноговременного ряда используется частная автокорреляционная функция, значениякоторой суть частные коэффициенты корреляции.


/>/>9.Свободные от закона распределения критерии проверки ряда на случайность

Простейшей гипотезой, которую можно выдвинуть относительно колеблющегосяряда, не имеющего явно выраженного тренда, является предположение, чтоколебания случайны. В случайных рядах, согласно гипотезе, наблюдения независимыи могут следовать в любом порядке. Для проверки на случайность желательноиспользовать критерий, не требующий каких-либо ограничений на вид распределениясовокупности, из которой, по предположению, извлекаются наблюдаемые значения.

1.   Критерий поворотных точек состоит в подсчёте пиков (величин,которые больше двух соседних) и впадин (величин, которые меньше двух соседних).Рассмотрим ряд y1,...,yN.

/>/>/>/>пик впадина

/>/>/>/>/> yt-1< yt > yt+1 yt-1 > yt <yt+1

/>


yt-1 yt yt+1 yt-1yt yt+1

Рис. Поворотные точки.

Для определения поворотной точки требуются три последовательных значения.Начальное и конечное значения не могут быть поворотными точками, т. к.неизвестно y0и yN+1. Если ряд случаен, то эти тризначения могут следовать в любом из шести возможных порядков с равнойвероятностью. Только в четырёх из них будет поворотная точка, а именно, когданаибольшее или наименьшее из трёх значений находится в середине. Следовательно,вероятность обнаружения поворотной точки в любой группе из трёх значений равна2/3.


/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/> с с c c c c

/>/>/>/> b b b b b b

/>/>/>/> а а a a a a

Рис. Варианты взаимного расположения трёх точек.

Для группы из N величин определим счётную переменную Х.

ì 1, если yt-1 < yt > yt+1или yt-1 > yt < yt+1

Х = í

î 0, в противном случае.

Тогда число поворотных точек р в ряде есть просто />, а их математическоеожидание есть М[p]=2/3(N-2). Дисперсия числа поворотных точек вычисляется поформуле D[p]=(16N-29)/90, а само распределение близко к нормальному.

2.   Критерий, основанный на определениидлины фазы

Интервал между двумя поворотными точками называется фазой. Для того,чтобы установить наличие фазы длины d (например, восходящей), нужно обнаружить d+3 членов, содержащих падение от первого члена ко второму, затем последовательный подъем до (d+2)-го члена и падение к (d+3)-емучлену.

/> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> /> />

/>/>/>/>/>/>/>/>/>/>/>/>/> 

 

/> 

1 2 3 4 d+1 d+2 d+3 N

рис. 3. Фаза длины d.

Рассмотрим группу из d+3чисел, расположенных в порядке возрастания. Если, не трогая двух крайнихчленов, извлечь пару чисел из оставшихся d+1 и одно из них поставить в начало, а другое в конец,получим фазу длины d. Существует /> способовтакого выбора пары чисел и каждый член пары может быть поставлен в любой конец,следовательно число восходящих фаз равно d(d+1).

Кроме того, поворотные точки будут иметь место, если первый членпоследовательности поставить в конец, а любой из оставшихся, за исключениемвторого, поместить в начало. Число таких последовательностей составит (d+1). Еще столько же последовательностей получиться еслипоследний член в исходной, возрастающей, последовательности поставить в начало,а любой другой, кроме последнего, в конец. Во избежании двойного счета следуетисключить случай, когда первый член ставится на последнее место, а последний напервое. Таким образом, в последовательности из (d+3) чисел с фазой длиной d число случаев роста составит

 

d(d+1)+2(d+1)-1 =/>+3d+1 .

Число возможных последовательностей из (d+3) чисел равняется числу перестановок (d+3)!, так что вероятность либо восходящей, либонисходящей фазы равна

 

/>.

В ряде длины N последовательноможно выделить N-2-d групп по d+3 членов. Т.о. математическое ожидание числа фаз длины d


/>.

Можно показать, что математическое ожидание общего числа фаз длины от 1до N-3

 

/>.

 

3.Критерий, основанный на знаках разностей

Данный критерий состоит в подсчете числа положительных разностей первогопорядка в ряде, иначе говоря, числа точек возрастания ряда. Для ряда из N членов получаем N-1 разностей. Определим счетнуюпеременную как

/>

Если теперь обозначить через с число точек возрастания случайногоряда, то

/>.

Распределение довольно быстро стремится к нормальному с дисперсией

/>.

В основном данный критерий рекомендуется для проверки наличия линейноготренда. С другой стороны, критерий, основанный на поворотных точках, плохоподходит для обнаружения тренда, т.к. наложение заметных случайных колебаний наумеренный тренд приводит примерно к тому же множеству поворотных точек, что ипри отсутствии тренда… Более совершенным, но более сложным критерием дляобнаружения линейного тренда являются регрессия y на t ипроверка значимости регрессионного коэффициента.

4.Критерий, основанный на ранговых сравнениях

Идею сравнения соседних значений ряда можно развить до сравнения всехзначений. Для данного ряда подсчитаем число случаев, когда очередной член рядапревышает все последующие. Всего для сравнения имеется />N(N-1) пар. Пусть nобщее число случаев превышения. Подсчитывают ранговыйкоэффициент корреляции Кендэла

 

/>.

Если этот коэффициент значим и положителен, то ряд возрастающий, еслиотрицателен, то — убывающий.


/>/>10.Теоретическийанализ стационарной случайной составляющей линейного вида

Рассматривается общая линейная модельстохастического процесса

/>, (1)

где /> – белый шум

/> – весовые коэффициенты.

Напомним, что/>=0, />, />

Введем оператор сдвига на один шаг назад В: />

Многократное (для определенности j-кратное) применения оператора В,обозначаем как />, дает /> С учетом введенных обозначений общую линейную модельможно записать как

/> (/>)

где />– линейный оператор.

Найдем математическое ожидание, дисперсию и автоковариационную функциюдля процесса (1):

/>;

/>

/>

Для того чтобы модель имела смысл, дисперсия /> должна быть конечной, то естьпредполагается, что ряд /> сходится.

Кроме этого предполагают, что имеет место так называемое условиеобратимости:

/>,

где вместо В фигурируют комплексные числа. Из этого условиявытекает существование обратного оператора

/>,

где />, то есть такого, что

/>

Раскрывая произведение в последнем выражении, группируя однородные по /> члены и приравнивая их к нулю, получают выражения дляопределения коэффициентов /> . Так, /> и так далее.

Умножая (/>) на /> слева, получим, что обратимый процесс может бытьзаписан в виде

/>,

или

/> (2)

Запись (2) соответствует авторегрессионой схеме бесконечного порядка. Этоже соотношение можно трактовать как линейный предиктор для по всем прошлымзначениям временного ряда, а слагаемое /> – как случайную ошибку этого предиктора. Если известны всепрошлые значения ряда, то по форме (2) можно спрогнозировать будущее значениеряда.

/>/> 10.1\. Модели авторегрессии

Рассмотрим более подробно моделислучайной составляющей, являющиеся частными случаями общей линейной модели, аименно модели авторегрессии, скользящего среднего и смешанные, широкоприменяемые на практике.

/>/> 10.1.1 Авторегрессия первого порядка (марковскийпроцесс)

Модель АР(1) имеет вид

/>.

С использованием оператора сдвига Вмодель примет вид

/>.

Отсюда

/>

/>

Рассматривая /> как сумму бесконечно убывающейгеометрической прогрессии со знаменателем а В получаем, что

/> (2)

Таким образом, марковский процессесть частный случай общей линейной модели, коэффициенты которой меняются позакону геометрической прогрессии, то есть />.

Выражение (2) можно получить и из (1)непосредственно, выражая /> через />, /> через /> и т.д.

Дисперсия /> в соответствие с () есть

/>

Выходит, белый шум с дисперсией /> порождает всхеме Маркова случайный процесс с возросшей дисперсией, равной />.

Для нахождения автоковариационнойфункции Марковского процесса можно воспользоваться общим выражением ( ). Однакоболее нагляден следующий путь. Домножим уравнение (1) марковского процесса на />и возьмемматематическое ожидание

/>.

Поскольку второе слагаемое в правойчасти равно нулю в силу некоррелированности возмущения /> в текущий момент с прошлыми значениями ряда />, получаем

/>

(/>в силу стационарности />)

Из последнего соотношения имеем

/>,

то есть  а совпадает с коэффициентом автокорреляции /> средних членов ряда. Умножим теперь (1) на /> и возьмемматематическое ожидание:

/>.

Заменяя а на /> и деля на /> , получаем

/>.

Придавая k значения2,3,… получим

/>.

Итак, в марковском процессе все автокорреляции можно выразить черезпервую автокорреляцию. Поскольку />, автокорреляционная функция марковского процессаэкспоненциально убывает при росте k.

Рассмотрим теперь частную автокорреляционную функцию марковскогопроцесса. Мы получили, что корреляция между двумя членами ряда, отстоящими надва такта, то есть между /> и /> выражается величиной />. Но /> зависит от />, а /> от />. Возникает вопрос,сохранится ли зависимость между /> и />, если зависимость от срединногочлена /> устранена.Соответствующий частный коэффициент корреляции есть

/>.

Поскольку />, числитель равен нулю. Аналогичноможно показать, что частные коэффициенты корреляции для членов ряда, отстоящихна 3,4 и так далее тактов, также равны нулю. Таким образом, автокорреляциясуществует только благодаря корреляции соседних членов, что впрочем следует изматематической модели марковского процесса.

Завершая рассмотрение модели АР(1), отметим, что она весьма частоиспользуется в экономико-математических исследованиях для описания остатковлинейной регрессии, связывающей экономические показатели.

/>/> Авторерессия второго порядка (процесс Юла)

Авторегрессионный процесс Юла АР(2) описывается уравнением

/> (1)

С использованием оператора сдвига В модель запишется как

/>,

где а(В) – авторегрессионный оператор, то есть а(В)= />.

Свойства модели зависят от корней /> и /> полинома

/>=0,(2)

который можно записать также в виде

(1-/>В)(1-/>В)=0.

Для стационарности процесса (1) необходимо, чтобы корни /> и /> лежали внутри единичнойокружности (случай комплексных корней), либо были меньше единицы (случайдействительных корней), что обеспечивается при /> .

Пусть /> и/> действительныи различны. Разложим />на простые дроби

/>, (3)

где />.

Рассматривая отдельные слагаемые в (3) как суммы бесконечныхгеометрических прогрессий, получим


/>.

Выходит АР(2) есть частный случай общей линейной модели ( ) скоэффициентами

/>.

Рассмотрим теперь автокорреляционную функцию процесса Юла. Умножим (1) поочереди на /> и/>, возьмемматематические ожидания и разделим на />. В итоге получим

/>

Этих уравнений достаточно для определения /> через первые две автокорреляции и, наоборот, поизвестным /> можно найти />.

Умножая теперь (1) на /> получим рекуррентное уравнение

/>, (4)

из которого можно найти автокорреляции высоких порядков через первыеавтокорреляции. Тем самым, полностью определяется коррелограмма процесса Юла.

Исследуем вид коррелограммы процесса АР(2).

Выражение (4) можно рассматривать как разностное уравнение второгопорядка относительно rс постоянными коэффициентами.

Общее решение такого уравнения имеет вид

/>,

где /> – корни характеристическогоуравнения

/> (5)

Легко видеть, что уравнения (2) и (5) эквивалентны с точностью до замены Вна z и деления обоих частей на />, так что корни этих уравнений совпадают, то есть />

Общее решение разностного уравнения (4) есть

/> (6)

где коэффициенты А и В находят из граничных условий при j=0 и j=1.

Таким образом, в случае действительных корней коррелограмма АР(2)представляет собой, как видно из (6), смесь двух затухающих экспонент.

В случае комплектности корней /> и /> коррелограмма процесса АР(2)оказывается затухающей гармоникой.

Рассмотрим теперь как ведет себя частная автокорреляционная функцияпроцесса Юла. Отличным от нуля оказывается лишь коэффициент /> , равный />. Частные корреляцииболее высоких порядков равны нулю (подробнее этот процесс рассматриваетсядальше). Таким образом, частная коррелограмма процесса отрывается сразу послелага, равного единице.

В заключении отметим, что модели АР(2) оказались приемлемыми при описанииповедения циклической природы, прообразом которого служит маятник, на которыйвоздействуют малые случайные импульсы. Амплитуда и фаза такого колебательногопроцесса будут все время меняться.

/>/>10.1.3. Авторегрессия порядка р

Процесс авторегрессии порядка р, кратко АР(р), описываетсявыражением

/> (1)

или

/> (/>)

Решение разностного относительно y выражения (1) или (/>) состоит из двух частей: общегорешения, содержащего р произвольных констант, и частного решения. Общеерешение есть

/>, (2)

где/>– есть постоянные коэффициенты,

/> (j=1,2,...,р) – корнихарактеристического уравнения.

/> (3)

Стационарность ряда (2) имеет место, если корни уравнения (3) имеютмодуль меньше единицы. Другими словами, корни должны лежать внутри единичногокруга. Считая, что ряд имеет достаточно длинную предысторию, общим решением (2)можно пренебречь вследствие затухания.

Частое решение, как видно из (/>), есть

/>

Последнее соотношение есть форма представления авторегрессионногопроцесса в виде общей линейной модели.

Последовательно умножим уравнение (1) на />, возьмем математическое ожиданиеи разделим на />. Получим систему уравненийотносительно коэффициентов корреляции :

/>, k=1, 2, ..., p (4)

Учитывая, что /> , и вводя матричные обозначения

/>,

запишем (4) в виде

 

Pa=r (5)

Систему уравнений (5) называют системой Юла-Уокера. Из нее находим, что

 

a=/>r(6)

Таким образом, зная первые р автокорреляций временного ряда, можно найтипо (3) автокорреляции более высокого порядка, то есть полностью восстановитьавтокорреляционную функцию (что уже отмечалось при анализе процессов АР(1) иАР(2)).

Поведение автокорреляционной функции зависит от корнейхарактеристического полинома. Обычно коррелограмма процесса АР(р)состоит из совокупности затухающих синусоид.

Если у процесса АР(2) частная автокорреляция членов ряда, разделенных2-мя или большим числом членов, равна нулю, то у процесса АР(р) нулюравны автокорреляции порядка р и выше. Выходит, частная коррелограмма процессаАР(р) должна равняться нулю, начиная с некоторого момента. Правда, надозаметить, что этот факт имеет место для бесконечного ряда. Для конечныхреализаций указать место обрыва коррелограммы часто затруднительно.

Итак, для процесса АР(р) частная автокорреляционная функцияобрывается на лаге р, тогда как автокорреляционная функция плавноспадает.

/>/> 10.1.4 Процессы скользящего среднего

Обобщенная линейная модель для процессов скользящего среднего содержитлишь конечное число членов, то есть в ( ): />=0 k> q .

Модель приобретает вид

/> (1)

(В (1) коэффициенты /> переобозначены через/>.)

Соотношение (1) определяет процесс скользящего среднего порядка q, или сокращенно СС(q). Условие обратимости ( ) дляпроцесса СС(q)выполняется, если корни многочлена b(В) лежат вне единичного круга.

Найдем дисперсию процесса СС(q):

/>/>

Все смешанные произведения вида /> равны нулю в силунекоррелированности возмущений в разные моменты времени. Для нахожденияавтокорреляционной функции процесса СС(q) последовательно умножим (1) на />и возьмем математическоеожидание

/> (2)

В правой части выражения (2) останутся только те члены, которые отвечаютодинаковым временным тактам (см. рис )

/> /> /> /> /> />

/> /> /> /> /> /> /> /> /> /> /> <td/> />

/>/> /> /> /> (k=2)

Следовательно, выражение (2) есть

/> (3)

поделив (3) на /> , получим

/> (4)


Тот факт, что автокорреляционная функция процесса СС(q) имеет конечную протяженность (q тактов) – характерная особенностьтакого процесса. Если /> известны, то (4) можно в принципе разрешить относительнопараметров />. Уравнения (4) нелинейные и в общемслучае имеют несколько решений, однако условие обратимости всегда выделяетединственное решение.

Как уже отмечалось, обратимые процессы СС можно рассматривать как бесконечныеАР- процессы -АР(¥).Следовательно, частная автокорреляцонная функция процесса СС(р) имеетбесконечную протяженность. Итак, у процесса СС(q) автокорреляционная функция обрывается на лаге q, тогда как частная автокорреляционнаяфункция плавно спадает.

/>/> 10.1.5 Комбинированные процессы авторегрессии — скользящего среднего

Хотя модели АР(р) и СС(q) позволяют описывать многие реальные процессы, числооцениваемых параметров может оказываться значительным. Для достижения большейгибкости и экономичности описания при подборе моделей к наблюдаемым временнымрядам весьма полезными оказались смешанные модели, содержащие в себе иавторегрессию и скользящее среднее. Эти модели были предложены Боксом иДженкинсом и получили название модели авторегрессии — скользящего среднего(сокращенно АРСС(р, q)):

/> (1)

С использованием оператора сдвига В модель (1) может бытьпредставлена более компактно:


/>, (/>)

где а(В)—авторегрессионный оператор порядка р,

b(В)—оператор скользящего среднего порядка q.

Модель (/>) может быть записаны и так :

/>

Рассмотрим простейший смешанный процесс АРСС(1,1)

Согласно />

/> (2)

Из соотношения (2) видно, что модель АРСС(1,1) является частным случаемобщей линейной модели ( ) с коэффициентами /> (j>0)

Из (2) легко получить выражение для дисперсии />:

/>

Для получения корреляционной функции воспользуемся тем же приемом, что ипри анализе моделей авторегрессии. Умножим обе части модельного представленияпроцесса АРСС(1,1)

/>

на /> ивозьмем математическое ожидание :

/>

или (с учетом того, что второе слагаемое в правой части равенства равнонулю)

/>

Поделив ковариации /> на дисперсию /> получаем выражения дляавтокорреляции

/>

полученные соотношения показывают, что /> экспоненциально убывает от начальногозначения /> ,зависящего от /> и /> при этом, если /> > />, то затуханиемонотонное; при />< /> – затухание колебательное.

Аналогично может быть построена автокорреляционная функция для общеймодели АРСС(р, q).

Умножим все члены (1) на />. Возьмем математическое ожиданиеи в результате получим следующее разностное уравнение.

/>

Где /> -взаимная ковариационная функция между y и />. Поскольку возмущения /> в момент t и значения ряда в прошлые моменты(см(2)) не коррелируют, />0 при k>0.

Отсюда следует, что для значений />q+1 автоковариации и автокорреляции удовлетворяют темже соотношениям, что и в модели АР(р):

/>

В итоге оказывается, что при q вся автокорреляционная функция будет выражаться совокупностью затухающихэкспонент и / или затухающих синусоидальных волн, а при q>p будет q-pзначений />, выпадающих из данной схемы.

/>/> 10.1.6 Интегрированная модель авторегрессии-скользящего среднего

Модель АРСС допускает обобщение на случай, когда случайный процессявляется нестационарным. Ярким примером такого процесса являются «случайные блуждания»:

/> (1)

С использованием оператора сдвига модель (1) принимает вид

/> (2)

Из (2) видно, что процесс (1) расходящийся, поскольку/>. Характеристическоеуравнение этого процесса имеет корень, равный единице, то есть имеет местопограничный случай, когда корень характеристического уравнения оказался награнице единичной окружности. В то же время, если перейти к первым разностям />, то процесс /> окажетсястационарным.

В общем случае полагается, что нестационарный авторегрессионный оператор /> в модели АРССимеет один или несколько корней, равных единице. Иными словами, /> является нестационарнымоператором авторегрессии порядка p+d; dкорней уравнения />=0 равныединице, а остальные р корней лежат вне единичного круга. Тогда можнозаписать, что

/>,

где a(B) – стационарный оператор авторегрессии порядкар(с корнями вне единичного круга).

Введем оператор разности />, такой что />/>=(1-B)/>, тогда нестационарный процессАРСС запишется как

/>, (3)

где b(B) – обратимый оператор скользящего среднего (вне егокорни лежат вне единичного круга).

Для разности /> порядка d, то есть /> модель

/>

описывает уже стационарный обратимый процесс АРСС(р, q).

Для того чтобы от ряда разностей вернуться к исходному ряду требуетсяоператор s, обратный /> :

/>

Этот оператор называют оператором суммирования, поскольку

/> .

Если же исходной является разность порядка d, то для восстановления исходного ряда понадобится d — кратная итерация оператора s, иначе d — кратное суммирование (интегрирование). Поэтому процесс (3) принятоназывать процессом АРИСС, добавляя к АРСС термин интегрированный. Кратко модель(3) записывают как АРИСС(р, d, q),где р – порядок авторегрессии, d – порядок разности, q – порядок скользящего среднего. Ясно, что при d =0 модель АРИСС переходит в модельАРСС .

На практике dобычно не превышает двух, то есть d.

Модель АРИСС допускает представление, аналогичное общей линейной модели,а так же в виде «чистого » процесса авторегрессии (бесконечного порядка).Рассмотрим, к примеру, процесс АРИСС (1, 1, 1):

/> (4)

Из (4) следует, что

/>

Отсюда

/> (5)

В выражении (5) коэффициенты, начиная с третьего, вычисляются по формуле />.

Представление (5) интересно тем, что веса, начиная с третьего, убывают поэкспоненциальному закону. Поэтому, хотя формально/>зависит от всех прошлых значений,однако реальный вклад в текущее значение внесут несколько «недавних» значенийряда. Поэтому уравнение (5) более всего подходит для прогнозирования.


/>/>11.Прогнозированиепо модели АРИСС

Как уже отмечалось, процессы АРИСС допускают представление в видеобобщенной линейной модели, то есть

/>

Естественно искать будущее (прогнозное) значение ряда в момент /> в виде

/>

Ожидаемое значение />, которое мы будем обозначать как />

/>=/>

Первая сумма в правой части последнего соотношения содержат лишь будущиевозмущения (прогноз делается в момент t, когда известны прошлые значения и ряда /> и возмущений/>) и для нихматематическое ожидание равно 0 по определению. Что же касается второгослагаемого, то возмущения здесь уже состоялись, так что

/>

Таким образом

/>=/>(1)

Ошибка прогноза, представляющая расхождение между прогнозным значением иего ожиданием есть

/>=/>

Дисперсия ошибки отсюда есть

/> (2)

Прогнозирование по соотношению (1) в принципе возможно, однакозатруднительно поскольку требует знания всех прошлых возмущений. К тому же длястационарных рядов скорость затухания /> часто оказывается недостаточной,не говоря уже о нестационарных процессах, для которых ряды /> расходятся.

Поскольку модель АРИСС допускает и другие представления, рассмотримвозможности их использования для прогнозирования. Пусть модель задананепосредственно разностным уравнением

/> (3)

По известным значениям ряда (результатам наблюдений) /> и оцененным значениямвозмущений /> ,опираясь на рекуррентную формулу (3) можно оценить ожидаемое значение ряда вмомент t+1:


/>

-/>, (4)

При прогнозировании на два такта следует вновь воспользоватьсярекуррентным соотношением (3), где в качестве наблюденного значения ряда вмомент t+1 следует взять предсказанную по (4)величину />,то есть /> итак далее.

Наконец, возможно прогнозирование опираясь на представление процессаАРИСС в виде авторегрессии (). Как уже отмечалось, несмотря на то что порядокавторегрессии бесконечен, весовые коэффициенты в представлении ряда убываютдовольно быстро, поэтому для вычисления прогноза достаточно умеренное числопрошлых значений ряда.

Дисперсия ошибки прогноза на /> шагов вперед есть

/>

и согласно выражению (2) дается выражением

/>/>

В предположении, что случайные возмущения являются гаусовским белымшумом, то есть /> можно рассматривать доверительныйинтервал для прогнозного значения ряда стандартным образом.


/>/>12.Технологияпостроения моделей АРИСС

Описанные выше теоретические схемы строились в предположении, чтовременной ряд имеет бесконечную предысторию, тогда как реально исследователюдоступен ограниченный объем наблюдений. Модель приходится подбиратьэкспериментально, подгоняя ее к имеющимся в распоряжении данным. Поэтому спозиций теоретического применения теории анализа временных рядов определяющеезначение имеют вопросы корректной спецификации модели АРИСС(p, d, q) (ее идентификации) и последующего оценивания еепараметров.

На этапе идентификации наблюденные данные используются для определенияподходящего класса моделей и делаются предварительные оценки ее параметров, тоесть строится пробная модель. Затем пробная модель подгоняется к данным болеетщательно; при этом первичные оценки, полученные на этапе идентификациивыступают в качестве начальных значений в итеративных алгоритмах оцениванияпараметров. И наконец, на третьем этапе полученная модель подвергаетсядиагностической проверке для выявления возможной неадекватности модели ивыработки подходящих изменений в ней.Рассмотрим перечисленные этапы подробнее.

 

Идентификация модели

Цель идентификации – получить некоторое представление о величинах p, d, qи о параметрах модели. Идентификация модели распадается на две стадии

1.   Определение порядка разности d исходного ряда />.

2.   Идентификация модели АРСС для рядаразностей />.

Основной инструмент, используемый на обеих стадиях – автокорреляционная ичастная автокорреляционная функции.

В теоретической части мы видели, что у стационарных моделейавтокоррелящии /> спадают с ростом k весьма быстро (по корреляционномузакону). Если же автокорреляционная функция затухает медленно и почти линейно,то это свидетельствует о нестационарности процесса, однако, возможно, егопервая разность стационарно.

Построив коррелограмму для ряда разностей, вновь повторяют анализ и такдалее. Считается, что порядок разности d, обеспечивающий стационарность, достигнут тогда,когда автокорреляционная функция процесса /> падает довольно быстро. Напрактике /> идостаточно просмотреть порядка 15-20 первых значений автокорреляции исходногоряда, его первые и вторые разности.

После того как будет получен стационарный ряд разностей, порядка d, изучают общий видавтокорреляционной и частной автокорреляционной функций этих разностей.Опираясь на теоретические свойства этих функций можно выбрать значения p и q для АР и СС операторов. Далее при выбранных p и q строятся начальные оценки параметров авторегрессии /> и скользящего среднего b=(/>). Для авторегрессионных процессов используютсяуравнения Юла-Уокера, где теоретические автокорреляции заменены на ихвыборочные оценки. Для процессов скользящего среднего порядка q только первые q автокорреляций отличны от нуля имогут быть выражены через параметры /> (см. ). Заменяя /> их выборочными оценками /> и решаяполучающиеся уравнения относительно />, получим оценку />. Эти предварительные оценки можноиспользовать как начальные значения для получения на следующих шагах болееэффективных оценок.

Для смешанных процессов АРСС процедура оценивания усложняется. Так длярассмотренного в п. процесса АРСС(1,1) параметры />и /> , точнее их оценки, получаются из( ) с заменой />и /> их выборочными оценками.

В общем случае вычисление начальных оценок процесса АРСС(p,q) представляет многостадийную процедуру и здесь нерассматривается. Отметим только, что для практики особый интерес имеют АР и ССпроцессы 1-го и 2-го порядков и простейший смешанный процесс АРСС(1,1).

В заключение заметим, что оценки автокорреляций, на основе которыхстроятся процедуры идентификации могут иметь большие дисперсии (особенно вусловиях недостаточного объема выборки – несколько десятков наблюдений) и бытьсильно коррелированны. Поэтому говорить о строгом соответствии теоретической иэмпирической автокорреляционных функций не приходится. Это приводит кзатруднениям при выборе p, d, q, поэтому для дальнейшего исследования могут бытьвыбраны несколько моделей.

линейный рядсистема временной ряд

Размещено на www.

еще рефераты
Еще работы по экономико-математическому моделированию