Исследование последовательного подхода к оцениванию параметров авторегрессионной модели
Конференция: I Международная заочная научно-практическая конференция «Научный форум: технические и физико-математические науки»
Секция: Теория вероятностей и математическая статистика
I Международная заочная научно-практическая конференция «Научный форум: технические и физико-математические науки»
Исследование последовательного подхода к оцениванию параметров авторегрессионной модели
Researching of sequential estimation of the autoregression model’s parameters
Emelyanova Tatyana
Candidate of Physical and Mathematical Sciences Tomsk State University – TSU, Russia, Tomsk
Ivashchenko Anna
Master, Tomsk State University – TSU, Russia, Tomsk
Аннотация. В задачах обработки временных рядов, прогнозировании, идентификации, экономических исследованиях широко применяются авторегрессионные модели, параметры которых, как правило, неизвестны. Рассматривается задача оценивания параметров модели устойчивой авторегрессии первого порядка, а также исследование качества полученных оценок.
Abstract. The problems of processing time series, prediction, identification, economical researches are widely used autoregression models. The parameters of that models are usually unknown. The article discusses the problem of estimating and researching of quality the estimators of autoregression model’s parameters.
Ключевые слова: модель авторегрессии; последовательный подход к оцениванию параметров; момент остановки.
Keywords: autoregression model; sequential estimation of the parameter; stopping rule.
Рассматривается авторегрессионный процесс первого порядка, описанный разностным уравнением
(1)
где , – независимые одинаково распределенные случайные величины с нулевым математическим ожиданием и конечной дисперсией, . Чаще всего для оценивания параметра модели авторегрессии первого порядка AR(1) применяют метод наименьших квадратов (МНК) [1]. Можно рассмотреть последовательную процедуру оценивания по методу наименьших квадратов, в которой число наблюдений не фиксируется заранее. Процесс наблюдений останавливается в некоторый случайный момент времени [3]. Рассмотрим последовательную оценку, представляющую собой оценку по методу наименьших квадратов, вычисленную в момент остановки
(2)
При использовании байесовского подхода к оцениванию параметров вводится некоторая функция потерь, которая является мерой расхождения между истинным значением параметра и его оценкой[4]. В свою очередь риск определяется как математическое ожидание функции потерь.
Проведя некоторые математические расчеты, можно получить, минимизируется объемом выборки
Ситуация осложняется в том случае, когда неизвестны значения дисперсии и параметра [1]. Для такой ситуации предлагается последовательный подход к оцениванию [5]. При этом пользуются правилом остановки, построенным по наблюдаемому процессу
(3)
Здесь– выборочная оценка дисперсии и заранее заданный объем выборки. Таким образом, риск, с учетом заданного правила остановки
Оценка является асимптотически эффективной, следовательно, при . Более того, правило остановки также является асимптотически эффективным, то есть [3].
При исследовании полученных оценок параметров авторегрессионной модели было сделано предположение о том, что разность рисков является бесконечно малой величиной при . Для подтверждения данного предположения, проведено имитационное моделирование, результатами которого продемонстрировано, что разность рисков при использовании последовательной процедуры оценивания может принимать отрицательные значения даже для распределений с нормальными ошибками [2].
В качестве иллюстрации, рассмотрим результаты имитационного моделирования, проведенного для смешанного нормального распределения: .
Рассмотрим разность рисков при последовательном и байесовском подходе к оцениванию параметра в случае смешанного нормального распределения. В таблице указаны результаты вычислений при различных значениях . Здесь - количество наблюдений в момент остановки ; - оценка риска при количестве наблюдений ; - оценка параметра модели авторегрессии в момент остановки ; - оценка дисперсии в момент остановки Под разностью рисков понимается разность между риском , вычисленным в момент остановки , и оценкой риска при количестве наблюдений .
Таблица
Смешанное нормальное распределение:
На рисунке продемонстрирован график, описывающий разность рисков в случае смешанного нормального распределения.
Рисунок – Разность рисков в случае смешанного нормального распределения
В случае смешанного нормального распределения при небольших значениях параметра и больших значениях цены наблюдений разности рисков отрицательны. При разности рисков становятся положительными.
Таким образом, последовательный метод оценивания параметров позволяет получить оценки с гарантированным качеством в среднеквадратическом смысле за конечное время. Время оценивания определяется правилом остановки, построенным по наблюдаемому процессу.
Имитационное моделирование позволяет продемонстрировать, что использование последовательного оценивания параметров эффективно минимизирует риск функции потерь.