Статья:

ИССЛЕДОВАНИЕ ТОЧНОСТИ НАХОЖДЕНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РЕГРЕССИИ МЕТОДАМИ МНК, М-ОЦЕНКИ, LTS И ИХ МОДИФИКАЦИЙ ПРИ РАЗЛИЧНЫХ УСЛОВИЯХ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТА

Конференция: LXI Студенческая международная научно-практическая конференция «Технические и математические науки. Студенческий научный форум»

Секция: Физико-математические науки

Выходные данные
Кайль Д.В. ИССЛЕДОВАНИЕ ТОЧНОСТИ НАХОЖДЕНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РЕГРЕССИИ МЕТОДАМИ МНК, М-ОЦЕНКИ, LTS И ИХ МОДИФИКАЦИЙ ПРИ РАЗЛИЧНЫХ УСЛОВИЯХ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТА // Технические и математические науки. Студенческий научный форум: электр. сб. ст. по мат. LXI междунар. студ. науч.-практ. конф. № 5(61). URL: https://nauchforum.ru/archive/SNF_tech/5(61).pdf (дата обращения: 23.04.2024)
Лауреаты определены. Конференция завершена
Эта статья набрала 0 голосов
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

ИССЛЕДОВАНИЕ ТОЧНОСТИ НАХОЖДЕНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РЕГРЕССИИ МЕТОДАМИ МНК, М-ОЦЕНКИ, LTS И ИХ МОДИФИКАЦИЙ ПРИ РАЗЛИЧНЫХ УСЛОВИЯХ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТА

Кайль Денис Владимирович
студент, Новосибирский Государственный Технический Университет, РФ, г. Новосибирск
Хайленко Екатерина Алексеевна
научный руководитель, Новосибирский Государственный Технический Университет, РФ, г. Новосибирск

 

В регрессионный анализ входит множество различных подходов к моделированию или анализу отношений между зависимыми и независимыми переменными. Существуют методы, которые позволяют находить неизвестные параметры регрессионных моделей. Одни из самых распространённых методов — это метод наименьших квадратов (МНК). Для того, чтобы в условиях появления в выборке выбросов, можно было получать корректные результаты оценивания параметров, ученые разработали методы, которые устойчивы к появлению выбросов. Были разработаны такие методы, как метод наименьшей медианы квадратов, М-оценки, метод наименьших уравновешенных квадратов (LTS) и другие. В данной работе подробно будут рассмотрены методы LTS м М-оценки. Эти методы оценивают параметры регрессионных зависимостей по максимально информативным наблюдениям, и, как следствие, получают устойчивые к выбросам оценки параметров регрессионных моделей.

Рассмотрим случай присутствия долей выбросов. С дисперсией наблюдений равной 0.01 и дисперсией ошибок 0.5. Размер подмножества (1- m)n . В таблице 1 представлены результаты оценивания

Таблица 1.

Оценка точности при различных долях выбросах  = 0.5

 

Доля выбросов, %

Метод

0

5

10

15

20

25

30

МНК

0.3568%

0.0127%

0.3583%

0.159%

0.1663%

0.8791%

2.036%

LTS(res)

0.3568%

0.00

08%

0.1045%

0.0417%

0.1248%

0.0998%

0.0885%

LTS (cook)

0.3568%

0.0011%

0.1202%

0.0391%

0.0937%

0.1207%

0.1925%

LTS(standart)

0.3568%

0.0007%

0.1045%

0.0417%

0.1248%

0.0998%

0.0885%

LTS(dffits)

0.3568%

0.0007%

0.1005%

0.0380%

0.0845%

0.0923%

0.0778%

Метод Хьюбера

0.4762%

0.0027%

0.1633%

0.0489%

0.1438%

0.2664%

0.2946%

 

Все данные показывают, что при увеличении доли выбросов LTS наилучший в оценке неизвестных параметров и он выигрывают в точности у МНК и М-оценки, это связано с тем, что LTS проводит оценку по наиболее информативным наблюдениям. Разница между методами определения выбросов невелика.

Рассмотрим случай присутствия долей выбросов. С дисперсией наблюдений равной 0.01 и различными значениями дисперсией ошибок. Размерность подмножества h = (1- m)n. В таблицах 1-3 представлены результаты оценивания.

Таблица 2.

Оценка точности при различных долях выбросах  = 0.5

 

Доля выбросов, %

Метод

10

15

20

25

30

МНК

0.3583%

0.159%

0.1663%

0.8791%

2.036%

LTS(res)

0.1045%

0.0417%

0.1248%

0.0998%

0.0885%

LTS (cook)

0.1202%

0.0391%

0.0937%

0.1207%

0.1925%

LTS(standart)

0.1045%

0.0417%

0.1248%

0.0998%

0.0885%

LTS(dffits)

0.1005%

0.0380%

0.0845%

0.0923%

0.0778%

Метод Хьюбера

0.1633%

0.0489%

0.1438%

0.2664%

0.2946%

 

Таблица 2.

Оценка точности при различных долях выбросах  = 1

 

Доля выбросов, %

Метод

10

15

20

25

30

МНК

0.216%

4.5158%

4.5158%

0.4326%

0.8961%

LTS(res)

0.021%

0.3108%

0.3108%

0.083%

0.1218%

LTS (cook)

0.0046%

0.1315%

0.1315%

0.012%

0.0677%

LTS(standart)

0.0087%

0.1949%

0.1949%

0.0174%

0.0755%

LTS(dffits)

0.0041%

0.1302%

0.1302%

0.011%

0.0620%

Метод Хьюбера

0.0036%

0.1215%

0.1215%

0.010%

0.8961%

 

Таблица 3.

Оценка точности при различных долях выбросах  = 2

 

Доля выбросов, %

Метод

10

15

20

25

30

МНК

2.6397%

2.708%

0.5055%

2.5405%

2.6374%

LTS(res)

0.4796%

0.0225%

0.0885%

0.5743%

0.1591%

LTS (cook)

0.1809%

0.0032%

0.138%

0.3724%

0.1804%

LTS(standart)

0.0937%

0.0024%

0.1393%

0.3351%

0.0529%

LTS(dffits)

0.1745%

0.0030%

0.135%

0.3721%

0.1804%

Метод Хьюбера

0.0837%

0.0021%

0.124%

0.3701%

0.1674%

 

Провели сравнение алгоритмов метода наименьших квадратов, метода наименьших уравновешенных квадратов и М-оценки. М-оценки и LTS показали результаты, приближенные к истинному значению. МНК же начал отдаляться от истинного значения с появлением выбросов. В случае нормальнораспредленных ошибок точность оценки LTS и М-оценки значительно отличаются. Однако, МНК оценивает неизвестные параметры регрессионных уравнений более точно.

При появлении в выборке аномальных наблюдений методы М-оценки и LTS показывают более приближенные результаты к истинным значениям. МНК проигрывает в точности из-за отклонения от нормального закона распределения ошибок наблюдений.

Также провели исследование влияния дисперсии выброса на оценку неизвестных параметров. При увеличении дисперсии выбросов М-оценки и LTS также показали более точные результаты по сравнению с методом наименьших квадратов.При изменении размера оценочного подмножества метод LTS показывает наилучшие оценки. Наиболее точные оценки LTS показывает при размере подмножества равным . Это связано с тем, что данный метод производит оценку по наиболее информативным наблюдениям.

 

Список литературы:
1. Ниворожкина Л.И., Морозова З.А. Математическая статистика с элементами теории вероятностей в задачах и решениях: Учебное пособие. Москва: ИКЦ «МарТ»; Ростов-н/Д: Издательский центр «МарТ», 2005. 608 с. (Серия «Учебный курс»).