Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »Математика

Прогнозирование функций по методу наименьших квадратов

Тип: курсовая работа
Категория: Математика
Скачать
Купить
Исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Анализ расхождения между трендом и прогнозом, последующая оценка близости распределения расхождений наблюдений и распределения сгенерированного шума.
Краткое сожержание материала:

23

Министерство общего и профессионального образования

Московский Авиационный институт (государственный технический университет) «МАИ»

ОТЧЕТ

О НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЕ

Курсовой проект по теории вероятностей и математической статистике

по теме

«Прогнозирование функций по методу наименьших квадратов»

Москва 2009

Реферат

В отчете содержится: 24 формулы, 10 рисунков.

Ключевые слова: тренд прогноза, логнормальный закон, шум, критерий ч2-Пирсона, проверка гипотез, оценки расхождения.

Целью данной работы было исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Для этого проводился машинный эксперимент с использованием программы Mathcad 14. Основой для построения случайной функции являлась линейная функция, на которую был наложен случайный шум, распределенный по логнормальному закону с параметрами М[шума]=0 (математическое ожидание шума) и D[шума]=D (дисперсия шума). После чего полученная случайная функция аппроксимировалась линейным трендом, а также исследовалось расхождение между трендом и прогнозом с последующей оценкой близости распределения расхождений наблюдений и распределения сгенерированного шума по критерию ч2-Пирсона.

Определения и формулы

Математическим ожиданием P(о=xi) дискретной случайной величины о называется сумма парных произведений всех возможных значений случайной величины на соответствующие им вероятности, т.е:

, (1)

где хi - значение случайной величины, pi - вероятность этого значения, n - общее число значений.

Математическим ожиданием P(о=xi) непрерывной случайной величины о с плотностью распределения ц(x) называется число, определяемое равенством:

, (2)

где ц(x) - плотность распределения случайной величины.

Дисперсией (рассеянием) случайной величины называется математическое ожидание квадрата ее отклонения от ее математического ожидания:

(3)

Для непрерывной случайной величины формула (3) будет представлена в виде:

(4)

Среднее квадратичное отклонение(СКО) - это статистическая величина, описывающая разброс значений изучаемой величины вокруг ее ожидаемого значения:

(5)

В математической статистике оперируют оценками числовых характеристик, которые ищутся по случайной выборке. В отличие от самих параметров, оценки содержат элемент случайности. К оценкам параметров предъявляют определенные требования:

а) состоятельность - оценка, соответствующая этому требованию, с увеличением объема выборки сходится по вероятности к самому параметру;

б) несмещенность - математическое ожидание такой оценки равно оцениваемому параметру;

в) эффективность - дисперсия эффективной оценки минимальна.

Оценка математического ожидания ищется по формуле:

, (6)

где n - объем случайной выборки. Оценка, вычисленная по формуле (6), называется так же статистическим средним.

Оценка дисперсии вычисляется по формуле:

, (7)

где m - оценка математического ожидания случайной величины.

Оценка С.К.О. вычисляется по формуле:

, (8)

т.е. корень квадратный из оценки дисперсии.

При генерации шума мы используем два закона: нормальное и логнормальное распределение.

Нормальный закон: Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью вероятности:

(9)

Функция распределения F(x) в рассматриваемом случае принимает вид:

(10)

График 1 - распределение плотности вероятности нормального закона:

Рисунок 1. Плотность вероятности нормального закона

Говорят, что случайная величина X имеет логнормальное распределение с параметрами м, у, если X = exp(Y), где Y имеет нормальное распределение с параметрами м, у. Случайная величина с логнормальным распределением является непрерывной, и принимает только положительные значения. Графики плотности (привязан к левой вертикальной оси ординат) и функции (привязан к правой оси ординат) логнормального распределения с параметрами м = 0, у = 0.7 приведен на следующем рисунке 2:

Рисунок 2. Логнормальное распределение

Плотность распределения логнормального закона:

(11)

Функция распределения:

(12)

Для определения степени расхождения теоретической кривой и статистических данных пользуются критериями согласия. Наиболее часто для проверки гипотезы о законе распределения используются 2 критерия: критерий л-Колмогорова и критерий ч2-Пирсона.

Расчетное значение для критерия ч2-Пирсона вычисляется по формуле:

, где (13)

- (14)

вероятность попадания в интервал разбиения с номером i, mi - число значений функции в интервале разбиения, m, у - математическое ожидание и с.к.о. случайной величины X, Ц* - интеграл вероятностей.

Чтобы определить функциональную зависимость между величинами по результатам наблюдений, используем метод наименьших квадратов (МНК):

Пусть из опыта получены точки:

x1, y1,

xn, yn

Требуется найти уравнение прямой y=ax+b (15), наилучшим образом согласующейся с опытными точками. Пусть мы нашли такую прямую. Обозначим через дi расстояние опытной точки от этой прямой (измеренное параллельно оси y).

Из уравнения (15) следует, что:

(16)

Чем меньше числа по абсолютной величине, тем лучше подобрана прямая (15). В качестве характеристики точности подбора прямой (15) можно принять сумму квадратов:

(17)

Покажем, как можно подобрать прямую (15) так, чтобы сумма квадратов S была минимальной. Из уравнений (16) и (17) получаем:

(18)

Условия минимума S будут равны для линейной функции:

(19)

(20)

Уравнения (19) и (20) можно записать в таком виде:

(21)

(22)

По уравнениям (21) и (22) легко найти a и b по опытным значениям xi и yi. Прямая (15), определяемая уравнениями (21) и (22), называется прямой, полученной по методу наименьших квадратов (этим названием подчеркивается то, что сумма квадратов S имеет минимум). Уравнения (21) и (22), из которых определяется прямая (15), называются нормальными уравнениями.

Введение

В качестве тренда процесса был выбран линейный тренд вида

Y=at+b, (23)

где а=1, b=2. Тренд процесса показан на рисунке 3.

Рисунок 3. График тренда

График прямой с учетом сгенерированного шума по логнормальному закону выглядит так:.

Рисунок 4. График прямой с учетом шума.

Наша задача в курсовом проекте заключается в определении насколько сильно шум влияет на прогнозирование. Для этого мы определяем расхождения между трендом и прогнозом и оцениваем степень расхождения из-за шума по критерию Пирсона

1. Построение прямой аппроксимирующей свойства тренда с помощью МНК

Наша ошибка сгенерирована по логнормальному закону с математическим ожиданием равным 0 и дисперсией равной 1. Гистограмма распределения шума представлена на рисунке 5.

Рисунок 5. (Гистограмма распределения значений шума по интервалам).

С помощью формул (21) и (22) вычислим коэффициенты линейного уравнения тренда с учетом шума с помощью метода МНК:

По найденным коэффициентам строим график прямой, которая аппроксимирует основные свойства линейного тренда. График показан на рисунке 6:

Рисунок 6. (Прямая, построенная по методу наименьших квадратов).

2. Прогнозирование дальнейшего продвижения тренда

Наша задача состоит в том, чтобы спрогнозировать дальнейшее поведение уравнения тренда и определить расхождения с спрогнозированными значениями.

Для этого увеличиваем участок наблюдения за линейным трендом без шума до ф =2t=50

График расхождения исходного тренда и аппроксимированного тренда по МНК виден на рисунке 7. (Yф - исходный тренд; Zф - аппроксимированный тренд по МНК)

Рисунок 7 (На рисунке показаны тренд и аппроксимирующая его свой...

Другие файлы:

Обработка экспериментальных данных по методу наименьших квадратов
Определение зависимости одной физической величины от другой. Применение метода наименьших квадратов с помощью программного обеспечения Mathcad. Суть м...

Аппроксимация функций методом наименьших квадратов
Построение эмпирических формул методом наименьших квадратов. Линеаризация экспоненциальной зависимости. Элементы теории корреляции. Расчет коэффициент...

Прогнозирование функций по методу наименьших квадратов
Целью данной работы было исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Для этого проводился...

Прогнозирование наработки до отказа объекта
Определение среднего квадратичного отклонения. Расчет значения критерия Стьюдента, значения доверительных границ с его учетом. Обоснование выбора мате...

Анализ и прогнозирование производства фильмов в Российской Федерации
Прогнозирование, его основные подходы и виды. Текущее состояние российского кинематографа, его проблемы и тенденции. Прогнозирование числа выходящих к...