Парное линейное уравнение регрессии

Тип: лабораторная работа
Категория: Математика

Скачать

Купить

Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
Краткое сожержание материала:

Размещено на

Лабораторная работа №1

Парное линейное уравнение регрессии

Цель работы: рассчитать параметры линейного уравнения парной регрессии с помощью Excel, а также проанализировать качество построенной модели, использую коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.

аппроксимация уравнение программа корреляция

Для анализа зависимости объема потребления Y (руб.) домохозяйства в зависимости от располагаемого дохода X (руб.) отобрана выборка объема n =12, результаты которой приведены в таблице:

№	1	2	3	4	5	6	7	8	9	10	11	12
х	107	109	110	113	120	121	124	127	129	140	141	143
y	102	105	108	110	115	118	119	124	131	131	140	144

Необходимо:

1. найти параметры a и b линейного уравнения парной регрессии y(x);

2. найти коэффициент детерминации;

3. рассчитать линейный коэффициент парной корреляции и оценить тесноту связи, используя таблицу Чеддока;

4. Найти среднюю ошибку аппроксимации;

5. Построить график линейного уравнения регрессии.

Решение

Формально критерий МНК можно записать так:

S = ?(y_i - y^*_i)² > min

Система нормальных уравнений.

a*n + b?x = ?y

a?x + b?x² = ?y*x

Для наших данных система уравнений имеет вид

12a + 1484 b = 1447

1484 a + 185316 b = 180822

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 1.0455, a = -8.7108

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.0455 x - 8.7108

Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов в_i, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

x	y	x²	y²	x * y
107	102	11449	10404	10914
109	105	11881	11025	11445
110	108	12100	11664	11880
113	110	12769	12100	12430
120	115	14400	13225	13800
121	118	14641	13924	14278
124	119	15376	14161	14756
127	124	16129	15376	15748
129	131	16641	17161	16899
140	131	19600	17161	18340
141	140	19881	19600	19740
143	144	20449	20736	20592
1484	1447	185316	176537	180822

1. Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

2. Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от -1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < r_xy < 0.3: слабая;

0.3 < r_xy < 0.5: умеренная;

0.5 < r_xy < 0.7: заметная;

0.7 < r_xy < 0.9: высокая;

0.9 < r_xy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X весьма высокая и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 1.05 x -8.71

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 1.05 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 1.05.

Коэффициент a = -8.71 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.

3. Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Для о...

Другие файлы:

Корреляция для нелинейной регрессии
Уравнение нелинейной регрессии и вид уравнения множественной регрессии. Преобразованная величина признака-фактора. Преобразование уравнения в линейную...

Метод наименьших квадратов для однофакторной линейной регрессии
Уравнение вида ? = а + bx позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактическ...

Анализ накладных расходов
Построить уравнение множественной регрессии в линейной форме с полным набором факторов, отобрать информативные факторы в модель по t-критерию для коэф...

Уравнение регрессии для Rсж28нт образцов раствора 1:3 на смешанном цементно-туфовом вяжущим с использованием С3 и стандартного вольского песка
Расчет коэффициентов уравнения регрессии и оценка их значимости. Определение среднеквадратичного отклонения и среднеквадратичной ошибки, вычисление ко...

Построение регрессионной модели
Т.к. Fкр > Fфакт, то необходимо отклонить гипотезу о статистической значимости параметров уравнения. Т.е. использовать данную функцию для аппроксимаци...