Парное линейное уравнение регрессии
Краткое сожержание материала:
Размещено на
Размещено на
Лабораторная работа №1
Парное линейное уравнение регрессии
Цель работы: рассчитать параметры линейного уравнения парной регрессии с помощью Excel, а также проанализировать качество построенной модели, использую коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
аппроксимация уравнение программа корреляция
Для анализа зависимости объема потребления Y (руб.) домохозяйства в зависимости от располагаемого дохода X (руб.) отобрана выборка объема n =12, результаты которой приведены в таблице:
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
х |
107 |
109 |
110 |
113 |
120 |
121 |
124 |
127 |
129 |
140 |
141 |
143 |
|
y |
102 |
105 |
108 |
110 |
115 |
118 |
119 |
124 |
131 |
131 |
140 |
144 |
Необходимо:
1. найти параметры a и b линейного уравнения парной регрессии y(x);
2. найти коэффициент детерминации;
3. рассчитать линейный коэффициент парной корреляции и оценить тесноту связи, используя таблицу Чеддока;
4. Найти среднюю ошибку аппроксимации;
5. Построить график линейного уравнения регрессии.
Решение
Формально критерий МНК можно записать так:
S = ?(yi - y*i)2 > min
Система нормальных уравнений.
a*n + b?x = ?y
a?x + b?x2 = ?y*x
Для наших данных система уравнений имеет вид
12a + 1484 b = 1447
1484 a + 185316 b = 180822
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 1.0455, a = -8.7108
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 1.0455 x - 8.7108
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов вi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x * y |
|
107 |
102 |
11449 |
10404 |
10914 |
|
109 |
105 |
11881 |
11025 |
11445 |
|
110 |
108 |
12100 |
11664 |
11880 |
|
113 |
110 |
12769 |
12100 |
12430 |
|
120 |
115 |
14400 |
13225 |
13800 |
|
121 |
118 |
14641 |
13924 |
14278 |
|
124 |
119 |
15376 |
14161 |
14756 |
|
127 |
124 |
16129 |
15376 |
15748 |
|
129 |
131 |
16641 |
17161 |
16899 |
|
140 |
131 |
19600 |
17161 |
18340 |
|
141 |
140 |
19881 |
19600 |
19740 |
|
143 |
144 |
20449 |
20736 |
20592 |
|
1484 |
1447 |
185316 |
176537 |
180822 |
1. Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
2. Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от -1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X весьма высокая и прямая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 1.05 x -8.71
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 1.05 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 1.05.
Коэффициент a = -8.71 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.
3. Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Для о...
Корреляция для нелинейной регрессии
Уравнение нелинейной регрессии и вид уравнения множественной регрессии. Преобразованная величина признака-фактора. Преобразование уравнения в линейную...
Метод наименьших квадратов для однофакторной линейной регрессии
Уравнение вида ? = а + bx позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактическ...
Анализ накладных расходов
Построить уравнение множественной регрессии в линейной форме с полным набором факторов, отобрать информативные факторы в модель по t-критерию для коэф...
Уравнение регрессии для Rсж28нт образцов раствора 1:3 на смешанном цементно-туфовом вяжущим с использованием С3 и стандартного вольского песка
Расчет коэффициентов уравнения регрессии и оценка их значимости. Определение среднеквадратичного отклонения и среднеквадратичной ошибки, вычисление ко...
Построение регрессионной модели
Т.к. Fкр > Fфакт, то необходимо отклонить гипотезу о статистической значимости параметров уравнения. Т.е. использовать данную функцию для аппроксимаци...