Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »Математика

Парное линейное уравнение регрессии

Тип: лабораторная работа
Категория: Математика
Скачать
Купить
Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
Краткое сожержание материала:

Размещено на

Размещено на

Лабораторная работа1

Парное линейное уравнение регрессии

Цель работы: рассчитать параметры линейного уравнения парной регрессии с помощью Excel, а также проанализировать качество построенной модели, использую коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.

аппроксимация уравнение программа корреляция

Для анализа зависимости объема потребления Y (руб.) домохозяйства в зависимости от располагаемого дохода X (руб.) отобрана выборка объема n =12, результаты которой приведены в таблице:

1

2

3

4

5

6

7

8

9

10

11

12

х

107

109

110

113

120

121

124

127

129

140

141

143

y

102

105

108

110

115

118

119

124

131

131

140

144

Необходимо:

1. найти параметры a и b линейного уравнения парной регрессии y(x);

2. найти коэффициент детерминации;

3. рассчитать линейный коэффициент парной корреляции и оценить тесноту связи, используя таблицу Чеддока;

4. Найти среднюю ошибку аппроксимации;

5. Построить график линейного уравнения регрессии.

Решение

Формально критерий МНК можно записать так:

S = ?(yi - y*i)2 > min

Система нормальных уравнений.

a*n + b?x = ?y

a?x + b?x2 = ?y*x

Для наших данных система уравнений имеет вид

12a + 1484 b = 1447

1484 a + 185316 b = 180822

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 1.0455, a = -8.7108

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.0455 x - 8.7108

Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов вi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

x

y

x2

y2

x * y

107

102

11449

10404

10914

109

105

11881

11025

11445

110

108

12100

11664

11880

113

110

12769

12100

12430

120

115

14400

13225

13800

121

118

14641

13924

14278

124

119

15376

14161

14756

127

124

16129

15376

15748

129

131

16641

17161

16899

140

131

19600

17161

18340

141

140

19881

19600

19740

143

144

20449

20736

20592

1484

1447

185316

176537

180822

1. Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

2. Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от -1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X весьма высокая и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 1.05 x -8.71

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 1.05 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 1.05.

Коэффициент a = -8.71 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.

3. Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Для о...

Другие файлы:

Корреляция для нелинейной регрессии
Уравнение нелинейной регрессии и вид уравнения множественной регрессии. Преобразованная величина признака-фактора. Преобразование уравнения в линейную...

Метод наименьших квадратов для однофакторной линейной регрессии
Уравнение вида ? = а + bx позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактическ...

Анализ накладных расходов
Построить уравнение множественной регрессии в линейной форме с полным набором факторов, отобрать информативные факторы в модель по t-критерию для коэф...

Уравнение регрессии для Rсж28нт образцов раствора 1:3 на смешанном цементно-туфовом вяжущим с использованием С3 и стандартного вольского песка
Расчет коэффициентов уравнения регрессии и оценка их значимости. Определение среднеквадратичного отклонения и среднеквадратичной ошибки, вычисление ко...

Построение регрессионной модели
Т.к. Fкр > Fфакт, то необходимо отклонить гипотезу о статистической значимости параметров уравнения. Т.е. использовать данную функцию для аппроксимаци...