Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »Математика

Модели множественной линейной регрессии

Тип: курсовая работа
Категория: Математика
Скачать
Купить
Определение наличия зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы. Нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.
Краткое сожержание материала:

Размещено на

Размещено на

КУРСОВАЯ РАБОТА

Модели множественной линейной регрессии

Введение

Множественная регрессия используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. Множественная регрессия является одним из наиболее распространенных методов в эконометрике. Основной целью множественной регрессии является построение модели с большим числом факторов, при этом определив влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Цель курсовой работы: Исследовать зависимость заработной платы (, тыс. руб.) от возраста (, лет) и стажа по данной специальности (, лет), используя данные наблюдений, приведенные в таблице 2.1. Построить регрессионную модель . Рассчитать значение заработной платы для работника в возрасте 35 лет со стажем работы по данной специальности 10 лет.

Задачи:

1. Определить наличие зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы.

2. Найти оценки неизвестных параметров модели.

3. Оценить общее качество модели по коэффициенту (индексу) детерминации и нормированному индексу детерминации.

4. Проанализировать нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.

5. Проверить значимость коэффициентов регрессии.

6. Проверить статистических свойства остатков (качества оценок коэффициентов регрессии):

7. Проверить мультиколлинеарность факторов.

8. Оценить влияние каждого объясняющего фактора на результирующий фактор ЗП (эластичность)

9. Определим степень влияния факторов на результирующий фактор ЗП при устранении влияния других факторов.

Расчеты для данной курсовой работы производились c помощью приложения MS Excel.

1. Модели множественной линейной регрессии

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, который в свою очередь включает 2 круга вопросов: отбор факторов и выбор уравнения регрессии. Отбор факторов обычно осуществляется в два этапа:

1) теоретический анализ взаимосвязи результата и круга факторов, которые оказывают на него существенное влияние;

2) количественная оценка взаимосвязи факторов с результатом. При линейной форме связи между признаками данный этап сводится к анализу корреляционной матрицы (матрицы парных линейных коэффициентов корреляции):

ry, y ry, x1 ryx2…. ry, xm

rx 1, y rx1, x2 rx2x 2…. rx 2, xm

……

rxm, y rxm, x1 rxm, x2…. rxm, xm

где ry, xj - линейный парный коэффициент корреляции, измеряющий тесноту связи между признаками y и хj j=1; m, m - число факторов.

rxj, xk - линейный парный коэффициент корреляции, измеряющий тесноту связи между признаками хj и хk j, k =1; m.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов).

2. Каждый фактор должен быть достаточно тесно связан с результатом (т.е. коэффициент парной линейной корреляции между фактором и результатом должен быть существенным).

3. Факторы не должны быть сильно коррелированы друг с другом, тем более находиться в строгой функциональной связи (т.е. они не должны быть интеркоррелированы). Разновидностью интеркоррелированности факторов является мультиколлинеарность - тесная линейная связь между факторами.

Мультиколлинеарность может привести к нежелательным последствиям:

1) оценки параметров становятся ненадежными. Они обнаруживают большие стандартные ошибки. С изменением объема наблюдений оценки меняются (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

2) затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл;

3) становится невозможным определить изолированное влияние факторов на результативный показатель.

Мультиколлинеарность имеет место, если определитель матрицы межфакторной корреляции близок к нулю:

Если же определитель матрицы межфакторной корреляции близок к единице, то мультколлинеарности нет. Существуют различные подходы преодоления сильной межфакторной корреляции. Простейший из них - исключение из модели фактора (или факторов), в наибольшей степени ответственных за мультиколлинеарность при условии, что качество модели при этом пострадает несущественно (а именно, теоретический коэффициент детерминации - R2y (x1…xm) снизится несущественно).

Определение факторов, ответственных за мультиколлинеарность, может быть основано на анализе матрицы межфакторной корреляции. При этом определяют пару признаков-факторов, которые сильнее всего связаны между собой (коэффициент линейной парной корреляции максимален по модулю). Из этой пары в наибольшей степени ответственным за мультиколлинеарность будет тот признак, который теснее связан с другими факторами модели (имеет более высокие по модулю значения коэффициентов парной линейной корреляции).

Еще один способ определения факторов, ответственных за мультиколлинеарность основан на вычислении коэффициентов множественной детерминации (R2xj (x1,…, xj-1, xj+1,…, xm)), показывающего зависимость фактора xj от других факторов модели x1,…, xj-1, x j+1,…, xm. Чем ближе значение коэффициента множественной детерминации к единице, тем больше ответственность за мультиколлинеарность фактора, выступающего в роли зависимой переменной. Сравнивая между собой коэффициенты множественной детерминации для различных факторов можно проранжировать переменные по степени ответственности за мультиколлинеарность.

При выборе формы уравнения множественной регрессии предпочтение отдается линейной функции:

yi =a+b1·x1i+ b2·x2i+ … + bm·xmi+ui

в виду четкой интерпретации параметров.

Данное уравнение регрессии называют уравнением регрессии в естественном (натуральном) масштабе. Коэффициент регрессии bj при факторе хj называют условно-чистым коэффициентом регрессии. Он измеряет среднее по совокупности отклонение признака-результата от его средней величины при отклонении признака-фактора хj на единицу, при условии, что все прочие факторы модели не изменяются (зафиксированы на своих средних уровнях).

Если не делать предположения о значениях прочих факторов, входящих в модель, то это означало бы, что каждый из них при изменении х j также изменялся бы (так как факторы связаны между собой), и своими изменениями оказывали бы влияние на признак-результат.

Расчет параметров уравнения линейной множественной регрессии

Параметры уравнения множественной регрессии можно оценить методом наименьших квадратов, составив и решив систему нормальных линейных уравнений.

Кроме того, для линейной множественной регрессии существует другой способ реализации МНК при оценке параметров - через b - коэффициенты (через параметры уравнения регрессии в стандартных масштабах).

Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:

где х ji - значение переменной хj i в i-ом наблюдении.

Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение s. Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:

Для оценки b-коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид:

rx 1 y=b 1+rx1 x2• b2+ … + rx 1 xm•b m

rx 2 y= rx 2 x1• b1+b 2+ … + rx2 xm•b m

rxmy = rxmx 1•b 1+rxmx2• b 2+ … + bm

Найденные из данной системы b-коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:

Показатели тесноты связи факторов с результатом.

Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат. К таким показателям тесноты связи относят: частные коэффициенты эластичности, b - коэффициенты, частные коэффициенты корреляции.

Частные коэффициенты...

Другие файлы:

Построение двухфакторной модели, моделей парной линейной прогрессии и множественной линейной регрессии
Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Постр...

Построение классической линейной модели множественной регрессии
Анализ влияния основных социально-экономических показателей на результативный признак. Особенности классической линейной модели множественной регресси...

Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели
Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическ...

Многомерный статистический анализ в экономических задачах
Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной коррел...

Линейная модель множественной регрессии
Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления н...