Многомерные статистические методы и их применение в экономике

Тип: курсовая работа
Категория: ПРОГРАММИРОВАНИЕ

Скачать

Купить

Классификация без обучения и кластерный анализ. Расстояние между кластерами. Функционалы качества разбиения. Иерархические кластерные процедуры. Дискриминантный анализ. Решение задач дискриминантного анализа в системе компьютерной математики Mathcad.
Краткое сожержание материала:

Размещено на

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Смоленский государственный университет»

Кафедра математики и информатики

Курсовая работа

Многомерные статистические методы и их применение в экономике

Выполнила:

студентка 3 курса

факультета экономики и управления

специальности

«Прикладная информатика в менеджменте»

Романенкова Зоя Владимировна

Научный руководитель:

Анищенкова Надежда Геннадьевна,

Смоленск - 2012

Содержание

Введение

Глава 1. Теоретическая часть

1.1 Классификация без обучения. Кластерный анализ

1.1.1 Основные понятия

1.1.2 Расстояние между кластерами

1.1.3 Функционалы качества разбиения

1.1.4 Иерархические кластер - процедуры

1.2 Дискриминантный анализ

1.2.1 Методы классификации с обучением

1.2.2 Линейный дискриминантный анализ

1.2.3Дискриминантный анализ при нормальном законе распределения показателей

1.3 Применение СКМ Mathcad при решении задач дискриминантного анализа

Глава 2. Решение задач дискриминантного анализа в системе компьютерной математики Mathcad

Заключение

Список используемой литературы

Введение

Методов многомерного анализа данных много, но они разрозненные, и, как правило, несводимые в единое целое. Соответственно, актуальность исследования определяется широкими возможностями применения методов многомерного статистического анализа, и в частности дискриминантного анализа, при принятии управленческих решений.

Практическая значимость исследования заключается в возможности автоматизации громоздких вычислительных операций при решении задач дискриминантного анализа.

Объектом исследования является решение задач дискриминантного анализа.

Предметом исследования является разработка шаблона в СКМ Mathcad для решения широкого круга задач дискриминантного анализа.

Цель исследования: изучить один из методов многомерного статистического анализа и возможность его реализации в СКМ Mathcad.

Сформировав объект, предмет и цель исследования определим основные задачи исследования:

- пользуясь литературой, изучить один из методов многомерного статистического анализа - дискриминантный анализ;

- ознакомиться с возможностями применения СКМ Mathcad для реализации метода дискриминантного анализа;

- решить 3-4 задачи экономического содержания методом дискриминантного анализа в СКМ Mathcad.

Глава 1. Методы многомерной классификации

1.1. Классификация без обучения. Кластерный анализ

1.1.1 Основные понятия

В статистических исследованиях группировка первичных данных является основным приемом решения задачи классификации, а значит и основой всей дальнейшей работы с собранной информацией.

Традиционно эта задача решается следующим образом. Из множества признаков, описывающих объект, отбирается один, наиболее информативный с точки зрения исследователя, и производится группировка в соответствии со значениями данного признака. Если требуется провести классификацию по нескольким признакам, ранжированным между собой по степени важности, то сначала производится классификация по первому признаку, затем каждый из полученных классов разбивается на подклассы по второму признаку, и т.д. Подобным образом строится большинство комбинационных статистических группировок.

В тех случаях, когда упорядочить классификационные признаки не представляется возможным, применяется наиболее простой метод многомерной группировки создание интегрального показателя (индекса), функционально зависящего от исходных признаков, с последующей классификацией по этому показателю.

Развитием этого подхода является вариант классификации по нескольким обобщающим показателям (главным компонентам), полученным с помощью методов факторного анализа.

При наличии нескольких признаков (исходных или обобщенных) задача классификации может быть решена методами кластерного анализа, которые от других методов многомерной классификации отличаются отсутствием обучающих выборок, т.е. априорной информации о распределении генеральной совокупности, которая представляет собой вектор Х.

Различия между схемами решения задач классификации во многом определяются тем, что понимают под понятиями "сходство" и "степень cxoдства".

После тoгo, как сформулирована цель работы, необходимо попытаться определить критерии качества, целевую функцию, значения которой позволят сопоставить различные схемы классификации.[4, 5-10]

В экономических исследованиях целевая функция, как правило, должна минимизировать некоторый параметр, определенный на множестве объектов (например, целью классификации оборудования может явиться группировка, минимизирующая совокупность затрат времени и средств на ремонтные работы)

В случаях, когда формализовать цель задачи не удается, критерием качества классификации может служить возможность содержательной интерпретации найденных групп.

Рассмотрим следующую задачу. Пусть исследуется совокупность n объектов, каждый из которых характеризуется по k замеренным на нем признакам Х. Требуется разбить эту совокупность на однородные в некотором смысле группы (классы). При этом практически отсутствует априорная информация о характере распределения измерений Х внутри классов.[10, 23-26]

Полученные в результате разбиения группы обычно называются кластерами (от англ. сluster - гpyппa элементов, характеризуемых каким-либо общим свойством), а также таксонами (от англ. taxon - систематизированная группа любой категории) или образами. Методы нахождения кластеров называются кластер-анализом (соответственно численной таксономией или распознаванием образов с самообучением).

При этом с самого начала необходимо четко представить, какая из двух задач классификации подлежит решению. Если решается обычная задача типизации, то совокупность наблюдений разбивают на сравнительно небольшое число областей группирования (например, интервальный вариационный ряд в случае одномерных наблюдений) так, чтобы элементы одной такой области по возможности находились друг от друга на небольшом расстоянии.

Решение другой задачи типизации заключается в определении естественного расслоения исходных наблюдений на четко выраженные кластеры, лежащие друг от друга на некотором расстоянии.

Если первая задача типизации всегда имеет решение, то при второй постановке может оказаться, что множество исходных наблюдений не обнаруживает естественного расслоения на кластеры, т.е. образует один кластер.[7,352-353]

Несмотря на то, что многие методы кластерного анализа довольно элементарны, применение методов кластерного анализа стало возможным только в 80-e годы с возникновением и развитием вычислительной техники. Это объясняется тем, что эффективное решение задачи поиска кластеров требует большего числа арифметических и логических операций. Pacсмотрим три различных подхода к проблеме кластерного анализа: эвристический, экстремальный и статистический.

Эвристический подход характеризуется отсутствием формальной модели изучаемого явления и критерия для сравнения различных решений. Его основой является алгоритм, построенный исходя из интуитивных соображений.

При экстремальном подходе также не формулируется исходная модель, а задается критерий, определяющий качество разбиения на кластеры. Такой подход особенно полезен, если цель исследования четко определена. В этом случае качество разбиения может измеряться эффективностью выполнения цели.

Основой статистического подхода решения задачи кластерного анализа является вероятностная модель исследуемого процесса. Статистический подход особенно удобен для теоретического исследования проблем, связанных с кластерным анализом. Кроме тoгo, он дает возможность ставить задачи, связанные с воспроизводимостью результатов кластерного анализа.

Рассмотрим формы представления исходных данных и определение мер близости. [4,34-36]

В задачах кластерного анализа обычной формой представления исходных данных служит прямоугольная таблица, каждая строка которой представляет результат измерения k рассматриваемых признаков на одном из обследованных объектов:

В конкретных ситуациях может представлять интерес как группировка объектов, так и гpуппировка признаков. В случаях, когда разница между этими двумя задачами несущественна,...

Другие файлы:

Многомерные статистические методы и основы эконометрики.
Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы и основы эконометрики. / Учебное пособие./ Московский государственный универ...

Многомерные статистические методы
Рассматриваются многомерные генеральная и выборочная совокупности, корреляционный, регрессионный, компонентный, факторный анализ, канонические корреля...

Многомерные статистические методы и эконометрика
Определение с помощью статистических и эконометрических методов совокупности показателей по пяти признакам, собранных по 84 регионам РФ: обеспеченност...

Статистические методы обработки данных
Основные методы обработки данных, представленные выборкой. Графические представления данных. Расчет с помощью ЭВМ основных характеристик выборки. Стат...

Компьютерный практикум по прикладной статистике и основам эконометрики
Практикум предназначен для студентов экономических направлений подготовки, изучающих теорию вероятностей, математическую статистику, эконометрику, мно...