Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »ПРОГРАММИРОВАНИЕ

Теоретические распределения данных

Тип: курсовая работа
Категория: ПРОГРАММИРОВАНИЕ
Скачать
Купить
Зависимость функций плотности вероятности, кумулятивного и обратного кумулятивного распределений от их параметров. Представление примеров вычисления вероятностей и доверительных интервалов. Рассмотрено нормального, логнормального, бинарного распределения.
Краткое сожержание материала:

Размещено на

КУРСОВАЯ РАБОТА

по дисциплине:

«Эконометрическое моделирование»

Теоретические распределения данных

Введение

В данной курсовой работе раскрывается тема «Теоретическое распределение данных»: демонстрируется зависимость функций плотности вероятности, кумулятивного и обратного кумулятивного распределений от их параметров. Представлены примеры вычисления вероятностей и доверительных интервалов. Рассмотрены нормальное и логнормальное распределения, распределения Пуассона и бинарное распределение.

Целью работы является изучить различные распределения данных, а также ознакомиться с программой MATLAB.

вероятность распределение доверительный интервал

1. Теоретические распределения данных

Для численного и графического представления теоретических распределений данных в MATLAB имеются 3 типа файл-функций, включающих в свое имя аббревиатуры pdf, cdf или inv, расшифровка и перевод которых даны в следующей таблице:

Полное название >

Использованные в книге термины

pdf

probability density function

функция плотности вероятности

cdf

cumulative distribution function

функция кумулятивного распределения

inv

inverse cumulative distribution function

функция обратного кумулятивного распределения

Файл-функции с указанными аббревиатурами оперируют числовыми переменными среды MATLAB и потому эквивалентны в представлении как непрерывных, так и дискретных распределений. Для дискретных распределений файл-функции pdfs (Probability density functions) вычисляют вероятности значений случайной переменной, для непрерывных - плотность вероятности значений случайной переменной. Еще заметим, в Help MATLAB при повторных или безальтернативных ссылках на файл-функции pdf, cdf и inv чаще используется одно слово distribution, т.е. «распределение».

1.1 Непрерывные распределения

1.1.1 Общие положения

Если задана функция плотности вероятности f (x| а, b,…), где х - случайная переменная, принимающая непрерывный ряд значений, а, b,… - параметры распределения, то функция кумулятивного распределения

F (x|a, b,…)=

определяет вероятность того, что случайная переменная принимает значение, меньшее х.

Аналогично определяются вероятности того, что случайная переменная принимает значение, большее x, и значение, находящееся в интервале [x1, x2]. В краткой форме все три вероятности записывают так:

P (y<x) = F(x), P (y>x) = l-F(x), P(x1?y<x2) = F(x2) - F(x1).

Дифференцирование функции кумулятивного распределения приводит к функции плотности вероятности

f (x|a, b,…)=F (x|a, b,…).

Вероятность попадания случайной переменной в интервал [x1, x2] определяется интегралом от функции плотности вероятности:

Р(x1?у<x2) = x|a, b.) dx.

Нормировка плотности вероятности:

В Help MATLAB принята символическая форма записи функции обратного кумулятивного распределения

x = F-1(p|a, b,…), где p = F (x|a, b,…).

Обратное кумулятивное распределение используется для оценок такого значения xq случайной переменной, при котором функция кумулятивного распределения принимает значение, равное q, т.е.

F(xq,|a, b.)=(x|a, b,…) dx=q.

Из этого уравнения следует, что величина уровня q = P (x?xq) определяет вероятность того, что случайная переменная примет значение, меньшее или равное xq. Величина xq имеет называние «quantile». По-русски слово «квантиль» женского рода с ударением на втором слоге.

Для вычисления квантилей решают интегральное уравнение

xq=F-1(q|a, b,…).

Квантиль x0,5 называется медианой (median), квантили x0,25 и x0,75 - соответственно нижняя квартиль и верхняя квартиль (quartile). Например, медиана вычисляется решением интегрального уравнения

.

Наряду с квантилями используют процентили (percentiles)

xp=xq*100%.

Процентиль х50% также называется медианой, процентили х25% и х75% -соответственно нижняя и верхняя квартиль.

Модой хm случайной величины называют ее значение, при котором функция распределения достигает максимума. Вычисляют моду решением уравнения

.

Еще раз обратим внимание, слова «квантиль», «квартиль», «процентиль», «медиана», «мода» женского рода.

Среднее значение (центр) распределения случайной переменной:

µ=.

Дисперсия (мера рассеяния) случайной переменной определяется как среднее значение квадрата отклонения значений случайной переменной от ее среднего значения,

Dу.

Величину у = = называют стандартным отклонением. При интерпретации статистических результатов предпочтительнее обращаться именно к у, а не к у2, в связи с тем, что величина стандартного отклонения у имеет размерность исследуемой случайной переменной и потому легче воспринимается в качестве количественной характеристики.

Третий центральный момент

M3=

определяет величину

A=

коэффициента асимметрии распределения относительно его среднего. Для значений А<0 данные распределены в большей мере слева от среднего, для А>0 - справа. Для распределений, симметричных относительно среднего, например, нормального, А = 0.

Четвертый центральный момент

M4=

определяет величину

E=-3

коэффициента эксцесса (меру островершинности) распределения.

1.1.2 Нормальное (гауссово) распределение

Функция плотности вероятности

Базовая роль нормального распределения N (µ, у) в анализе статистических данных связана с тем, что если результаты наблюдений определяются большим числом факторов, влияние каждого из которых пренебрежимо мало, то такой массив данных хорошо аппроксимируется нормальным распределением с соответствующим образом подобранными величинами среднего и стандартного отклонения.

Нормальное распределение находит применение в анализе

результатов большинства физических измерений,

финансово-экономических данных и маркетинговых исследованиях,

данных, полученных в результате исследования технологических, социальных, экологических и других процессов.

Функция плотности вероятности нормального распределения

f (x|µ, у)=

со средним значением µ случайной переменной х и стандартным отклонением у представлена в MATLAB файл-функциями normpdf (x, mu, sigma) или pdf ('Normal', x, mu, sigma).

Построить графики плотностей нормальных распределений со средним значением

µ= 0 и стандартными отклонениями у= 1,2,3 (рис. 1.1).

x=-4:0.1:4;

mu=0; sigma=1;

while sigma<=3

f=normpdf (x, mu, sigma);

%f = pdf ('Normal', x, mu, sigma);

plot (x, f, 'k', 'LineWidth', 1.5)

hold on

sigma=sigma+1;

end

title ('Плотность нормального распределения,\mu=0, \sigma=var')

xlabel (' x ')

ylabel (' f ')

text (-0.25, 0.38, '\sigma_1=1');

text (-0.25, 0.18, '\sigma_2=2');

text (-0.25, 0.12, '\sigma_3=3');

Из рис. 1.1 следует, что увеличение стандартного отклонения приводит к расплыванию плотности распределения случайной переменной.

Построить графики плотностей нормальных распределений со средними значениями µ= 0,1,2 и стандартным отклонением у= 1 (рис. 1.2).

x=-4:0.1:4;

mu=0; sigma=1;

while mu<=2

f=normpdf (x, mu, sigma);

plot (x, f, 'k', 'LineWidth', 1.5)

hold on

mu=mu+1;

end

%

title ('Плотность нормального распределения,\mu=...

Другие файлы:

Анализ рядов распределения
Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абс...

Политика распределения продукции СП ООО "Унибокс"
Теоретические аспекты каналов распределения товаров на предприятии. Анализ достоинств и недостатков политики распределения предприятия. Общая характер...

Совершенствование политики распределения предприятия
Теоретические основы политики распределения, понятие и задачи распределительной логистики. Логистические каналы и цепи, виды и структура каналов распр...

Успеваемость студентов по дисциплине "философия"
Интервальный вариационный ряд распределения учащихся по оценкам по философии, кумулята. Гистограмма распределения учащихся. Межквартильное расстояние...

Расчет вероятности событий
Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распре...