Ряды распределения и аналитические группировки
Задача 2. Постройте ряд распределения студентов по успеваемости: 2, 3, 3, 4, 2, 5, 5, 3, 3, 4, 5, 4, 5, 5, 5, 4, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 4, 4, 4. Подсчитайте локальные и накопительные частоты. Постройте полигон и кумуляту распределения. Определите моду, медиану, среднюю, дисперсию, среднее квадратическое отклонение, коэффициент вариации.Решение:Ряд распределения – это ряд чисел, в котором значение изучаемого признака (варианты), расположены в определенном порядке: либо в порядке возрастания, либо убывания. Наряду с вариантами ряд распределения включает и частоты – величины, показывающие сколько раз каждая варианта встречается в данной совокупности. Сумма частот равна объему совокупности. Таким образом, ряд распределения состоит из вариант (х) и частот (f) В зависимости от прерывности или непрерывности варьирующего признака ряды распределения удобно представлять в виде двух разновидностей: дискретного и вариационного (интервального). Дискретный ряд представляет собой ряд прерывных чисел. Например, распределение студентов по успеваемости (табл. 1). При непрерывной вариации распределение признака называется интервальным. Частоты относятся ко всему интервалу. В зависимости от вида ряда распределения по-разному можно изобразить их графически. Если ряд дискретный – строится полигон распределения. Величина признака откладывается на оси абсцисс, частоты – на оси ординат. Вершины ординат соединяются прямыми линиями. Гистограмма распределения отличается от полигона тем, что на оси абсцисс берутся не точки, а отрезки, изображающие интервал, т.е. гистограмма, строится наВ основе вариационного (интервального) ряда. По накопленным частотам строится кумулятивная кривая (кумулята). Для определения средней арифметической надо сложить все варианты и полученную сумму разделить на число единиц, входящих в совокупность (объем совокупности). Средняя арифметическая бывает простая и взвешенная. Простая средняя используется тогда, когда каждая варианта встречается лишь один раз (1). Если каждая варианта встречается несколько раз, то следует подсчитать частоты и умножить (взвесить) каждую варианту на соответствующую частоту (2). Простая средняя арифметическая х = (1) Средняя арифметическая взвешенная х = (2) Средний процент влажности найдём по формуле средней арифметической взвешенной:==При расчете средней арифметической для интервального ряда нужно сначала определить середины интервалов как полусуммы значений верхней и нижней границ интервала. При наличии интервалов, где <хоткрыты» верхняя или нижняя граница, величину интервала определяют по последующему или предыдущему интервалу. Для характеристики рядов распределения кроме средней степенной применяются структурные средние: мода и медиана. Мода – варианта, которая наиболее часто встречается в данной совокупности, т.е. варианта с наибольшей частотой. Мо=4Медиана – варианта, находящаяся в середине ряда распределения. Мода для дискретного ряда определяется просто и соответствует варианте с наибольшей частотой.Медиану для дискретного определяют по накопленным частотам делением объема совокупности пополам: по таблице 1 – 30:2=15. Это соответствует медиане, равной 4.Размах вариации – разность между наибольшей и наименьшей вариантой: R==5–2=3Среднее квадратическое отклонение – показатель вариации, измеряющий величину, на которую все варианты в среднем отклоняются от средней арифметической. Квадрат среднего квадратического отклонения называется дисперсией, или средним квадратом отклонений.Найдем дисперсию:2====0,885 – среднее квадратическое отклонение.Наряду с абсолютным показателем колеблемости признака – средним квадратическим отклонением –