Практическое занятие № 3. РЯДЫ РАСПРЕДЕЛЕНИЯ В СТАТИСТИКЕ
Тема – Ряды распределения в статистике
Продолжительность – 4 часа
Цель – Научиться оценивать и анализировать средние величины вариационных рядов распределения
СОДЕРЖАНИЕ:
МЕТОДИЧЕСКИЕ УКАЗАНИЯ
К средним величинам вариационного ряда распределения относятся показатели мода и медиана.
Мода – это значение признака, наиболее часто встречающийся в изучаемой совокупности, то есть вариант с наибольшей частотой.
В интервальных вариационных рядах сначала находят модальный интервал. В найденном модальном интервале конкретное значение моды определяется по формуле:
Mo = Xмo + d ∙ {(f2-f1) / [(f2-f1)+(f2-f3)]} - (1)
Xмo – нижняя граница модального интервала
d – величина интервала
f1, f2, f3 – частоты предмодального, модального и постмодального интервалов.
Показатель мода широко применяется в коммерческой деятельности.
Медиана – это значение признака, приходящегося на середину ранжированной (упорядоченной) совокупности.
Медиана указывает центр распределения единиц совокупности и делит на две равные части. При отыскании медианы сначала определяется её
порядковый номер в ряду распределения.
При нечетном числе единиц в ряду применяется формула:
XME = (Σfi + 1) / 2 - (2)
Σfi – суммарный объем совокупности
При четном числе единиц в ряду применяется формула (то есть полусумма из двух соседних центральных значений):
XME = Σfi / 2 - (3)
В интервальном ряду, зная порядковый номер медианы по накопленным частотам отыскивается медианный интервал,
в котором определяется конкретное значение медианы по формуле:
ME = XME + d ∙ {[(Σfi : 2) – SME-1] / fME} - (4)
ХМЕ – нижняя граница медианного интервала
d – величина интервала
SME-1 – частота, накопленная до медианного интервала
FME – частота медианного интервала
Σfi – суммарный объем совокупности
Медиана используется при контроле качества продукции и технологического процесса на промышленном предприятии, при изучении
распределения домохозяйств по величине дохода и т.д.
1. Определение моды и медианы по несгруппированным данным.
Девять (9) торговых предприятий реализует товар А по следующим ценам:
Номер предприятия | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
Цена, руб. | 4,4 | 4,3 | 4,4 | 4,5 | 4,3 | 4,3 | 4,6 | 4,2 | 4,6 |
Из таблицы видно, что чаще всего встречается цена 4,3 руб. Она и будет модальной.
Для определения медианы необходимо провести ранжирование (упорядочивание) цифрового ряда:
4,2; 4,3; 4,3; 4,3; 4,4; 4,4; 4,5; 4,6; 4,6
Центральной в этом ряду является цена 4,4. Следовательно данная цена и будет медианной.
Определение моды и медианы по сгруппированным данным.
Определить моду по дискретному вариационному ряду.
Распределение торговых предприятий города по уровню розничных цен на товар А имеет следующий вид
Группы | Цена, руб. | Количество магазинов |
---|---|---|
Первая | 52 | 12 |
Вторая | 53 | 48 |
Третья | 54 | 56 |
Четвертая | 55 | 60 |
Пятая | 56 | 14 |
Итого | - | 190 |
Из таблицы видно, что наибольшую частоту (60 предприятий) имеет цена 55 руб., следовательно, она и является модальной.
Для определения медианного значения признака по формуле (2) находим номер медианной единицы ряда
XME = (Σfi + 1) / 2 = (190+1) = 95,5
Полученное дробное значение (всегда имеет место при четном числе единиц совокупности), указывает, что точная середина находится между
95 и 96 предприятиями.
Необходимо определить, в какой группе находятся предприятия с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты.
В первой группе нет магазинов с этими номерами, где всего 12 торговых предприятий.
Вторая группа = 12+48 = 60
Третья группа = 12+48+60 = 116,
то есть магазины находятся в третьей группе и, следовательно, медианой является цена 54 рубля.
Вариация - изменение или отклонение.
Вариация наблюдается в пределах однородной совокупности или однородной группы. Вариация используется с применением следующих приемов:
- построение вариационного ряда (ряда распределения);
- графическое изображение;
- исчисление основных характеристик распределения.
Вариационные ряды бывают дискретные и интервальные.
Для признака, который имеет непрерывное изменение и небольшое количество значений, применяется построение дискретного ряда, который состоит из двух граф:
значений признака и численности единиц с определенным значением признака, то есть вариант и частот.
Если вариационный ряд дан с непрерывными интервалами, то для правильного представления о характере распределения необходимо произвести расчет
абсолютной или относительной плотности распределения.
Абсолютная плотность распределения (Р) – это величина частоты, приходящейся на единицу размера интервала отдельной группы ряда
Р = f / d - (5)
Р – абсолютная площадь распределения
f – частота интервала
d – величина интервала.
Для оценки вариации используются следующие показатели:
1. Размах вариации
R = Xmax – Xmin - (6)
Xmax – максимальное значение признака
X min – минимальное значение признака
2.Среднее линейное отклонение
- простое, для не сгруппированных данных
a = (ǀΣXi -
Х ǀ) / n - (7)
Прямая скобка. Если число положительное, то модуль (абсолютная величина) равен этому числу, если отрицательное, то знак «минус» отбрасывается.
- взвешенное, для сгруппированных данных:
a = (ǀΣXi -
Хǀ ∙fi)/ Σfi - (8)
3. Среднее квадратическое отклонение:
Среднее квадратическое отклонение характеризует разброс варианта относительно средней величины (то есть колеблемость).
Чем больше сигма (σ), тем степень разнообразия данного ряда выше.
- простое
σ = √[∑(Xi – Х )2] / n -
(9)
- взвешенное
σ = √
[∑(Xi – Х )2
∙ ﮲fi] / fi - (10)
В симметричных или умеренно симметричных распределениях соотношение между простым и взвешенным квадратическим отклонениями можно
σ = 1,25а - (11)
Дисперсия (лат. рассеяние) показывает, насколько сильно данные отклоняются от среднего значения. Чем больше дисперсия, тем больше разброс данных.
4. Коэффициент осцилляции.
Осцилляция – это процесс изменения чего-либо, колебание – определяется по формуле:
VR = (R / Х)∙100% - (12)
5. Относительное отклонение определяется по формуле:
Vа = (а / Х )∙100% - (13)
6. Коэффициент вариации определяется по формуле:
Vσ = (σ / Х )∙100% - (14)
Наиболее эффективным показателем является коэффициент вариации, который применяют не только для сравнения вариации, но и для характеристики
однородной совокупности.
Принята следующая оценка колеблемости признака:
≤ 33% - колеблемость нормальная, совокупность однородная;
≤ 40% - колеблемость незначительная;
≤ 60% - колеблемость средняя (умеренная);
> 60% - колеблемость значительная
Показатели центральной тенденции (средняя величина и медиана) и показатели вариации – это частные случаи единой системы статистических
характеристик распределения. Единая система характеристик может быть представлена моментами статистического распределения.
Общая формула центральных моментов k-го порядка имеет вид:
Мк = [Σ(Xi – Х)к
∙ fi] / Σfi - (15)
1. Центральный момент нулевого порядка равен единице при k=0
М0 = [Σ(Xi – Х )0
∙ fi] / Σfi = 1 - (16)
2. Центральный момент первого порядка равен нулю при k=1:
М1 = [Σ(Xi – Х )1
∙ fi] / Σfi = 1 - (17)
3. Центральный момент второго порядка представляет собой дисперсию распределения при k=2:
М2 = [Σ(Xi – Х )2
∙ fi] / Σfi = σ2 - (18)
4. Центральный момент третьего порядка имеет вид:
М3 = [Σ(Xi – Х )3
∙ fi] / Σfi - (19)
5. Центральный момент четвертого порядка определяется по формуле:
М4 = [Σ(Xi – Х )4
∙ fi] / Σfi - (20)