Определение статистического ряда. Статистические ряды распределения, их виды

Теория статистики: конспект лекций Бурханова Инесса Викторовна

1. Статистические ряды распределения

В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения.

Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Различают атрибутивные и вариационные ряды распределения.

Атрибутивный – это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах – в виде долей, удельных весов, представленных в процентах к итогу.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

В интервальном вариационном ряде распределения группиро–вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

Вариационные ряды состоят из двух элементов: частоты и варианты.

Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота – это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

Плотность распределения – это отношение числа единиц совокупности к ширине интервала.

автора Щербина Лидия Владимировна

15. Статистические таблицы Статистическая таблица – таблица, которая дает количественную характеристику статистической совокупности и представляет собой форму наглядного изложения полученных в результате статистической сводки и группировки числовых (цифровых)

Из книги Общая теория статистики автора Щербина Лидия Владимировна

19. Статистические карты Статистические карты представляют собой вид графических изображений статистических данных на схематичной географической карте, характеризую–щих уровень или степень распространения того или иного явления на определенной территории.

Из книги Общая теория статистики автора Щербина Лидия Владимировна

38. Ряды агрегатных индексов с постоянными и переменными весами При изучении динамики экономических явл* ний строятся и исчисляются индексы за ряд последов тельных периодов. Они образуют ряды либо бази ных, либо цепных индексов. В ряду базисных индексе сравнение

автора Шерстнева Галина Сергеевна

6. Статистические термины Статистическая информация, получаемая в результате наблюдения, необходима для предоставления органам государственного управления, для обеспечения информацией руководителей предприятий, компаний и т. д., для информирования общественности об

Из книги Финансовая статистика автора Шерстнева Галина Сергеевна

44. Статистические методы Особенно широко используются статистические методы при изучении финансовых инвестиций. В основе изучения финансовых инвестиций лежит построение уравнения эквивалентности, так называемого баланса финансовой операции. Содержание данного

Из книги Финансовая статистика автора Шерстнева Галина Сергеевна

45. Статистические модели Для эффективной работы на фондовом рынке необходимо знать, как доходность конкретного наименования акций (или портфеля акций конкретного инвестора) связана со средней рыночной доходностью всей совокупности акций, т. е. с рыночным индексом. Для

автора Коник Нина Владимировна

3. Статистические таблицы После того как данные статистического наблюдения собраны и даже сгруппированы, их трудно воспринимать и анализировать без определенной, наглядной систематизации. Результаты статистических сводок и группировок получают оформление в виде

Из книги Общая теория статистики: конспект лекции автора Коник Нина Владимировна

4. Ряды агрегатных индексов с постоянными и переменными весами При изучении динамики экономических явлений строятся и исчисляются индексы за ряд последовательных периодов. Они образуют ряды либо базисных, либо цепных индексов. В ряду базисных индексов сравнение

автора

18. Статистические ряды распределения и их графическое изображение Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.Различают атрибутивные и вариационные ряды

Из книги Теория статистики автора Бурханова Инесса Викторовна

19. Статистические таблицы В виде статистических таблиц оформляются результаты сводки и группировки материалов наблюдения.Статистическая таблица – это особый способ краткой и наглядной записи сведений об изучаемых общественных явлениях. Статистическая таблица

Из книги Купить ресторан. Продать ресторан: от создания к продаже автора Горелкина Елена

Статистические методы Подсчет в толпе. Метод, честно говоря, наивный, но очень популярный. Организатор ресторанного бизнеса берет блокнот и карандаш, становится у двери похожего заведения в равноценном районе и считает, сколько человек проходит мимо в единицу времени.

автора Бурханова Инесса Викторовна

1. Статистические ряды распределения В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения.Статистические ряды распределения представляют собой упорядоченное расположение единиц

Из книги Теория статистики: конспект лекций автора Бурханова Инесса Викторовна

3. Статистические таблицы В виде статистических таблиц оформляются результаты сводки и группировки материалов наблюдения.Статистическая таблица – это особый способ краткой и наглядной записи сведений об изучаемых общественных явлениях. Статистическая таблица

Из книги Теория статистики: конспект лекций автора Бурханова Инесса Викторовна

ЛЕКЦИЯ № 10. Ряды динамики и их изучение в коммерческой деятельности 1. Основные понятия о рядах динамики Все процессы и явления, протекающие в общественной жизни человека, являются предметом изучения статистической науки они находятся в постоянном движении и

Из книги Столетие войны. (Англо-американская нефтяная политика и Новый Мировой Порядок) автора Энгдаль Уильям Фредерик

Глава 6 АНГЛО-АМЕРИКАНЦЫ СМЫКАЮТ РЯДЫ Генуэзская конференция16 апреля 1922 года на генуэзской вилле «Альберта» немецкая делегация, присутствовавшая на послевоенной международной конференции по экономике, взорвала бомбу, ударная волна от которой докатилась до другого

Из книги Бизнес-план на 100%. Стратегия и тактика эффективного бизнеса автора Абрамс Ронда

Международные статистические данные Интернет существенно упростил сбор данных в мировом масштабе. В большинстве развитых и многих развивающихся странах обеспечен интернет-доступ к статистической информации. В свободном доступе размещают свои данные и международные

Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется только одним признаком .

В таблице 2 (только число банков) – малая выборка – простейший ряд.

Пример: с детьми, которых в разное время во дворе было: 9 10 11 8 8 9 9 11 11. Ранжируем от min к max и получаем:

Пример 2. : со студентами в аудитории.

Таблица 0

Распределение числа студентов группы 302

Число студентов (чел.)

Итого:

Статистический ряд распределения – это упорядоченный ряд распределения единиц совокупности на группы по определенному варьирующему признаку.

Выделяются 2 вида рядов:

1. атрибутивный

Например: таблица 0 Распределения числа студентов группы 302 по полу (женский, мужской), число, % (нумерация столбцов обязательна).

Строится по качественному признаку, которые не имеет числового выражения. Такие ряды характеризуют совокупность по изучаемому признаку.

2. вариационный

Построен по количественному признаку, причем признак располагается в порядке возрастания или убывания значения признака, т.е. ряд должен быть проранжирован.

Характеристики ряда распределения:

1. x – вариант(а) – это значение признака в вариационном ряду, т.е. те значения, которые принимает группировочный признак;

2. f – частота – показывает сколько раз в совокупности встречается данное значение признака.

Пример 3. : Дети гуляли во дворе. В определенное время их было: 9 10 11 8 8 9 9 11 11. Ранжируем ряд от меньшего к большему и увидим сколько раз встречается тот или иной вариант.

Сумма всех частот равна сумме элементов ряда

Иногда для характеристики ряда используют частости – частоты, выраженные в % или долях 1,0 .

В любом случае Wi – частоты = 100% или Wi – частоты = 1 доле.

(см. табл. 0: 83,3+16,7 = 100,0%)

(см. табл. 0: 0,83+0,17 = 1,00).

В зависимости от характера вариационного признака вариационные ряды подразделяются на дискретные и интервальные .

В дискретных рядах варианты представлены в виде целых чисел и их значения можно пересчитать.

Пример 4:

Таблица 4

Распределение семей по числу детей

Число детей в семье (чел.)

Количество семей (ед.)

S (накопленные частоты)

Итого:

Интервальный ряд – это ряд, в кот. значение признака выражен в виде интервалов.

В интервальных рядах признак может меняться непрерывно (от min к max), причем отличаются друг от друга на сколь угодно малую величину .

Интервальные ряды применяются в тех случаях, если значение признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов достаточно велико.

Правила построения рядов, выбор количества групп и величин интервалов также как и при группировке.

Таблица 5

Распределение сотрудников предприятия по размерам месячной заработной платы, руб.

Зарплата (руб.)

Число сотрудников (чел.)

Накопленные частоты

Итого:

Кроме частот используются накопленные частоты или накопленные частости.

Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S.

Накопительные частоты называются аккумулированными частотами , они показывают сколько элементов ряда имеют значение до определенного ряда.

Несистематизированные данные, собранные в процессе статистического наблюдения, образуют первичный ряд данных. При достаточно большом объеме совокупности первичный ряд данных становится трудно обозримым и непосредственное его рассмотрение не может дать представления о распределении единиц совокупности по величине признака.

Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов ряда (значений признака) в возрастающем или убывающем порядке. Ранжирование данных позволяет:

  • сразу увидеть максимальное и минимальное значения признака в совокупности и оцепить разницу между ними (Х тах - X min);
  • определить число повторений отдельных вариантов ряда (частоту).

В результате первичный неупорядоченный ряд данных преобразуется в упорядоченный ряд, в котором будет отражено число повторений каждой варианты:

Этот ряд называется статистическим рядом распределения. Он характеризует состав и структуру изучаемого явления, позволяет судить о степени однородности изучаемой совокупности, закономерности и границах варьирования анализируемого признака.

Элементами статистического ряда распределения являются варианты X, и частоты / (абсолютная величина числа повторений г-й варианты).

Для характеристики структуры совокупности используется показатель, который называется частостью (4) и определяется по формуле

Из определения частоты и частости следуют следующие равенства: где N - объем совокупности.

Ряд распределения может быть получен в результате группировки. Ряды распределения могут быть атрибутивными и вариационными.

Атрибутивным рядом является статистический ряд распределения, который построен по атрибутивному признаку. В качестве примера такого ряда можно рассматривать, в частности, распределение рабочих цеха предприятия по профессиям (табл. 3.2).

Распределение рабочих цеха по профессиям

Вариационным рядом является статистический ряд распределения, который построен по количественному признаку. Вариационный ряд можно считать дискретным рядом, если признак, по котором}" он построен, соответственно является дискретным. Вариационный ряд распределения также может быть и интервальным, если признак, по которому он построен, является непрерывным. В качестве примера такого ряда можно привести распределение рабочих цеха или предприятия по уровню квалификации (табл. 3.3).

Таблица 3.3

Распределение рабочих цеха по уровню квалификации

В качестве примера интервального ряда распределения можно привести пример распределения предприятий по объему производства (см. параграф 3.3). Интервальное распределение при этом выполняется в процессе построения соответствующей аналитической группировки, представленной в табл. 3.4.

Интервальный ряд распределения, наряду с дискретным рядом распределения, позволяет выявить и исследовать структуру изучаемого явления (объекта наблюдения).

Таблица 3.4

Распределение предприятий по объему производства продукции

Группы предприятий но объему производства, млн руб.

Количество

предприятий

(частота)

Удельный вес в общем количестве пред!хриятий

Накопленная

Xi

А

А

d,

Статистический ряд распределения можно рассматривать как обязательный итог любой статистической группировки. При построении рядов распределения число групп и длина интервала определяются по правилам, применяемым при выполнении статистических группировок (см. параграф 3.2).

Для наглядности и лучшего понимания статистические ряды распределения могут быть представлены не в табличном, а в графическом виде.

Наиболее часто графический вид рядов распределения используется для отображения вариационных статистических рядов распределения.

Для отображения дискретного ряда используют линейные диаграммы, которые называются полигонами распределения. При построении полигона распределения в прямоугольной системе координат на оси абсцисс откладывают варианты (значения) анализируемого признака. На оси ординат откладывают частость распределения вариантов или значений признака. Целесообразность отображения на оси ординат частостей объясняется следующим:

  • это наиболее удобный способ при большом объеме исследуемой статистической совокупности;
  • это дает возможность в рамках одного графика изображать статистические ряды распределения двух и более признаков с разным числом единиц совокупности.

Пересечение точек по оси абсцисс и оси ординат образует ломаную линию, которая и представляет собой полигон распределения (рис. 3.1 - на основе данных табл. 3.3).

Для графического отображения интервального ряда, как правило, используют столбиковые диаграммы, которые принято в данном случае называть гистограммами.

Можно построить гистограмму интервального ряда распределения предприятий по объему производства продукции (см. габл. 3.4). Ось абсцисс в данном случае представляет собой отрезки, равные величине интервалов ряда распределения (в принятом масштабе). Далее на этих отрезках строят прямоугольники, которые по высоте, откладываемой по оси ординат, равны частоте или частости каждого интервала (рис. 3.2).


Рис. 3.1.


Рис. 3.2.

Для решения таких задач, как определение структурных средних, наблюдение за процессом концентрации изучаемого явления и т.п., ряды распределения принято преобразовывать в кумулятивные ряды, которые выстраиваются в зависимости от накопленных частот или частостей. Правило расчета накопления частот (частостей) каждого интервала ряда распределения достаточно простое. Накопление частот (частостей) рассчитывается как сумма частоты (частости) данного интервала и частот (частостей) всех интервалов, предшествующих данному интервалу.

В качестве примера построения кумулятивного ряда возьмем данные табл. 3.4 из последней графы (см. накопленная частота s,) и построим соответствующую диаграмму (рис. 3.3).

При построении кумулятивных рядов в прямоугольной системе координат на оси абсцисс откладывают верхние границы интервалов ряда распределения, а на оси ординат - накопленные частоты (частости), которые соответствуют этим интервалам.


Рис. 3.3.

С использованием кумуляты может быть проиллюстрирован процесс концентрации, где наряду с накоплением частот (частостей) имеются в статистическом ряду распределения и суммы накопленных группировочных (или иных важных) признаков изучаемого явления. Такие кривые, которые отражают процесс концентрации, называют кривыми Лоренца.

Так, если обратиться к данным табл. 3.4 и рис. 3.3, то можно отметить, что накопленная частота второго интервала свидетельствует о том, что семь предприятий из 25 производят около 19% всего объема продукции, при этом каждое из семи предприятий имеет объем производства не более 8,2 млн руб. и эти семь предприятий составляют 28% общего количества рассмотренных предприятий.

Самым важным требованием из всех, которые могут быть предъявлены к построению статистических рядов распределения, является требование сопоставимости во времени и в пространстве данных об интервалах. При этом вполне понятно, что в рядах с равными интервалами это требование выполняется автоматически. В тех рядах распределения, интервалы которых не равны, принято рассчитывать плотность распределения как частное от деления частоты интервала на его длину. В графическом отображении рядов распределения с неравными интервалами на оси ординат принято откладывать нс частоты (частости), а значения плотности распределения.

Для облегчения построения группировок и графических отображений статистических рядов могут быть использованы редакторы электронных таблиц (например, Excel ).

  • См.: Макарова Н. В., Трофимец В. С. Статистика в Excel. М.: Финансы и статистика,2009; и другие подобные издания.

Введение

С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления. Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития. Данные, учитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.

Руководствуясь соображениями зависимости благосостояния нации от величины создаваемого полезного продукта, интересов стратегической безопасности государств и народов от численности взрослого мужского населения, доходов казны от размера налогооблагаемых ресурсов и т. д., издавна отчетливо осознавалась и реализовывалась в форме различных учетных акций.

С учетом достижений экономической науки стал возможен расчет показателей, обобщенно характеризующих результаты воспроизводственного процесса на уровне общества: совокупного общественного продукта, национального дохода, валового национального продукта.

Всю перечисленную информацию в постоянно возрастающих объемах предоставляет обществу статистика, являющаяся необходимо принадлежностью государственного аппарата. Статистические данные, таким образом, способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.

Для статистического анализа данных в своей работе я использовала программу Excel (расчет формул и построение графиков).

Статистические ряды распределения, их значение и применение в статистике

В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения. В них известна численность единиц наблюдения в группах. Представленная в абсолютном и относительном выражении.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Статистические ряды подразделяются на:

Атрибутивные - это ряды, построенные по атрибутивным признакам, в порядке возрастания или убывания наблюдаемых знаний.

То есть качественным признакам, не имеющим числового выражения и характеризующим свойство, качество изучаемого социально-экономического явления.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам.

Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Число групп атрибутивного ряда распределения адекватно числу градаций. Разновидностей атрибутивного признака.

Пример атрибутивного ряда распределения приведен в таблице 1.

Таблица 1. Распределение студентов 1-го курса по успеваемости

Элементами данного ряда распределения являются градации атрибутивного признака «Успеваемость» («успевают» - «не успевают») и численность каждой группы в абсолютном (человек) и относительном (%) выражении.

Студентов, сдавших экзамен по дисциплине, было 46 человек. Их удельный вес составил 92%.

Вариационные - это ряды, построенные по количественному признаку.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот:

Варианты - это числовые значения количественного признака в вариационном ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты положительные - это прибыль, а отрицательные числа - это убыток.

Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяется числом элементов всей совокупности.

Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные.

Дискретный вариационный ряд распределения - это ряд, в котором группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

Пример дискретного вариационного ряда распределения приведен в таблице 2.

Таблица 2. Распределение студентов по экзаменационному баллу

В гр. 1 таблицы 2 представлены варианты дискретного вариационного ряда. В гр. 2 - частоты, а в гр. 3 - частости. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенным пределах любые значения. Отличающиеся друг от друга на сколь угодно малую величину.

Интервальный вариационный ряд распределения - это ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения, в том числе и дробные.

Интервальный ряд распределения целесообразно строить, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.

Правила и принципы построения интервальных рядов распределения аналогичны правилам и принципам построения статистических группировок. В случае, если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. При построении неравных интервалов нельзя получить информацию о степени заполнения каждого интервала. С целью проведения сравнительного анализа заполненности интервалов определяется показатель, характеризующий плотность распределения. Это отношение числа единиц совокупности к ширине интервала.

Пример интервального вариационного рада распределения приведен в таблице 3.

Таблица 3. Распределение строительных фирм региона по среднесписочной численности работающих*

* - Цифры условные

Представленный ряд распределения является интервальным, в основании образования групп которого лежит непрерывный признак.

Анализ рядов распределения можно для наглядности проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Расчетная часть задания № 5

Имеются выборочные данные (выборка 5%-я механическая) о среднегодовой стоимости основных производственных фондов и выпуске продукции предприятий отрасли экономики за отчетный период.

Таблица 4. Исходные данные

Выпуск продукции, млн. руб.

По исходным данным:

1. Постройте статистический ряд распределения предприятий по среднегодовой стоимости основных производственных фондов, образовав четыре группы предприятий с равными интервалами, охарактеризовав их числом предприятий и удельным весом предприятий.

2. Рассчитайте обобщающие показатели ряда распределения:

а) среднегодовую стоимость основных производственных фондов, взвешивая значения признака по абсолютной численности предприятий и их удельному весу;

б) моду и медиану;

в) постройте графики ряда распределения и определите на них значение моды и медианы.

Решение:

1. Сначала определяем длину интервала по формуле:

е=(х max - x min)/k,

где k - число групп в группировке (из условия k=4),

х max и x min - максимальное и минимальное значения ряда распределения,

е=(60 - 20)/4=10 млн. руб.

Затем определим нижнюю и верхнюю интервальные границы для каждой группы:

Номер группы

нижняя граница

верхняя граница

Составим рабочую таблицу 5, куда сведем исходные данные:

Таблица 5. Рабочая таблица

Группы пред-ий по среднегодовой стоимости ОПФ,

№ предпри-ятия

Среднегодовая стоимость ОПФ, млн. руб.

Выпуск продукции,

Рассчитаем характеристику ряда распределения по удельному весу предприятий по формуле:

где d - удельный вес предприятия;

f i - кол-во предприятий в группе;

F i - общее кол-во предприятий.

Подставляем данные в формулы. Полученные результаты заносим в итоговую таблицу 6.

Все формулы и расчеты таблицы 6 введены в программе Excel и даны в Приложении 1.

Таблица 6. Распределения предприятий по среднегодовой стоимости основных производственных фондов

Данная группировка показывает, что у наибольшей части данных предприятий (33,3%) среднегодовая стоимость основных производственных фондов составляет от 40 до 50 млн. руб.

2. а) Рассчитаем среднегодовую стоимость основных производственных фондов по формуле средней арифметической взвешенной, взвешивая значения по абсолютной численности предприятий:

и по удельному весу:

Для расчета средней из интервального ряда необходимо выразить варианты одним (дискретным) числом, это средняя арифметическая простая из верхнего и нижнего значений интервала:

Подставляем данные в формулы. Полученные результаты занесем в таблицу 7.

Все формулы и расчеты таблицы 7 введены в программе Excel и даны в Приложении 1.

Таблица 7. Расчет среднегодовой стоимости ОПФ

Показатели средних равны, что доказывает правильность расчетов. Среднегодовая стоимость ОПФ равна 41,333 млн. руб.

б) Рассчитаем моду и медиану данного ряда.

Мода - это значение признака, наиболее часто встречающееся в изучаемой совокупности. Для интервальных вариационных рядов распределения мода рассчитывается по формуле:

где x Mo - нижняя граница модального интервала;

i Mo - величина модального интервала;

f Mo - частота модального интервала;

f Mo-1 - частота интервала, предшествующего модальному;

f Mo+1 - частота интервала, следующего за модальным.

Первоначально по наибольшей частоте признака определим модальный интервал. Наибольшее число предприятий - 10 - среднегодовая стоимость основных производственных фондов в интервале 40 - 50 млн. руб., который и является модальным.

Подставляем данные в формулу.

Из расчета видно, что модальным значением стоимости ОПФ предприятий является стоимость равная 44 млн. руб.

Медиана - это вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части. Для интервальных вариационных рядов медиана рассчитывается по формуле:

где x Mе - нижняя граница медианного интервала;

i Mе - величина медианного интервала;

F - сумма частот ряда;

S Mе-1 - сумма накопленных частот ряда, предшествующих медианному интервалу;

f Mе - частота медианного интервала.

Определяем медианный интервал, в котором находится порядковый номер медианы. Для этого подсчитаем сумму частот накопленным итогом до числа, превышающего половину объема совокупности (30/2 = 15). Полученные данные заносим в расчетную таблицу 8.

Таблица 8. Расчет медианны

В графе «Сумма накопленных частот» значение 23 соответствует интервалу 40 - 50. Это и есть медианный интервал, в котором находится медиана.

Подставляем данные в формулу.

Из расчета видно, что у половины предприятий среднегодовая стоимость основных производственных фондов до 42 млн. руб., а у другой половина - выше этой суммы.

в) Построим графики данного ряда распределения по полученным данным:

Рис. 1.

Медиана

Рис. 2. Кумулята распределения предприятий по среднегодовой стоимости ОПФ

Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, психолог провел тестирование интеллекта по тесту Векслера у 25 школьников, и сырые баллы по второму субтесту оказались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита.f i и имеют индекс “i”, соответствующий номеру переменной в вариационном ряду.

Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человека соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.

Приведенный выше ряд (3.1) можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Подобная форма представления (3.3) более предпочтительна, чем (3.1), поскольку лучше иллюстрирует закономерность варьирования признака.

Частоты, характеризующие ранжированный вариационный ряд, можно складывать, или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.

В качестве примера вновь обратимся к ряду 3.3. Преобразуем его в ряд 3.4 в котором введем дополнительную строчку и назовем ее «кумуляты частот»:

Рассмотрим подробно как получилась последняя строчка. В начале ряда частот стоит 1. В кумулятивном ряду на втором месте стоит 2 - это сумма первой и второй частоты, т.е. 1 + 1, на третьем месте стоит 4 это сумма второй (уже накопленной частоты) и третьей частоты, т.е. 2 + 2, на четвертом 8 = 4 + 4 и т.д.


Размах (иногда эту величину называют разбросом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Таблицы и графики распределения частот

Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот. Нередко они являются основой для получения ценных содержательных выводов исследования.

Если признак принимает всего лишь несколько возможных значений (до 10-15), то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это - таблица абсолютных частот распределения, если указывается доля наблюдений, приходящихся на то или иное значение признака, то говорят об относительных частотах распределения.

Во многих случаях признак может принимать множество различных значений, например, если мы измеряем время решения тестовой задачи. В этом случае о распределении признака позволяет судить таблица сгруппированных частот, в которых частоты группируются по разрядам или интервалам значений признака.

Еще одной разновидностью таблиц распределения являются таблицы распределения накопленных частот. Они показывают, как накапливаются частоты по мере возрастания значений признака. Напротив каждого значения (интервала) указывается сумма частот встречаемости всех тех наблюдений, величина признака у которых не превышает данного значения (меньше верхней границы данного интервала). Накопленные частоты содержатся в правых столбцах табл. 3.2 и 3.3.

Для более наглядного представления строится график распределения частот или график накопленных частот - гистограмма или сглаженная кривая распределения.

Гистограмма распределения частот - это столбиковая диаграмма, каждый столбец которой опирается на конкретное значение признака или разрядный интервал (для сгруппированных частот). Высота столбика пропорциональна частоте встречаемости соответствующего значения. На рис. 3.1 изображена гистограмма распределения частот для примера из табл. 3.2.

Гистограмма накошенных частот отличается от гистограммы распределения тем, что высота каждого столбика пропорциональна частоте, накопленной к данному значению (интервалу). На рис. 3.2 изображена гистограмма накопленных частот для данных табл. 3.2.

Построение полигона распределения частот напоминает построение гистограммы. В гистограмме вершина каждого столбца, соответствующая частоте встречаемости данного значения (интервала) признака, - отрезок прямой. А для полигона отмечается точка, соответствующая середине этого отрезка. Далее все точки соединяются ломаной линией (рис. 3.3). Вместо гистограммы или полигона часто изображают сглаженную кривую распределения частот. На рис. 3.4 изображена гистограмма распределения для примера из табл. 3.3 (столбики) и сглаженная кривая того же распределения частот.

Таблицы и графики распределения частот дают важную предварительную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Обычно выделяют следующие типичные формы распределения. Равномерное распределение когда все значения встречаются одинаково (или почти одинаково) часто. Симметричное распределение - когда одинаково часто встречаются крайние значения. Нормальное распределение - симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям признака. Асимметричные распределения - левосторонние (с преобладанием частот малых значений), правосторонние (с преобладанием частот больших значений).

Уже сами по себе таблицы и графики распределения признака позволяют делать некоторые содержательные выводы при сравнении групп испытуемых между собой. Сравнивая распределения, мы можем не только судить о том, какие значения встречаются чаще в той или иной группе, но и сравнивать группы по степени выраженности индивидуальных различий - изменчивости по данному признаку.

Таблицы и графики накопленных частот позволяют быстро получить дополнительную информацию о том, сколько испытуемых (или какая их доля) имеют выраженность признака не выше определенного значения.

Раздел 4. Описательные статистики
(Статистическое распределение и его числовые характеристики)

Переменная может принимать много значений. На начальном этапе обработки данных вместо того, чтобы рассматривать все значения переменной, рекомендуется проанализировать т. к. описательные статистики. Они дают общее представление о значениях или разбросе значений, которые принимает переменная.

К первичным описательным статистикам (Descriptive Statistics) обычно относят числовые характеристики распределения измеренного на выборке признака. Каждая такая характеристика отражает в одном числовом значении свойство распределения множества результатов измерения: с точки зрения их расположения на числовой оси либо с точки зрения их изменчивости. Основное назначение каждой из первичных описательных статистик - замена множества значений признака, измеренного на выборке, одним числом (например, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений, в частности, путем сравнения первичных статистик разных групп.