Основы криминологического измерения. Среднее значение признака

Среднее есть абстрактная типическая характеристика всей совокупности. Оно уничтожает, погашает, сглаживает случайные и неслучайные колебания, влияние индиви­дуальных особенностей и позволяет представить в одной величине, некоторую общую характеристику реальной совокупности единиц. Основное условие научного использования средних заключается в том, чтобы каждое среднее характеризовало такую совокупность единиц, которая в существенном отношении, и в первую очередь в отношении осредняемых значений признака, была бы качественно однородной. Среди всего многообразия средних практически наибо­лее часто используемой считается среднее арифметическое.

Среднее арифметическое. Среднее арифметическое есть частное от деления суммы всех значений признака на их число. Обознача­ется оно х. Формула для вычисления имеет вид

По следующим данным вычислим среднее число газет, читаемых ежедневно индивидами в выборке, из 10 человек:

Формула (1) для сгруппированных данных преобразуется в следующую:

где n t - частота для i -го значения признака.

Если находят среднюю для интервального ряда.распределения, то в качестве значения признака для каждого интервала условно принимают его середину.

Процедуру вычисления среднего по сгруппированным данным удобно выполнять по следующей схеме (табл. 3).

Существует ряд упрощенных приемов вычисления средних. На с. 163 как промежуточный этап рассмотрено вычисление среднего методом отсчета от условного нуля.

Пример. Вышеприведенные данные о количестве прочитанных газет (см. с. 159) сгруппируем следующим образом:

Медиана. Медианой называется значение признака у той еди­ницы совокупности, которая расположена в середине ряда частот­ного распределения.

Если в ряду четное число членов (2k), то медиана равна средне­му арифметическому из двух серединных значений признака. При нечетном числе членов (2k+ 1) медианным будет значение призна­ка у (k + 1) объекта.

Предположим, что в выборке из 10 человек респонденты проранжированы по стажу работы на данном предприятии:

Серединные ранги 5 и 6, поэтому медиана равна

В интервальном ряду с различными значениями частот вычисление медианы распадается на два этапа: сначала находят медиан­ный интервал, которому соответствует первая из накопленных ча­стот, превышающая половину всего объема совокупности, а затем находят значение медианы по формуле

где Х0 - начало (нижняя граница) медианного интервала; d - ве­личина медианного интервала; n = Sn t - сумма частот (относитель­ных частот) интервалов; n н - частота (относительная), накоплен­ная до медианного интервала; n мe - частота (относительная) меди­анного интервала.


Проведем вычисление по данным табл. 2, где в нижней строке приведены накопленные относительные частоты. Первая из них, превышающая половину совокупности (100/2 = 50%), равна 57,9%. Следовательно, медиана принадлежит интервалу 3-4 года. По­этому

Таким образом, для данной выборки медиана, равная 3,7 года, показывает, что 50% семей имеют соотношение возрастов, меньшее этой величины, а другие 50%-большее. Медиана может быть легко определена графически по кумуляте распределения (см. рис. 3).

Медиана может быть применена для дискретных переменных, хотя дробные значения часто не имеют непосредственной содержа­тельной интерпретации.

По данным распределения рабочих по тарифным разрядам см. с. 156) вычислим медиану этого распределения, используя приведенную выше формулу 1 8 . Получим

Узнали, что 50% рабочих имеют разряд, меньший 3,1, и 50%-больший.

Медиана, как уже отмечалось, делит упорядоченный вариацион­ный ряд на две равные по численности группы.

Наряду с медианой можно рассматривать величины, называемые квантилями, которые делят ряд распределения на 4 равные части, на 10 и т. д.

Квантили, которые делят ряд на 4 равные по объему совокупно­сти, называются квартилями. Различают нижний Q1/4 и верхний квартили (рис. 6). Величина Q 1/2 является медианой. Вычисле­ние квартилей совершенно аналогично вычислению медианы:

где х 0 - минимальная граница интервала, содержащего нижний (верхний) квартиль; n н - частота (относительная частота), накоп­ленная до квартального интервала; n Q - частота (относительная частота) квартального интервала; d - величина квартального ин­тервала.

Процентили делят множество наблюдений на 100 частей с рав­ным числом наблюдений в каждой. Децили делят множество наблю­дений на десять равных частей. Квантили легко вычисляются по распределению накопленных частот (по кумуляте).

Мода. Модой в статистике называется наиболее часто встречаю­щееся значение признака, т. е. значение, с которым наиболее веро­ятно можно встретиться в серии зарегистрированных наблюдений. В дискретном ряду мода (Мо) - это значение с наибольшей частотой.

В интервальном ряду (с равными интервалами) модальным яв­ляется класс с наибольшим числом наблюдений. Значение моды находится в его пределах и вычисляется по формуле

где х 0 - нижняя граница модального интервала; d - величина ин­тервала; n- - частота интервала, предшествующего модальному; n Мо - частота модального класса; n + - частота интервала, следую­щего за модальным.

В совокупностях, в которых может быть произведена лишь опе­рация классификации объектов по какому-нибудь качественному признаку, вычисление моды является единственный способом ука­зать некий центр тяжести совокупности.

К недостаткам моды следует отнести следующие: невозможность совершать над ней алгебраические действия; зависимость ее величи­ны от интервала группировки; возможность существования в ряду распределения нескольких модальных значений признака (см., например, рис. 4, в).

Сравнение средних . Целесообразность использования того или иного типа средней величины зависит по крайней мере от следующих условий: цели усреднения, вида распределения, уровня измерения признака, вычислительных соображений. Цель усреднения свя­зана с содержательной трактовкой рассматриваемой задачи. Однако форма распределения может существенно усложнить исследование средних. Если для симметричного распределения (см. рис. 4, а) мода, медиана и среднее арифметическое тождественны, то для асимметричного распределения это не так. На выбор средней мо­жет повлиять и вид распределения. Например, для ряда с откры­тыми конечными интервалами нельзя вычислять среднее арифмети­ческое, но если распределение близко к симметричному, можно под­считать тождественную ему в этом случае медиану.


1. Средние величины: сущность, значение, виды

Важный вклад в обоснование и развитие теории средних величин внес крупный ученый XIX века Адольф Кетле (1796-1874), член Бельгийской академии наук, член-корреспондент Петербургской академии наук.

Средняя величина - обобщающая характеристика изучаемого признака в исследуемой совокупности. Она определяет его типичный уровень в расчёте на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность (единицу измерения), что и признак у отдельных единиц совокупности.

Основным условием научного использования средней величины является качественная однородность совокупности, по которой исчислена средняя.

    степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая);

    структурные (мода, медиана).

Степенная средняя – корень степени k из средней всех вариантов, взятых в k –й степени, имеет следующий вид:

где – признак, по которому находится средняя, называется осредняемым признаком,

х i или (х 1 , х 2 …х n ) – величина осредняемого признака у каждой единицы совокупности,

f i – повторяемость индивидуального значения признака.

В зависимости от степени k получаются различные виды степенных средних, формулы расчета которых показаны ниже в таблице 1.

Таблица 1 – Виды степенных средних

Значение k

Наименование средней

Формулы средней

взвешенная

Средняя гармоническая

, w i = x i · f i

Средняя геометрическая

Средняя арифметическая

=

=

Средняя квадратическая

=

=

f i частота повторения индивидуального значения признака (его вес)

Весом может быть и частотость, т.е. отношение частоты повторения индивидуального значения признака к сумме частот:

Выбор вида средней величины:

Средняя арифметическая простая применяется в случае, если индивидуальное значение признака у единиц совокупности на повторяется или встречается одни раз или одинаковое число раз, т.е. когда средняя рассчитывается по несгруппированным данным.

Когда отдельное значение изучаемого признака встречается несколько раз у единиц изучаемой совокупности, тогда частота повторения индивидуальных значений признака (вес) присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних .

Если по условию задачи необходимо, чтобы неизменной оставалась при осреднении суммы величин, обратных, индивидуальным значениям признака, то средняя величина является гармонической средней .

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то следует применить среднюю геометрическую . Средняя геометрическая используется для расчета средних темпов роста в анализе рядов динамики.

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной . Средняя квадратическая используется для расчета среднего квадратического отклонения при анализе вариации признака в рядах распределения.

Степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные и чем больше показатель степени k , тем больше и величина соответствующей средней, если все исходные значения признака равны, то и все средние равны этой постоянной:

Гарм. ≤ геом. ≤ арифм. ≤ кв. ≤ куб.

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется мажорантностью средних .

Структурные средние применяют в том случае, когда расчет степенных средних невозможен или нецелесообразен.

К структурным средним относят: моду и медиану .

Мода – это наиболее часто встречающееся значение признака у единиц данной совокупности. При наличии вариантов и частот в ряду распределения величина моды соответствует значению признака у наибольшего числа единиц (наибольшей частоте), т.е. для дискретного вариационного ряда мода находится по определению.

Медиана – значение признака у единицы совокупности в середине ранжированного ряда распределения, когда все индивидуальные значения признака изучаемых единиц расположены в порядке их возрастания или убывания.

В случае нечетного числа наблюдений медиана находится по определению, т.е. вариант (где n – число наблюдений). При четном числе наблюдений медиана определяется по формуле:

Для интервального ряда распределения величина моды и медианы рассчитываются по следующим формулам:
;
,

где: - нижняя граница модального или медианного интервала;

Величина интервала;

и
- частоты, предшествующие и следующие за модальным интервалом;

- частота модального или медианного интервала;

- сумма накопленных частот в интервалах, предшествующих медианному.

Расчет медианы по несгруппированным данным производится следующим образом:

1. Индивидуальные значения признака располагаются в возрастающем порядке. 2. Определяется порядковый номер медианы № Ме = (n +1) / 2

    Показатели вариации, сущность, значение, виды. Законы вариации

Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К абсолютным показателям (мера) вариации относятся: размах колебаний, среднее абсолютное отклонение, дисперсия, среднее квадратическое отклонение.

Размах вариации – это разность между максимальным и минимальным значениями признака:
.

Размах вариации показывает, в каких пределах колеблется размер признака, образующего ряд распределения

Среднее абсолютное отклонение (САО) - средняя из абсолютных значений отклонений отдельных вариант от средней.

(простая),
(взвешенная)

Дисперсия- средняя из квадратов отклонений вариантов значений признака от их средней величины:

(простая),
(взвешенная)

Дисперсия может быть разложена на составные элементы, позволяющих оценить влияние различных факторов, обуславливающих вариацию признака

т.е. дисперсия равна разности между средним квадратом значений признака и квадратом средней.

Свойства дисперсии, позволяющие упростить способ ее вычисления:

    Дисперсия постоянной величины равна 0.

    Если все варианты значений признака уменьшить на одно и то же число раз, то дисперсия не уменьшится.

    Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k 2 раз.

Среднее квадратическое отклонение (СКО) представляет собой корень квадратный из дисперсии, показывает насколько в среднем колеблется величина признака у единиц изучаемой совокупности: =

СКО является мерилом надежности. Чем меньше СКО, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Размах вариации, САО, СКО являются величинами именованными, т.е. имеют те же единицы измерения, что и индивидуальные значения признака.

Существуют 4 вида дисперсии: общая, межгрупповая, внутригрупповая, групповая.

Дисперсию, вычисляемую для всей совокупности в целом называют общей дисперсией. Она измеряет колеблемость зависимого признака (результатного), вызванную действием на него всех без исключения факторов.

Общая дисперсия равна сумме средней из внутригрупповой и межгрупповой дисперсии:

Если совокупность разбита на группы, то для каждой группы может быть определена своя дисперсия, характеризующая вариацию внутри группы. Групповая дисперсия – средние квадратические отклонения от групповой средней, т.е. от средней величины признака в данной группе.

где j – порядковый номер x и f в пределах группы.

Групповая дисперсия характеризует вариацию признака в пределах группы за счет всех прочих факторов, кроме положенного в основании группировки.

Измерение вариации по совокупности в целом, исчисляем как среднюю из внутригрупповых дисперсии:

где – групповые дисперсии,

n j – число единиц в группах.

Групповые средние отличаются одна от другой и от общей средней, т.е. варьируют. Их вариацию называют межгрупповой вариацией. Для ее характеристики исчисляют средний квадрат отклонений групповых средних от общей средней:

где j групповые средние, – общая средняя, n j – число единиц в группе.

Межгрупповая дисперсия (дисперсия групповых средних) измеряет вариацию результатного признака за счет факторного признака, положенного в основании группировки.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации.

Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане)

Коэффициент вариации

Относительное линейное отклонение

Коэффициент осцилляции

Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации , который показывает среднее отклонение от среднего значения признака в процентах.

Его используют для: сравнительной оценки вариации; характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%, т.е. меньше 33%.

Законы вариации .

Закон вариации индивидуальных значений признака или «правило трех сигм». Бельгийский статистик А.Кетле обнаружил, что вариации некоторых массовых явлений подчиняются закону распределения ошибок, открытому К.Гауссом и П. Лапласом почти одновременно. Кривая, отображающая это распределение, имеет вид колокола (рис.2).

По нормальному закону (термин предложен английским статистиком К.Пирсоном) распределения колеблемость индивидуальных значений признака находится в пределах
(правило трех сигм).

Нормальному закону распределения подчиняются естественные свойства человека (рост, вес, физическая сила), характеристики промышленных изделий (размер, вес, электрическое сопротивление, упругость и т.п.). В сфере быстроизменяющихся общественных явлений действие этого закона проявляется сравнительно редко. Однако, в ряде случаев, использование правила трех сигм практически возможно.

Закон вариации средних величин . Вариация средних величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах:
, где n – число единиц.

Предмет статистической науки и задачи статистики на современном этапе

Статистика произошло от лат «ststus»-состояние или положение. Статистика - это совокупность цифр; это вид деятельности по сбору и анализу данных; это наука сформировавшаяся в 18в и изначально называл «политическая арифметика». Предмет статист - количественная сторона массовых соц-экон явл в неразрывной связи с их качественной стороной в конкретн услов места и времени. Объект – общество происходящие в нем процессы, т.е. совокупность соц-экономических явлений. Основн метод статистики – закон больших чисел. Важнейшие задачи стат-ки – организ стат наблюдений; обраб-ка данных и получение системы обобщ показателей для анализа; предоставлен гос управл достов информации для своевремен принятия управл решений; публикац информации для информиров-я по соц-экон процессам. Стат. исследования проходят след этапы : 1.статистичек наблюдение(формы и виды сбора информ);2.стасистическа сводка и группировка(систематизация);3.расчет и анализ обобщающих показателей(абсолютн и относ велич, средн велич, показатели вариации, показатели выборочного наблюдения, показатели рядов динамики, индексы).

Статистическая совокупность, ее виды. Единицы совокупности и классификация их признаков.

Статистическая совокупность – совокупность однородных по какому-либо признаку предметов, ограниченных пространством и временем. Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность, в которую входят явления разного типа, считается разнородной. Пример СС - множество студентов некоторого вуза, обучающихся на 2-ом курсе дневного отделения. Данное множество является качественно однородным, так как объединяет молодых людей, обучающихся в одном и том же вузе на 2-ом курсе дневного отделения. В то же время элементы данного множества - студенты отличаются друг от друга успеваемостью, способностями, состоянием здоровья и т.п. Единица совокупности (элемент) - частный случай проявления изучаемой закономерности; это первичный элемент статистической совокупности, являющийся носителем признаков, подлежащих регистрации и основой ведущегося при обследовании счета. Признак - это свойство, характеристика единицы статистической совокупности. Например, единица статистической совокупности - «студент» имеет следующие признаки: фамилия, имя, отчество, возраст, оценки по предметам, посещаемость занятий и т.д Чем более однороднее совокупность, тем больше общих признаков имеют ее единицы и меньше варьируют их значения.

Метод группировок позволяет изучить состояние и взаимосвязи экономических явлений, если группы будут охарактеризованы показателями, раскрывающими наиболее существенные стороны изучаемого явления.

При анализе и планировании необходимо опираться не на случайные факты, а на показатели, выражающие основное, типичное, коренное. Такую характеристику дают различные виды средних величин, а также мода и медиана.

Вопрос об однородности совокупности не должен решаться формально по форме ее распределения. Его, как и вопрос о типичной средней, нужно решать, исходя из причин и условий, формирующих совокупность. Однородной является такая совокупность, единицы которой формируются под воздействием общих главных причин и условий, определяющих общий уровень данного признака, характерный для всей совокупности.

Согласно теории типологических группировок, решающее значение в оценке однородности совокупности принадлежит не форме распределения, а размеру вариации и условиям ее формирования. Для качественно однородной совокупности характерна вариация в определенных пределах, после чего начинается новое качество. Вместе с тем к этим границам для оценки качественной однородности совокупности надо подходить с точки зрения существа дела, а не формально, так как одно и то же количество в разных условиях выражает новое качество. Например, при одной и той же численности рабочих предприятия одних отраслей промышленности являются крупными, а других – мелкими.

Для всестороннего и углубленного изучения явлений, для объективной характеристики типов явлений, их взаимоотношений и процессов, обусловленных развитием системы как целого, необходимо сочетать групповые средние с общими средними. Сочетание таких средних и является одним из основных элементов анализа сложных систем. Это сочетание связывает в одно целое два органически дополняющих друг друга статистических метода: метод средних величин и метод группировки. При расчете средней индивидуальные варьирующие по группе значения заменяются одним средним значением. При этом случайные отклонения значения признака по отдельным единицам в сторону увеличения или уменьшения взаимно уравновешиваются и погашают друг друга, а в величине средней проявляется типичный размер признака, свойственный данной группе. Средняя величина служит характеристикой совокупности и в то же время относится к отдельному ее элементу – носителю качественных особенностей явления. Значение средней вполне конкретно, но одновременно и абстрактно; оно получено путем абстрагирования от случайного индивидуального по каждой единице с целью выявления того общего, типичного, что свойственно всем единицам и что формирует данную совокупность. При расчете средней величины численность единиц совокупности должна быть достаточно большой. Величина средней определяется как отношение общего объема явлений к числу единиц совокупности в группе. Для несгруппированных данных это будет средняя арифметическая простая:

а для сгруппированных данных, где каждое значение признака имеет свою частоту, – средняя арифметическая взвешенная:

где X i – значение признака; f i – частота этих значений признака.

Поскольку средняя арифметическая рассчитывается как отношение суммы значений признака к общей численности, она никогда не выходит за пределы этих значений. Средняя арифметическая обладает рядом свойств, которые широко используются в целях упорядочения расчетов.

1. Сумма отклонений индивидуальных значений признака от средней величины всегда равна нулю:

Доказательство. n

Разделив левую и правую часть на

2. Если значения признака (X i) изменить в k раз, то средняя арифметическая также изменится в x раз.

Доказательство.

Среднюю арифметическую из новых значений признака обозначим X, тогда:

Постоянную величину 1/k можно вынести за знак суммы, и тогда получим:

3. Если из всех значений признака X i вычесть или прибавить одно и то же постоянное число, то средняя арифметическая уменьшится или увеличится на эту величину.

Доказательство.

Средняя из отклонений значений признака от постоянного числа будет равна:

Точно так же доказывается это и в случае прибавления постоянного числа.

4. Если частоты всех значений признака уменьшить или увеличить в n раз, то средняя не изменится:

При наличии данных об общем объеме и известных значениях признака, но неизвестных частотах для определения среднего показателя используют формулу среднеарифметической взвешенной.

Например, имеются данные о ценах реализации капусты и общей выручке за различные сроки реализации (табл. 1).

Таблица 1.

Цена реализации капусты и общая выручка за различные сроки реализации


Так как средняя цена представляет отношение общей выручки к общему объему реализованной капусты, то вначале следует определить количество реализованной капусты по разным срокам реализации как отношение выручки к цене, а затем уже определить среднюю цену реализованной капусты.

В нашем примере средняя цена будет:

Если рассчитать в данном случае среднюю цену реализации по средней арифметической простой, то получим иной результат, который исказит истинное положение и завысит среднюю цену реализации, так как не будет учтен тот факт, что большая доля в реализации приходится на позднюю капусту с более низкой ценой.

Иногда требуется определить среднюю величину, когда значения признака даются в виде дробных чисел, т. е. обратных целым числам (например, при изучении производительности труда через обратный его показатель, трудоемкость). В таких случаях целесообразно использовать формулу средней гармонической:

Так, среднее время, необходимое для изготовления единицы продукции, есть средняя гармоническая. Если Х 1 = 1/4 часа, Х 2 = 1/2 часа, Х 3 = 1/3 часа, то средняя гармоническая этих чисел есть:

Для расчета средней величины из отношений двух одноименных показателей, например темпов роста, применяется средняя геометрическая, рассчитанная по формуле:

где Х 1 x Х 2 … x … Х 4 – отношение двух одноименных величин, например цепных темпов роста; n – численность совокупности отношений темпов роста.

Рассмотренные средние величины обладают свойством маорантности:

Пусть, например, имеем следующие значения Х (20; 40), тогда рассмотренные ранее виды средних величин будут равны:

При изучении состава совокупности о типичном размере признака можно судить по так называемым структурным средним – моде и медиане.

Модой называется наиболее часто встречающееся значение признака в совокупности. В интервальных вариационных рядах сначала находят модальный интервал. В найденном модальном интервале мода рассчитывается по формуле:

где Х 0 – нижняя граница модального интервала; d – величина интервала; f 1 , f 2 , f 3 – частоты предмодального, модального и послемодаль-ного интервалов.

Значение моды в интервальном ряду довольно просто можно отыскать на основе графика. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Из точки пересечения этих линий опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс и будет модой (рис. 2).


Рис. 2

Для решения практических задач наибольший интерес представляет обычно мода, выраженная в виде интервала, а не дискретным числом. Объясняется это назначением моды, которая должна выявить наиболее распространенные размеры явления.

Средняя – величина, типичная для всех единиц однородной совокупности. Мода – тоже типичная величина, но она определяет непосредственно размер признака, свойственный хотя и значительной части, но все же не всей совокупности. Она имеет большое значение для решения некоторых задач, например для прогнозирования того, какие размеры обуви, одежды должны быть предназначены для массового производства, и т. д.

Медиана – значение признака, находящееся посредине ранжированного ряда. Она указывает на центр распределения единиц совокупности и делит ее на две равные части.

Медиана является лучшей характеристикой центральной тенденции, когда границы крайних интервалов открыты. Медиана является более приемлемой характеристикой уровня распределения и в том случае, если в ряду распределения имеются чрезмерно большие или чрезмерно малые значения, которые оказывают сильное влияние на среднюю величину, а на медиану – нет. Медиана, кроме того, обладает свойством линейного минимума: сумма абсолютных значений отклонений величины признака у всех единиц совокупности от медианы минимальная, т. е.

Это свойство имеет большое значение для решения некоторых практических задач – например, для расчета самого короткого из всех возможных расстояний для разных видов транспорта, для размещения станций техобслуживания таким образом, чтобы расстояние до всех обслуживаемых данной станцией машин было минимальным, и т. п.

При отыскании медианы сначала определяется ее порядковый номер в ряду распределения:

Далее, соответственно порядковому номеру, по накопленным частотам ряда находят саму медиану. В дискретном ряду – без всякого расчета, а в интервальном ряду, зная порядковый номер медианы, по накопленным частотам отыскивается медианный интервал, в котором путем простейшего приема интерполяции определяется уже значение медианы. Расчет медианы осуществляется по формуле:

где Х 0 – нижняя граница медианного интервала; d – величина интервала; f _ 1 – частота, накопленная до медианного интервала; f – частота медианного интервала.

Рассчитаем среднюю величину, моду и медиану на примере интервального распределения. Данные приведены в табл. 2.


Таким образом, в качестве центра распределения могут быть использованы различные показатели: средняя величина, мода и медиана,


и каждая из этих характеристик имеет свои особенности. Так, для средней величины характерно то, что все отклонения от нее отдельных значений признака взаимно погашаются, т. е.

Для медианы характерно то, что сумма отклонений индивидуальных значений признака от нее (без учета знаков) является минимальной. Мода же характеризует наиболее часто встречающееся значение признака. Поэтому в зависимости от того, какая из особенностей интересует исследователя, и должна выбираться одна из рассмотренных характеристик. В отдельных случаях рассчитываются все характеристики.

Их сравнение и выявление соотношений между ними помогает выяснить особенности распределения того или иного вариационного ряда. Так, в симметричных рядах, как в нашем случае, все три характеристики (средняя, мода и медиана) примерно совпадают. Чем больше расхождение между модой и средней величиной, тем более асимметричен ряд. Установлено, что для умеренно асимметричных рядов разность между модой и средней арифметической примерно в три раза превышает разность между медианой и средней арифметической:

Это соотношение можно использовать для определения одного показателя по двум известным. Из этого следует, что сочетание моды, медианы и средней важно и для характеристики типа распределения.

Реферат

Средние величины и показатели вариации

1.Сущность средних в статистике

2.Виды средних величин и способы их расчёта

3.Основные показатели вариации и их значение в статистике

1. Сущность средних ве личин в статистике

В процессе изучения массовых социально-экономических явлений возникает необходимость выявления их общих свойств, типичных размеров и характерных признаков. Необходимость в обобщающем среднем показателе возникает в том случае, когда признаки, характеризующие единицы изучаемой совокупности, количественно варьируют. Например, размер дневной выработки ткачей на текстильной фабрике зависит от общих условий производства, ткачи используют одинаковое сырьё, работают на одинаковых станках и т.д. В то же время часовая выработка отдельных ткачей колеблется, т.е. варьирует, так как зависит от индивидуальных особенностей каждого ткача (его квалификации, профессионального опыта и т.д.). Чтобы характеризовать дневную выработку всех ткачей предприятия, необходимо исчислить среднюю величину дневной выработки, так, как, только, в, этом, показателе найдут отражение общие для ткачей условия производства.

Таким образом, исчисление средних обобщающих показателей означает отвлечение (абстрагирование) от особенностей, отражающихся в величине признака у отдельных единиц, и выявление общих для данной совокупности типичных черт и свойств.

Таким образом, средней величиной в статистике является обобщённая, количественна характеристика признака и статистической совокупности. Она выражает характерную, типичную величину признака у единиц совокупности, образующихся в данных условиях места и времени под влиянием всей совокупности факторов. Действие разнообразных факторов порождает колебание, вариацию усредняемого признака. Средняя величина является общей мерой их действия, равнодействующей всех этих факторов. Средняя величина характеризует совокупность по усредняемому признаку, но относится к единице совокупности. Например, средняя выработка продукции на одного рабочего данного предприятия представляет собой отношение всей выработки (за любой период времени) к общей (средней за тот же период) численности его рабочих. Она характеризует производительность труда данной совокупности, но относится к одному рабочему. В средней величине массового явления погашаются индивидуальные различия единиц статистической совокупности в значениях усредняемого признака, обусловленные случайными обстоятельствами. Вследствие этого взаимопогашения в средней проявлявляется общее, закономерное свойство данной статистической совокупности явлений. Между средней и индивидуальными значениями осреднённого признака существует диалектическая связь как между общим и отдельным. Средняя является важнейшей категорией статистической науки и важнейшей формой обобщающих показателей. Многие явления общественной жизни становятся ясными, определёнными, лишь, будучи обобщенными, в форме средних величин. Таковы, например, упомянутая выше производительность труда, совокупность рабочих, урожайность сельскохозяйственных культур и т.д. Средняя выступает в статистике важнейшим методом научного обобщения. В этом смысле говорят о методе средних величин, который широко применяется в экономической науке. Многие категории экономической науки определяются с использованием понятия средней.

Основным условием правильного применения средней величины является однородность статистической совокупности по усредняемому признаку. Однородной статистической совокупностью называется такая совокупность, в которой её составные элементы (единицы) сходны между собой по существенным для данного исследования признакам и относятся к одному и тому же типу явлений. Однородная совокупность, будучи однородна по одним признакам, может быть разнородной по другим. Только в средних для таких совокупностей проявляются специфические особенности, закономерности развития анализируемого явления. Средняя вычисленная для неоднородной статистической совокупности, т.е. такой в которой объединены качественно различные явления, теряет своё научное значений. Такие средние являются фиктивными, не только не дающими представления о действительности, но и искажающими её. Для формирования однородных статистических совокупностей производится соответствующая группировка. С помощью группировок и в качественно однородной совокупности могут быть выделены характерные в количественном отношении группы. Для каждой из них может быть вычислена своя средняя, называемая средней групповой (частной) в отличие от общей средней (для совокупности в целом).

2. Виды средних величин

Большое значение в методологии средних величин имеют вопросы выбора формы средней, т.е. формулы по которой можно правильно вычислить среднюю величину, и выбора весов средней. Наиболее часто в статистике применяются средняя агрегатная, средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратичная, мода и медиана. Применение той или иной формулы зависит от содержания усредняемого признака и конкретных данных, по которым её необходимо рассчитать. Для выбора формы средней можно воспользоваться так называемым средним исходным соотношением.

2.1 Средняя арифметическая

Средняя арифметическая - одна из наиболее распространенных форм средней величины. Средняя арифметическая рассчитывается как частное от деления суммы индивидуальных значений (вариантов) варьирующего признака на их число. Средняя арифметическая применяется в тех случаях, когда объём варьирующего признака явлений однородной статистической совокупности, образуется путём суммирования значений признака всех единиц явлений статистической совокупности. Различают следующие средне арифметические величины:

1) Простая средняя арифметическая , которая определяется путём простого суммирования количественных значений варьирующего признака и деления этой сумы на их варианты и рассчитывается по следующей формуле:

Х - средняя величина статистической совокупности,

x i - сумма отдельных варьирующих вариантов явлений статистической совокупности,

n i - количество варьирующих вариантов явлений статистической совокупности.

2) Среднеарифметическая взвешенная - средняя величина признака явления, вычисленная с учётом весов. Веса средних величин - частоты, с которыми отдельные значения признака осредняемого принимаются в расчёт при исчислении его средней величины. Выбор весов средней величины зависит от сущности усредняемого признака и характера данных, которыми располагают для вычисления средних величин. В качестве весов средних величин могут быть показатели численности единиц или размеры частей статистической совокупности (в форме абсолютных или относительных величин), обладающих данным вариантом (значением) усредняемого признака явления статистической совокупности, а также величины показателя связанного с усредняемым признаком. Среднеарифметическая взвешенная рассчитывается по следующей формуле:

X- средняя арифметическая взвешенная,

х - величина отдельных варьирующих вариантов явлений статистической совокупности,

Назначение простой, и взвешенной средней арифметической является определение среднего значения варьирующего признака. Если в изучаемой статистической совокупности варианты значений признака встречаются по одному разу или имеют одинаковый вес, то применяется простая средняя арифметическая, если же варианты значений данного признака встречаются в изучаемой совокупности по несколько раз или имеют различные веса, для определения среднего значения варьирующего признака применяется средняя арифметическая взвешенная.

2.2 Средняя гармоническая

Средняя гармоническая применяется для расчёта средней величины тогда, когда непосредственные данные о весах отсутствуют, а известны варианты усредняемого признака (х) и произведения значений вариантов на количество единиц, обладающих данным его значением w (w = xf).

Данная средняя рассчитывается по следующим формулам:

1.) Среднегармоническая простая:

Х - средняя гармоническая простая,

n - количество варьирующих вариантов явлений статистической совокупности.

2) Среднегармоническая взвешенная:

Х - средняя гармоническая взвешенная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

При использовании гармонической взвешенной выявляют веса и таким образом получают тот же результат, который дал бы расчёт по средней арифметической взвешенной, если бы были известны все необходимые для этого данные.

2.3 Средняя агрегатная

Средняя агрегатная рассчитывается по формуле:

X - средняя агрегатная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

Средняя агрегатная вычисляется в тех случаях, когда известны (имеются) значения числителя и значения знаменателя исходного соотношения средней.

2.4 Средняя геометрическая

Средняя геометрическая является одной из форм средней величины и вычисляется как корень n-й степени из произведения отдельных значений - вариантов признака (х) и определяется по следующей формуле:

Средняя геометрическая применяется в основном при расчётах средних темпов роста.

2.5 Мода и медиана

Наряду с рассмотренными выше средними в качестве статистических характеристик вариационных рядов рассчитываются так называемые структурные средние - мода и медиана.

Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности . Для дискретных рядов - этот вариант, имеющий наибольшую частоту.

В интервальных вариационных рядах можно определить, прежде всего, интервал, в котором находится мода, т.е. так называемый модальный интервал. В вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте, в рядах с неравными интервалами по наибольшей плотности распределения.

Для определения моды в рядах с равными интервалами пользуются формулой следующего вида:

Хн - нижняя граница модального интервала,

h - величина интервала,

f 1 , f 2 , f 3 - частоты (или частности) соответственно предмодального, модального и послемодального интервалов.

В интервальном ряду моду можно найти графически. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Затем из точки их пересечения опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее перпендикуляру, и будет модой.

Во многих случаях при характеристике совокупности в качестве обобщённого показателя отдаётся предпочтение моде, а не средней арифметической.

Так, при изучении цен на рынке фиксируется и изучается в динамике не средняя цена на определённую продукцию, а модальная; при изучении спроса населения на определённый размер обуви или одежды представляет интерес определение модального размера обуви, а средний размер как таковой здесь вообще не имеет значения. Мода представляет не только самостоятельный интерес, но и исполняет роль вспомогательного показателя при средней, характеризуя её типичность. Если средняя арифметическая близка по значению к моде, значит она типична.

Медианой (Ме) называется значение признака у средней единицы ранжированного ряда. (Ранжированным называют ряд, у которого значения признака записаны в порядке возрастания или убывания.)

Чтобы найти медиану, сначала определяется её порядковый номер. Для этого при нечётном числе единиц к сумме всех частот прибавляется единица, и всё делится на два. При чётном числе единиц в ряду будет две средних единицы, и по всем правилам медиана должна определяться как средняя из значений этих двух единиц. При этом практически при чётном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер которой определяется по общей сумме частот, делённой на два. Зная порядковый номер медианы, легко по накопленным частотам найти её значение.

В интервальных рядах после определения порядкового номера медианы по накопительным частотам (частностям) отыскивается медиальный интервал, а затем при помощи простейшего интерполяционного приёма определяется значение самой медианы. Этот расчёт выражает следующая формула:

X n - нижняя граница медианного интервала,

h - величина медианного интервала,

Порядковый номер медианы,

S Me - 1 частота (частотность), накопленная до медианного интервала,

F Me - частота (частность) медианного интервала.

Согласно записанной формуле к нижней границе медианного интервала прибавляется такая часть величины интервала, которая приходится на долю единиц этой группы, недостающих до порядкового номера медианы. Другими словами, расчёт медианы построен на предположении, что нарастание признака среди единиц каждой группы происходит равномерно. На основе сказанного можно рассчитать медиану и по иному. Определив медианный интервал, можно из верхней границы медианного интервала (Хв) вычесть ту часть интервала, которая приходится на долю единиц, превышающих порядковый номер медианы, т.е. по следующей формуле:

Медиану можно также определить и графически. Для этого строиться кумулята и из точки на шкале накопленных частот (частностей), соответствующей порядковому номеру медианы, проводится прямая, параллельная оси х до пересечения с кумулятой. Затем из точки пересечения указанной прямой с куммулятой опускается перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее проведённой ординате (перпендикуляру), и будет медианой.

По такому же принципу легко найти значение признака у любой единицы ранжированного ряда.

Таким образом, для расчёта средней величины вариационного ряда можно использовать целую совокупность показателей.

3. Основные показатели вари ации и их значение в статистике

При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчётом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям. Это можно проиллюстрировать следующим условным примером, отражающим данные о числе дворов в агрохозяйствах двух районов:

Среднее число дворов в агрохозяйствах двух районов одинаково - 160. При этом состав этих агрохозяйств в двух районах далеко не одинаков. Поэтому возникает необходимость измерить вариацию признака в совокупности.

Для этой цели в статистике рассчитывают ряд характеристик, т.е. показателей. Самым элементарным показателем вариации признака является размах вариации R , представляющий собой разность между максимальными и минимальными значениями признака в данном вариационном ряду, т.е. R = Xmax - Xmin. В нашем примере в 1 районе R = 300 - 80 - 220, а во втором районе R = 180 - 145 = 35.

Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц. Иногда находят отношение размаха вариации к средней арифметической и пользуются этой величиной, именуя её показателем осцилляции.

Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической. Таких показателей в статистике два - среднее линейное и среднее квадратическое отклонение.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных величин отклонений вариантов от средней. Знаки отклонений в данном случае игнорируются, в противном случае сумма всех отклонений будет равна нулю. Данный показатель рассчитывается по формуле:

б) для вариационного ряда:

Следует иметь в виду, что среднее линейное отклонение будет минимальным, если отклонения рассчитаны от медианы, т.е. по формуле:

Среднее квадратическое отклонение () исчисляется следующим образом - каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учётом весов), после чего сумма квадратов делиться на число членов ряда и из частного извлекается корень квадратный.

Все данные действия выражаются следующими формулами:

а) для несгрупированных данных:

б) для вариационного ряда:

f, т.е. среднее квадратическое отклонение предятавляет собой корень квадратный из средней арифметической квадратов отклонений средней. Выражение под корнем носит название дисперсии. Дисперсия имеет самостоятельное выражение в статистике и относится к числу важнейших показателей вариации.