Все для предпринимателя. Информационный портал

Структурная группировка в статистике. Задачи и виды группировок

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Задачи, решаемые с помощью метода группировок:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление связи и зависимости между явлениями;

В соответствии с этими задачами различают следующие виды группировок:

1. Типологическая - расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений;

2. Структурная - группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку или нескольким признакам

3. Аналитическая - группировка, выявляющая взаимосвязи между изучаемыми признаками.

Особенностями аналитической группировки является:

а) единицы группируются по факторному признаку;

б) каждая группа характеризуется средними величинами результативного признака.

Примеры видов группировок:

1. Типологические

Таблица 1

Распределение пенсионеров РФ по видам пенсионного обеспечения (на конец года, тыс. чел.)

    Структурные

Таблица 2

Распределение населения РФ по величине среднедушевых денежных доходов (в процентах)

Все население

в том числе со среднедушевыми денежными доходами, руб. в месяц:

1500,1 – 2000,0

2000,1 – 3000,0

3000,1 – 4000,0

4000,1 – 5000,0

5000,1 – 7000,0

7000,1 – 12000,0

Свыше 12000,1

    Аналитические

Таблица 3

Распределение региона по численности занятых в экономике (данные условные)

№ группы

Группы регионов по численности занятых в экономике, тыс.чел.

Число регионов

Численность занятых в экономике, тыс. чел.

Валовой региональный продукт, млрд. руб.

в среднем на один регион

в среднем на один регион

Разновидностью типологической группировки является классификация.

Под классификацией в статистике понимается группировка явлений, каких-либо объектов по относительно однообразным и устойчивым признакам (например, классификация экономики по секторам). Классификации используются в качестве национальных и международных стандартов в определенный промежуток времени.

Построение группировки начинается с определения группировочного признака (основания группировки) .

Группировочный признак – это расчленение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Группировочный признак (основание группировки) делится на:

    Количественный - число групп зависит от степени вариации группировочного признака: чем она больше, тем больше можно образовать групп;

    Атрибутивный - число групп определяется числом градаций атрибутивного признака (например, группировка населения по полу предполагает только две группы).

Если в основание группировки положен один признак, то группировка называется простой , если несколько, то – сложной (комбинационная и многомерная).

Комбинационные группировки строятся путем разбиения группы на подгруппы в соответствии с дополнительными признаками.

Многомерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объект – точка.

После того, как определено основание группировки, решается вопрос о количестве групп , на которые необходимо разбить изучаемую совокупность.

Число групп зависит от:

Задач исследования;

Группировочного признака;

Объёма совокупности;

Степени вариации группировочного признака.

Если основанием группировки служит количественный признак, то для определения количества групп (группировка с равными интервалами) можно воспользоваться формулой американского ученого Стерджесса .

Формула Стерджесса:

n =1+3,322 lgN

n – число групп;

N – число единиц совокупности.

Когда определено число групп, то следует установить интервалы группировки.

Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.

Интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале.

Величина интервала (ширина) представляет собой разность между верхней и нижней границами интервала.

Виды интервалов группировки бывают:

    Равный - применяется в тех случаях, когда вариация признака происходит в сравнительно узких границах и носит более или менее равномерный характер (таблица 3.3);

    Неравный - применяется в тех случаях, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные (таблица 3.2)

    Открытый - это интервал, у которого указана только одна граница: верхняя - у первого, нижняя – у последнего (таблица 3.2)

    Закрытый - это интервал, у которого имеются верхняя и нижняя границы (таблица 3.3)

При равных интервалах расчет величины интервала определяется по формуле:

h =(X max - X min )/ n (2)

где X max , X min - максимальное и минимальное значения признака в совокупности соответственно.

При определении величины интервала группировки следует учитывать следующие правила:

    если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (в приведенном примере это будут значения: 0,7; 0,6; 2,4);

    если величина интервала, рассчитанная по формуле (2), имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения: 11; 23);

    если величина интервала, рассчитанная по формуле (2), представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего число, кратного 10 (в приведенном примере это будут значения: 120; 760);

    если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно» (например, если нижняя граница i - группы равна 50, а верхняя – 100, то единица совокупности со значением признака равным 100, попадет в группу i+1) (пример 3);

    если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более» (таблица 3.2);

    если в основании группировки лежит дискретный признак, то верхняя граница i-го интервала равна нижней границе i+1-го интервала, увеличенной на 1.

Августа 1920 – День статистики РБ.

Статист. наблюдение

№1 Статистические наблюдение –это первая стадия любого статистического исследования, представляющая собой научно-организованный по единой программе учет фактов о явлениях и процессах или сбор на основе этого учета массовых первичных статистических данных. Задачи статис. наблюдения: 1) обеспечение полноты информации об изучаемом явлении;2) получение достоверной информации;3) оперативность получения информации.

№2 Сбор первичного материала может быть организован 2 формами : 1) путем систематического получения от источников информации форм статис. отчетности;2) путем организации специального статис. обследования. Основными признаками разделения видов статис. наблюдения являются: 1) учет полноты охвата :

· сплошное- по всем единицам совокупности;

· не сплошное -по части единиц совокупности отобранных случайным образом(выборочное, способ основного массива, анкетный опрос, монографическое описание).

2) учет фактов по времени : текущая(постоянная) , периодическая, единовременная(эпизодическая).

№3 Программой статистических наблюдений называют систему, которой будут получены в результате разработки первичных данных и ответы на вопросы по регистрируемым получаемым признакам. Исходя из целей и задач конкретного статистического исследования разрабатывается как сама программа так и объект наблюдения. Объектом статис. наблюдения называют совокупность единиц, изучаемого массового явления о которых должны быть созданы статис. данные. Единицы совокупности и единицы наблюдения могут совпадать или не совпадать. Единица совокуп. - это первичный элемент объекта статис. наблюдения, являющейся носителем изучаемых признаков. Единица наблюдения - это первичная ячейка изучаемой совокупности, о которой получены изучаемые данные. После определения программы объекта единиц наблюдения составляются бланки (анкеты, формуляры) которые являются носителями пере чини вопросов на которые должны быть получены ответы. Носителями первичной стат. информации принята называть формулярами.

№4 Сбор статис. данных может осуществляться: 1) путем непосредственного учета фактов во время обсследования.2) на базе докумен. учета в момент совершения факта. 3) путем опроса людей.

Любое отклонение принято называть статис. погрешностью или ошибкой. С учетом причин возникновения различают: случайные ошибки регистрации, систематические ошибки регистрации, случайные ошибки представительности, систематические ошибки представительности. Накопленные стат. данные до их обработки подвергаются контролю : синтаксический, логический, арифметический.

Классификация и группировка в статистике

Классификация- это устойчивое разграничение объектов на основаниях их сходства и различиях по группам. Группировка- это разделение единиц совокупности по существенным признакам с целью выделения качественно-однородных типов-явлений и характеристики состава совокупности или взаимосвязи в изменении варирующих признаков. В отличии от классификации группировка производится только для целей данного стат. исследования. Метод группировки является одним из основных методов изучения массовых явлений., так как он представляет обработанный статис. материал для последующего изучения закономерностей явлений. Задачи методов группировок разделение всей совокупности на качественно однородные группы; характеристика структуры изучаемого явления(состав); характеристика взаимосвязей между изменяющими признаками.

№2 Основные виды группировок : 1)типологическая группировка - обеспечивает разграничение массового явления на качественно однородные группы. 2) структурная группировка – обеспечивает более глубокое изучение структуры однотипных явлений, а также позволяет выявить зависимости изучаемых признаков.3) аналитическая группировка предназначена для взаимосвязи и закономерностей между явлениями и процессами. При исследовании взаимосвязей признаки принято разделять на: факторные и результативные. В статистических исследованиях кроме основных групп применяются и другие: в зависимости от количества учитываемых при группировке признаков различают простую группировку (по 1 признаку) и сложную (2 и более признака). При сложных группировках необходимо учитывать требования представительности каждой из групп, то есть количество единиц в каждой группе должно быть таким, чтобы показать характерные черты групп. Вторичная группировка -в этом случаи группы подвергаются не единице совокупности, а уже имеющейся группировки. Динамические группировки- позволяют изучать изменение соотношений между группами в различные периоды времени.

№3 По своему содержанию признаки различаются: на количественные, атрибутивные (не имеющие количественное выражения) . Разновидность атрибутивных признаков являются альтернативные признаки. Единица совокупности может иметь или не иметь

1)определение количества групп . при атрибутивных признаках количество групп определяется довольно просто. При этом учитываются задачи статис. исследования и представительность групп. При количественном признаке количество групп определяется по формуле:n= 1+ 3,222 lgN, 2) определение интервала группировок это разница между максимальным и минимальным значением признака в каждой группе различают группировки: с равными интервалами и с неравными интервалами(равнонаполненые интервалы, величина интервала меняется по арифметической прогрессии)

3)установление набора показателей которые будут характеризовать каждую из выделенных групп.

Система показателей - это набор взаимосвязанных показателей позволяющих характеризовать изучаемые явления с необходимой полнотой. Вывод: таким образом метод группировок в статистике предусматривает выявление группировочных признаков, определение количества групп, установление интервалов группировки, а также установление для каждой группировки набора показателей которым она должна характеризоваться.

Статистическая сводка

№1 Статистическая сводка – это научная обработка первичных статистических материалов для характеристики изучаемой совокупности обобщающими показателями. От количества группировки и сводки зависит обоснованность получаемых обобщающих характеристик и правильность выводов. Сводка может быть: простая – предусматривает суммирование показателей по изучаемых признаках и получении итогов по всем единицам совокупности; групповая - предусматривает сначала распределение единиц изучаемой совокупности по группам, затем суммирование значения признаков по этим группам и в целом по всей совокупности.

№2 программа сводки разработана с учетом целей и задач статистических исследования,а также с учетом форм организации сводки и техники обработки. Элементы программы сводки: статистическая группировка; обоснование набора или системы показателей и методов их расчета, характеристика отдельной группы и совокупности в целом; подсчет групп и общих итогов; оформление конечных результатов сводки в с татистических таблицах.

№3 Ряды распределения. Для выполнения обработки статистических данных изучаемые единицы систематизируются по некоторым признакам. Результатом этой систематизации принято называть рядами распределения - это упорядоченное распределение единиц совокупности на группы по какому- либо признаку, в зависимости от форм признаков различают: 1) атрибутивные, 2) количественные которые могут быть дискретными (известные в каждой точке) и интервальные. Элементами рядов распределения являются варианты (значения) и численность единиц совокупности по группам. численное значение единиц совокупности может выражаться абсолютными величинами (частотами) или относительными (частностями) . простейшим методом анализа рядов распределения является их графическое изображение.

· Полигон распределение – графическое изображение дискретных рядов распределения в виде фигуры, состоящей из ломаной и первого и последнего перпендикуляров. По оси ох- ранжированные значения варирующего признака, по оу- величина частот.

· Гистограмма – это графическое изображение интервальных рядов распределения, по оси ох- величина интервала, оу- частота.

· Кумулятор (кумулятивная кривая) это графическое изображение по накопленным частотам

· Огива- э то графическое изображение накопленных частот, при катором по оси ох- частоты, оу- откладываются значения признака


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-26

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Основой статистической группировки является группиро- вочный признак - признак, по которому происходит разделение единиц совокупности на отдельные группы. От выбора группировочного признака полностью зависит правильность построения всей группировки. В качестве основания группировки необходимо использовать наиболее существенные признаки, имеющие четкое теоретическое обоснование. Группировочный признак должен в полной мере передавать специфику исследуемых социально-экономических явлений и процессов (рис. 3.2).

Рис. 3.2.

Основанием группировки могут служить две различные по форме выражения группы признаков - атрибутивные и количественные. Первые передают качественное состояние единицы наблюдения, вторые - количественное, числовое. Например, группировка населения по национальности является атрибутивной, по возрасту - количественной.

Статистическая группировка может быть разделена на виды но ряду характерных признаков: решаемые задачи, число группировочных признаков и отношения между ними, состояние исходных данных (рис. 3.3).


По решаемым задачам группировки делятся на типологические, структурные и аналитические. Особым видом является ряд распределения.

Типологическая группировка - это вид статистической группировки, в процессе которой происходит разделение разнородной совокупности на однородные группы с целью выявления типов социально-экономических явлений и процессов. Типологические группировки позволяют детально изучить процесс развития искомого явления или процесса, оценить силу воздействия различных факторов на изменения в его состоянии. К примеру, все население может быть разделено на возрастные группы: дети, молодежь, лица зрелого возраста, пожилые люди и т.п. Однако конкретные числовые характеристики, определяющие рамки каждой группы, со временем нередко меняются, создавая возможность принадлежности одной единицы наблюдения к различным типам.

Структурная группировка - это вид статистической группировки, в процессе которой происходит разделение однородной совокупности на однородные группы с целью выявления структуры социально-экономических явлений и процессов. Например, структура населения может быть изучена но национальности и месту проживания, оценена по концентрации живущих на той или иной территории, а анализ группировки за ряд лет позволит охарактеризовать структурные сдвиги по исследуемому признаку.

Аналитическая группировка - это вид статистической группировки, выявляющей зависимости между взаимодействующими признаками.

Статистическая теория разделяет признаки по функциям, выполняемым во взаимосвязи, на факторные и результативные. Факторный признак - это признак, под воздействием которого меняется другой признак - результативный.

Основой такой группировки является признак-фактор, по результативному признаку подсчитывается его среднее значение в каждой из выделенных групп. Сравнение изменений значений обоих признаков характеризует связь между ними. Если с увеличением значения факторного признака увеличивается значение результативного, то говорят о прямой связи между признаками, в противном случае - об обратной.

При исследовании воздействия на результат нескольких факторов строится многофакторная группировка. Ее задача заключается в выделении профилирующего факторного признака, оказывающего наибольшее влияние на результат.

По числу группировочных признаков различают простую и сложную группировки. В основу простой группировки кладется один группировочный признак, в основу сложной - два признака и более. В свою очередь сложная группировка может быть комбинационной или многомерной. Основание комбинационной группировки составляют от двух до четырех группировочных признаков, многомерной - любое число признаков свыше четырех.

Сложная группировка обеспечивает возможность детального изучения единицы наблюдения сразу по нескольким признакам. Основным правилом построения всех сложных группировок является первичное разделение единиц совокупности на группы но одному признаку, затем - на подгруппы по другому признаку и т.д. Предпочтительно первичное разделение на группы по атрибутивным признакам, вторичное - по количественным. Необходимым условием построения сложной группировки является большое число наблюдений для достижения достаточного количества единиц в каждой из подгрупп. В противном случае присутствует риск получения малообоснованных результатов.

По отношению между признаками сложные группировки бывают иерархические и неиерархические. При иерархической группировке значения второго признака определяются областью значений первого. При неиерархической группировке значения второго признака не зависят от значений первого.

В процессе экономико-статистического исследования нередко возникает необходимость анализа и сравнения общественных явлений и процессов в конкретных территориальных границах. Для этого используется пространственная группировка - группировка, основанная на географическом признаке.

Группировка может быть построена по взаимоисключающему характеру признака, т.е. по признаку, которым одни единицы совокупности обладают, а другие - нет. В теории статистики такой признак называется альтернативным. Типичным примером является группировка населения по полу.

Группировкой называется разбиение общей совокупности единиц объекта наблю-дения по одному или нескольким существенным признакам на однородные группы, раз-личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи-ровать связи между отдельными признаками. Группировки являются важнейшим стати-стическим методом обобщения статистических данных, основой для правильного исчис-ления статистических показателей.

С помощью метода группировок решаются следующие задачи:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения стати-стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида ос-новное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения соста-ва однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и призна-ками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений признаки не-обходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются дру-гие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значе-ние признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

Единицы статистической совокупности группируются по факторному признаку;

Каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).


Сначала группы формируются по одному признаку, затем группы делятся на под-группы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупно-сти одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь-ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала про-изводить группировку по атрибутивным признакам, значения которых имеют ярко выра-женные качественные различия.

Принципы построения статистических группировок и классификаций.

Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характери-зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится раз-биение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания груп-пировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качест-венные признаки. Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отрас-левая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количе-стве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в ос-нование группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупно-сти и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распреде-ление единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его ко-леблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оце-нить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R = Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы на-блюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизве-сти характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче-ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенно-стей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль-но-математический способ предполагает использование формулы Стерджесса :
n = 1 + 3,322 × lgN, (3.1)

n - число групп;

N - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово-купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя сред-него квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп-ность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокуп-ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными мето-дами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных гра-ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

Равные и неравные;

Открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, про-грессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного при-знака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h = R/n = Xmax - Xmin/n (3.2)

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n - число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или мини-мальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой вели-чину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до це-лого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьи-руют неравномерно, то надо использовать группировку с неравными интервалами. Нерав-ные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если по-сле построения равных интервалов по изучаемому признаку образуются группы, содер-жащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо-димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес-сивно-убывающие в арифметической или геометрической прогрессии. Величина интерва-лов, изменяющихся в арифметической и геометрической прогрессии, определяется сле-дующим образом:

h i+1 = h i + a,

а в геометрической прогрессии:

h i+1 = h i x q,

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах неболь-шая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показа-телю численности работающих, который варьирует от 500 человек до 3500 человек, неце-лесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и круп-нейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии.

Выбор ис-следователя в построении равных или неравных интервалов зависит от степени заполне-ния каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала су-щественна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно-сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех ос-тальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы ин-тервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственны-ми силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно ито же зна-чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу вклю-чать единицы наблюдения, значения признака у которых совпадают с границами интерва-лов. Например, во вторую или третью группу должна войти строительная фирма с объе-мом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в про-тивном случае - ко второй.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строитель-ных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных еди-ниц совокупности, значения которых являются граничными, к той или иной группе реша-ется на основе анализа последнего открытого интервала.

Возможны два случая обозначе-ния последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы ин-тервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интерва-лы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных усло-виях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрес-сивно-убывающими. Такие интервалы называются произвольнымии , как правило, ис-пользуются при группировке предприятий, например, по уровню рентабельности.

Понравилась статья? Поделитесь с друзьями!
Была ли эта статья полезной?
Да
Нет
Спасибо, за Ваш отзыв!
Что-то пошло не так и Ваш голос не был учтен.
Спасибо. Ваше сообщение отправлено
Нашли в тексте ошибку?
Выделите её, нажмите Ctrl + Enter и мы всё исправим!