Сглаживание динамических рядов. Методы сглаживания динамических рядов

Обработка динамических рядов

Анализ Данных

4. Метод аналитического выравнивания

Первые шаги

Арендный блок

Существует несколько методов обработки рядов динамики, а именно: метод укрупнения интервалов, метод скользящей средней и аналитическое выравнивание. Во всех методах вместо фактических уровней при обработке ряда рассчитываются иные уровни, в которых тем или иным способом взаимопогашается действие случайных факторов и тем самым уменьшается колеблемость уровней. Последние в результате становятся как бы «выравненными», «сглаженными» по отношению к исходным фактическим данным. Такие методы обработки называются сглаживанием или выравниванием рядов динамики.

Методы сглаживания и выравнивания динамических рядов.

Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы:

1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уровней ряда.

2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.

Методы «механического» сглаживания.

Сюда относятся:

а. Метод усреднения по двум половинам ряда, когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.

б. Метод укрупнения интервалов, при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.

в. Метод скользящей средней. Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период. Последовательность определения скользящей средней:

Устанавливается интервал сглаживания или число входящих в него уровней. Если при расчете средней учитываются три уровня, скользящая

средняя называется трехчленной, пять уровней пятичленной и т.д. Если сглаживаются мелкие, беспорядочные колебания уровней в ряду динамики,

то интервал (число скользящей средней) увеличивают. Если волны следует сохранить, число членов уменьшают.

Исчисляют первый средний уровень по арифметической простой:

y1 = (y1/m, где

y1 I-ый уровень ряда;

m членность скользящей средней.

Первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет y будет включен последний уровень исследуемого ряда динамики yn.

По ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Методы «аналитического» выравнивания

Более точным способом отображения тенденции динамического ряда

является аналитическое выравнивание, т. е. выравнивание с помощью

аналитических формул. В этом случае динамический ряд выражается в виде

функции у (t), в которой в качестве основного фактора принимается время t,

и изменения аргумента функции определяют расчетные значения уt.

Фактическими (или эмпирическими) уровнями ряда динамики называют исходные данные об изменении явления, т. е. данные, полученные опытным путем, посредством наблюдения. Они обозначаются уi. Расчетными (или

теоретическими) уровнями ряда называют значения, полученные в результате

подстановки в уравнение тренда значений t, и обозначают их.

Целью аналитического выравнивания динамического ряда является

определение аналитической или графической зависимости f(t) . На практике по

имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Чаще всего при выравнивании используются следующий зависимости:

линейная ;

параболическая ;

экспоненциальная

1)Линейная зависимость выбирается в тех случаях, когда в исходном временном ряду наблюдаются более или менее постоянные абсолютные и цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению.

2)Параболическая зависимость используется, если абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) никакой тенденции развития не проявляют.

3)Экспоненциальные зависимости применяются, если в исходном временном ряду наблюдается либо более или менее постоянный относительный рост

(устойчивость цепных темпов роста, темпов прироста, коэффициентов роста)

Либо, при отсутствии такого постоянства, -- устойчивость в изменении

показателей относительного роста (цепных темпов роста цепных же темпов

роста, цепных коэффициентов роста цепных же коэффициентов или темпов роста и т.д.)

Таким образом, целью аналитического выравнивания является:

Определение вида функционального уравнения;

Нахождения параметров уравнения;

Расчет «теоретических», выровненных уровней, отображающих основную

тенденцию ряда динамики.

Графическое отображение изменения уровней ряда играет большую роль в

применении данного вида выравнивания. Оно позволяет ускорить процедуру

анализа и увеличить степень наглядности полученных результатов.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Эта тема принадлежит разделу:

Табличные и графические представления данных, анализ, обработка. Выборка. Группировка данных. Прогнозирование

1. 2. Методы сглаживания и выравнивания динамических рядов.
Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы:
1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уровней ряда.
2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.
1.2. 1 Методы «механического» сглаживания .
Сюда относятся:
а. Метод усреднения по двум половинам ряда , когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.
б. Метод укрупнения интервалов , при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.
Укрупнение интервалов – это простейший метод сглаживания уровней ряда с целью выявить основную тенденцию их изменения. При этом для укрупненных интервалов определяется итоговое значение или средняя величина исследуемого показателя. Этот метод особенно эффективен, если первоначальные уровни ряда соответствуют коротким промежуткам времени. Например, если есть данные о ежесуточной погрузке грузов по какой-либо железной дороге за месяц, то в таком ряду вероятны значительные колебания уровней, так как чем меньше период, за который приводятся данные, тем больше влияния случайных факторов.

Чтобы устранить это влияние, рекомендуется укрупнить интервалы времени (например, до 5 или 10 дней) и рассчитать общий или среднесуточный объем погрузок (соответственно по пятидневкам или декадам). В ряду с укрупненными интервалами времени закономерность изменения уровней будет более наглядной.

Пример 2.8. Пусть имеются следующие данные о выпуске продукции на предприятии по месяцам за год (в сопоставимых ценах):

Решение . Укрупним интервалы до трех месяцев и рассчитаем суммарный и среднемесячный выпуск продукции по кварталам. Получим следующие результаты:

Очевидно, что новые данные более четко выражают закономерность изменения выпуска продукции за год – увеличение из квартала в квартал.

в. Метод скользящей средней . Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период. Последовательность определения скользящей средней:
- устанавливается интервал сглаживания или число входящих в него уровней. Если при расчете средней учитываются три уровня, скользящая средняя называется трехчленной, пять уровней – пятичленной и т.д. Если сглаживаются мелкие, беспорядочные колебания уровней в ряду динамики, то интервал (число скользящей средней) увеличивают. Если волны следует сохранить, число членов уменьшают.
- Исчисляют первый средний уровень по арифметической простой:
y1 =Sy1/m, где
y1 – I-ый уровень ряда;
m – членность скользящей средней.
- первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет y будет включен последний уровень исследуемого ряда динамики yn.

По ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Отрицательной стороной использования метода скользящей средней является образование сдвигов в колебаниях уровней ряда, обусловленных «скольжением» интервалов укрупнения. Сглаживание с помощью скользящей средней может привести к появлению «обратных» колебаний, когда выпуклая «волна» заменяется на вогнутую.
В последнее время стала рассчитываться адаптивная скользящая средняя. Ее отличие состоит в том, что среднее значение признака, рассчитываемое также как описано выше, относится не к середине ряда, а к последнему промежутку времени в интервале укрупнения. Причем предполагается, что адаптивная средняя зависит от предыдущего уровня в меньшей степени, чем от текущего. То есть., чем больше промежутков времени между уровнем ряда и средним значением, тем меньшее влияние оказывает значение этого уровня ряда на величину средней.
г. Метод экспоненциальной средней . Экспоненциальная средняя – это адаптивная скользящая средняя, рассчитанная с применением весов, зависящих от степени «удаленности» отдельных уровней ряда от среднего значения. Величина веса убывает по мере удаления уровня по хронологической прямой от среднего значения в соответствии с экспоненциальной функцией, поэтому такая средняя называется экспоненциальной. На практике применяется многократное экспоненциальное сглаживания ряда динамики, которое используется для прогнозирования развития явления.
Вывод: способы, включенные в первую группу, ввиду применяемых методик расчета предоставляют исследователю очень упрощенное, неточное, представление о тенденции в ряду динамики. Однако корректное применение этих способов требует от исследователя глубины знаний о динамике различных социально - экономических явлений.
1.2.2 Методы «аналитического» выравнивания
Более точным способом отображения тенденции динамического ряда является аналитическое выравнивание, т. е. выравнивание с помощью аналитических формул. В этом случае динамический ряд выражается в виде функции у (t), в которой в качестве основного фактора принимается время t, и изменения аргумента функции определяют расчетные значения уt.
Фактическими (или эмпирическими) уровнями ряда динамики называют исходные данные об изменении явления, т. е. данные, полученные опытным путем, посредством наблюдения. Они обозначаются уi. Расчетными (или теоретическими) уровнями ряда называют значения, полученные в результате подстановки в уравнение тренда значений t, и обозначают их.
Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t) . На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Метод скользящей средней  метод изучения в рядах динамики основной тенденции развития явления.

Суть метода скользящей средней состоит в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем  средний уровень из того же числа уровней, начиная со второго, далее  начиная с третьего и т. д. Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий.

Средняя из нечетного числа уровней относится к середине интервала. Если интервал сглаживания четный, то отнесение средней к определенному времени невозможно, она относится к середине между датами. Для того чтобы правильно отнести среднюю из четного числа уровней, применяется центрирование, т. е. нахождение средней из средней, которую относят уже к определенной дате.

Покажем применение скользящей средней на следующем примере. Пример 3.1 . На основе данных об урожайности зерновых культур в хозяйстве за 1989–2003 гг. проведем сглаживание ряда методом скользящей средней.

Динамика урожайности зерновых культур в хозяйстве за 1989–2003 гг. и расчет скользящих средних

1 . Рассчитаем трехлетние скользящие суммы. Находим сумму урожайности за 1989–1991 гг.: 19,5  23,4  25,0  67,9 и записываем это значение в 1991 г. Затем из этой суммы вычитаем значение показателя за 1989 г. и прибавляем показатель за 1992 г.: 67,9 – 19,5  22,4  70,8 и это значение записываем в 1992 г. и т. д.

2 . Определим трехлетние скользящие средних по формуле простой средней арифметической:

Полученное значение записываем в 1990 г. Затем берем следующую трехлетнюю скользящую сумму и находим трехлетнюю скользящую среднюю: 70,8: 3  23,6, полученное значение записываем в 1991 г. и т. д.

Аналогичным образом рассчитываются четырехлетние скользящие суммы. Их значения представлены в графе 4 таблицы данного примера.

Четырехлетние скользящие средние определяются по формуле простой средней арифметической:

Это значение будет отнесено между двумя годами - 1990 и 1991 гг., т. е. в середине интервала сглаживания. Для того чтобы найти четырехлетние скользящие средние центрированные, необходимо найти среднюю из двух смежных скользящих средних:

Эта средняя будет отнесена к 1991 г. Аналогичным образом рассчитываются остальные центрированные средние; их значения записываются в графу 6 таблицы данного примера.

Уравнение прямой при аналитическом выравнивании ряда динамики имеет следующий вид:

где - выровненный (средний) уровень динамического ряда; a 0 , a 1 - параметры искомой прямой; t - обозначение времени. 

Способ наименьших квадратов дает систему двух нормальных уравнений для нахождения параметров a 0 и a 1:

где у  исходный уровень ряда динамики ; n  число членов ряда.

Система уравнений упрощается, если значения t подобрать так, чтобы их сумма равнялась нулю, т. е. начало времени перенести в середину рассматриваемого периода.

Если то

Исследование динамики соц.-экон. явлений и установление основной тенденции развития дают основание для прогнозирования (экстраполяции)  определения будущих размеров уровня экономического явления. Используют следующие методы экстраполяции:

■ средний абсолютный прирост  с/показатель, исчисляемый для выражения средней скорости роста (снижения) соц.-эк. процесса. Определяется по формуле:

■ средний темп роста;

■ экстраполяцию на основе выравнивания по какой-либо аналитической формуле.Метод аналитического выравнивания-метод исследования динамики соц.-экон. явлений, позволяющий установить основные тенденции их развития.

Рассмотрим применение метода аналитического выравнивания по прямой для выражения основной тенденции на ПримерЕ 4.1 . Исходные и расчетные данные определения параметров уравнения прямой:

Основные способы организации выборки

Достоверность статистических выводов и содержательная интерпретация результатов зависит от репрезентативности выборки, т.е. полноты и адекватности представления свойств генеральной совокупности, по отношению к которой эту выборку можно считать представительной. Изучение статистических свойств совокупности можно организовать двумя способами: с помощью сплошного и несплошного наблюдения. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности , а несплошное (выборочное) наблюдение - только его части.

Существуют пять основных способов организации выборочного наблюдения:

1. простой случайный отбор , при котором объектов случайно извлекаются из генеральной совокупности объектов (например с помощью таблицы или датчика случайных чисел), причем каждая из возможных выборок имеют равную вероятность. Такие выборки называются собственно-случайными ;

2. простой отбор с помощью регулярной процедуры осуществляется с помощью механической составляющей (например, даты, дня недели, номера квартиры, буквы алфавита и др.) и полученные таким способом выборки называются механическими ;

3. стратифицированный отбор заключается в том, что генеральная совокупность объема подразделяется на подсовокупности или слои (страты) объема так что . Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия - по отраслям). В этом случае выборки называютсястратифицированными (иначе, расслоенными, типическими, районированными );

4. методы серийного отбора используются для формирования серийных или гнездовых выборок . Они удобны в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или население при территориально-административном делении страны). Отбор серий можно осуществить собственно-случайным или механическим способом. При этом проводится сплошное обследование определенной партии товара, или целой территориальной единицы (жилого дома или квартала);

5. комбинированный (ступенчатый) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический); такая выборка называется комбинированной .

Виды отбора

По виду различаются индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе - качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборку.

Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности N сокращается в процессе отбора. При повторном отборе попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности N остается неизменной (метод в социально-экономических исследованиях применяется редко). Однако, при большом N (N → ∞) формулы для бесповторного отбора приближаются к аналогичным для повторного отбора и практически чаще используются последние (N = const ).

Выборки бывают детерминированные и вероятностные .

Детерминированная выборка состоит из элементов, включенных в нее без учета вероятности их появления, Т.е. респонденты по собственной инициативе участвуют в опросах. Типичным примером является нерепрезентативные выборки. Например, многие компании проводят опросы, предоставляя посетителям их Web-страниц возможность заполнить анкету и переслать ее через Интернет. Такие анкеты позволяют собрать большое количество информации за короткий промежуток времени, однако выборки состоят от ответов пользователей Интернет, которые принимают участие в опросе по собственной инициативе. Во многих случаях единственным видом доступных выборок являются не вполне случайные выборки. В этом случае крайне важным для получения осмысленных результатов становится мнение эксперта в предметной области опроса. Групповые выборки и порции данных представляют собой еще один пример детерминированных выборок.

Вероятностная выборка – состоит из элементов, вероятность появления которых известна заранее. Существует четыре вида вероятностных выборок: простая случайная, систематическая, стратифицированная и кластер.

Простая случайная выборка . В рамках простого случайного выбора символом n обычно обозначают объем выборки, а символом N – объем основы (генеральной совокупности). Каждый элемент основы нумеруется числами от 1 до N. Вероятность выбрать любой конкретный элемент основы при первом извлечении равны 1/ N.

Случайная выборка должна быть представительной, т.е. репрезентативна. Репрезентативная выборка – это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Существует два основных способа извлечения выборок: с возвращением и без него. Выбор с возвращением означает, что выбранный элемент возвращается в основу, причем вероятность его повторного извлечения остается постоянной.

Выбор без возвращения означает, что после извлечения элемент не возвращается в основу и, следовательно, не может быть выбран вновь.

При формировании систематической выборки N элементов, образующих основу, разбиваются на к групп, имеющих объем n. Иначе говоря, k=N/n.

Число k-округляется до ближайшего целого числа. Чтобы получить систематическую выборку, ее первый элемент нужно случайным образом выбрать из первых k элементов первой группы, взятой из основы. Остальные элементы образуются путем выбора каждого k-го элемента всей основы.

Для образования кластерной выборки основа, состоящая из N элементов, разбивается на несколько кластеров так, чтобы каждый кластер отражал свойства всей генеральной совокупности. Затем осуществляется простой случайный выбор кластеров, в которых изучаются все элементы.

4)) Методы группировки данных

Группировка – разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов называется классификацией или стандартом, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он может носить как количественный, так и качественный характер. В ряде случаев группировка, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал очерчивает количественные границы групп и представляет собой промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают равные, неравные, закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует).

Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования взаимосвязи факторных и результативных признаков. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная и аналитическая.

В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.

Простая группировка выполняется по одному признаку. Среди простых группировок особо выделяются ряды распределения. Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака применяется один показатель – численность группы.

Возьмем условный пример дискретного ряда распределения студентов заочного отделения по росту:

№ п/п

Рост, см

Данный ряд является ранжированным, так как значения роста упорядочены по возрастанию.

Построим интервальный ряд распределения студентов по росту, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при дальнейшем анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной (иначе для сопоставимости придется частоты делить на единицу интервала - полученное значение называется плотностью).

Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, то не проявится закономерность вариации; если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения.

Пример. Проанализировать уровень еженедельной зарплаты (тенге) рабочих фирмы на основании выборки из 30 рабочих

6500 4580 5670 7460 7650 8760 6960 6540 7490 3760 5430 6540 6750 4390 7830 6200 5700 6430 7950 2300 6490 5630 7890 5680 6430 5890 7900 5370 5890 3500

Данные, в таком первоначальном виде, трудно анализировать. Чтобы они имели содержательный характер представляем их в виде таблицы частот. Для этого, чтобы определить общий диапазон таблицы частот, находим наибольшее и наименьшее значения. В примере наибольшее значение – 8760 тенге, а наименьшее значение - 2300 тенге. В Excel для этих целей можно применить функции МАКС и МИН.

Далее необходимо разбить указанный диапазон на группы или интервалы группировки. Во многих случаях целесообразно проводить разбивку на большее или меньшее число групп. При группировке данных возникает вопрос о том, на сколько групп будет разбита изучаемая совокупность. На этот вопрос нет стандартного ответа. Если распределение признака в границах его вариации достаточно равномерно или близко к нормальному, диапазон колебаний признака разбивают на равные интервалы, длину которых определяют по формуле:

где x max , x min –максимальное и минимальное значение признака в совокупности; k - число групп. Число групп можно определит по формуле Стерджесса k=1+3,322lgN, где N- число единиц в совокупности. Обычно группы имеют одинаковую интервальную протяженность. В нашем примере интервалы данных могут быть определены по формуле:

k=1+3,322lgN=1+3,322хlg30=1+3,322х1,477=5,9

h= =

Полученное значение следует корректировать для облегчения расчетов, в нашем примере по 1000. Таким образом представим в виде таблицы 1.

Таблица 1- Частота группировки

По этой таблице видно, что основная часть, из 30 рабочих 24 зарабатывают в пределах 5000-8000 тенге. При приеме рабочих на работу можно им сказать что, в среднем многие рабочие зарабатывают от 5000 до 8000 тенге. Исходные данные могут быть сведены в таблицу с открытыми границами, как это показано ниже:

Таблица 2- Группировка по удельному весу

По этой таблице 2 видно, что на фирме из 30 рабочих 80% рабочих получают от 5000 до 8000 тенге.

Закрытыми называются интервалы, у которых указаны обе границы, открытыми – интервалы с одной границей. Интервалы 2000- охватывает жалование от 2000 и выше, но ниже первой цифры интервала следующей группы, т.е. ниже 3000 тенге.

При использовании равных интервалов для образования групп, излишне увеличивается их количество, при этом многие группы будут малочисленными. В этих условиях совокупность разбивают на группы с неравными интервалами.

Распределение частот

При увеличении объема выборки ни упорядоченный массив, ни диаграмма «ствол и листья» уже не позволяют легко представлять, анализировать и интерпретировать результаты. Для больших наборов данных следует создавать сводные таблицы, распределяя данные по группам (или категориям). Такой способ представления данных называется распределением частот .

Распределение частот представляет собой сводную таблицу, в которой данные распределены по группам или категориям.

Если данные сгруппированы в виде распределения частот, процесс их анализа и интерпретации становится более управляемым и осмысленным. При распределении частот следует внимательно выбирать интервал группирования, или размах групп, а также вычислять границы каждой группы, не допуская их перекрытия.

Количество групп, выбранных для группировки данных, непосредственно зависит от объема исходной выборки. Чем больше элементов содержит выборки, тем больше групп можно создать. Однако, как правило, рапределение частот должно содержать не менее 5 и не более 15 групп.

Каждая группа, образующая распределение частот, должна иметь одинаковый размах. Для вычисление распределения частот необходимо так определить границы групп, чтобы они не пересекались. Перекрытие групп не допускается. В таблице 2 приведена группировка данных. Главным преимуществом этой таблицы является возможность легко вычислять основные характеристики данных. Например, приближенный диапазон недельное жалования ограничен числами 2000 и 9000, причем показатели в основном группируются в диапазоне от 5000 до 8000.

Для более углубленного анализа распределения частот можно построить либо распределение относительных частот, либо процентное распределение. Распределение относительных частот вычисляется путем деления количества элементов каждой группы, образующей распределение частот, на общее количества наблюдений.

5)) Методы группировки данных с помощью функции ЧАСТОТА

В Excel для построения выборочных функций распределения используется функция «ЧАСТОТА». Данная функция вычисляет частоты появления случайной величины в заданных интервалах значений и выводит их как массив частот. Функция «ЧАСТОТА» находится в категории «Статистические» Аргумент «Массив данных» - это множество данных, для которых вычисляются частоты. Аргумент «Массив интервалов» - это множество интервалов, в которые группируются значения аргумента «массив данных» (Рисунок 6)

Количество элементов (частот) в возвращаемом массиве числа элементов в массиве интервале. Массив интервалов значений должен быть построен до вызова функции ЧАСТОТА

Следуя принципу «лучше один раз увидеть, чем сто раз услышать», для анализа статистических данных часто используют графические изображения, а не таблицы.

Дли повышения наглядности эмпирических распределений, используется их графическое представление. Наиболее распространенными способами графического представления являются гистограмма, полигон частот и полигон накопленных частот (кумулята).2.3.1. Гистограмма

Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников, как показано на рис. 2.1. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал. Если ряд безинтервальный, то ширина всех столбцов выбирается произвольной, но одинаковые. Таким образом, высоты прямоугольников должны быть пропорциональны величинам

где n i - частота i -го интервала группировки; h i - ширина i -го интервала группировки.

На графике гистограммы основание прямоугольников откладывается по оси абсцисс (x ), а высота - по оси ординат (у ) прямоугольной системы координат.

Однако в тех случаях, когда ширина всех интервалов группировки одинакова, вид гистограммы не изменится, если по оси ординат откладывать не величины р i , а частоты интервалов n i .

Полигон частот

Другим распространенным способом графического представления является полигон частот.

Полигон частот образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов, срединные значения откладываются по оси х , а частоты – по оси у .

Из сравнения двух рассмотренных способов графического представления эмпирических распределений следует, что для получения полигона частот из построенной гистограммы нужно середины вершин прямоугольников, образующих гистограмму, соединить отрезками прямых. Пример полигона частот представлен

Полигон частот используется для представления распределений как непрерывных, так и дискретных признаков. В случае непрерывного распределения полигон частот является более предпочтительным способом графического представления, чем гистограмма, если график эмпирического распределения описывается плавной зависимостью.

6)) Понятие о временных рядах и их виды. Компоненты временного ряда

Понятие о временных рядах и их виды. Статистическое описание развития экономических процессов во времени осуществляется с помощью временных рядов.

Временным рядом называется ряд наблюдений за значениями некоторого показателя (признака), упорядоченный в хронологической последовательности, т.е. в порядке возрастания переменной t- временного параметра. Отдельные наблюдения временного ряда называются уровнями этого ряда.

Временные ряды делятся на моментные и интервальные. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. Например, моментными являются временные ряды цен на определенные виды товаров, временные ряды курсов акций, уровни которых фиксируются для конкретных чисел. Примерами моментных временных рядов могут служить также ряды численности населения или стоимости основных фондов, т.к.значения уровней этих рядов определяются ежегодно на одно и то же число.

В интервальных рядах уровни характеризуют значение показателя за определенные интервалы (периоды) времени. Примерами рядов этого типа могут служить временные ряды производства продукции в натуральном или стоимостном выражении за месяц, квартал, год и т.д.

Иногда уровни ряда представляют собой не непосредственно наблюдаемые значения, а производные величины: средние или относительные. Такие ряды называются производными. Уровни таких временных рядов получаются с помощью некоторых вычислений на основе непосредственно наблюдаемых показателей. Примерами таких рядов могут служить ряды среднесуточного производства основных видов промышленной продукции или ряды индексов цен.

Уровни ряда могут принимать детерминированные или случайные значения. Примером ряда с детерминированными значениями уровней служит ряд последовательных данных о количестве дней в месяцах. Естественно, анализу, а в дальнейшем и прогнозированию, подвергаются ряды со случайными значениями уровней. В таких рядах каждый уровень может рассматриваться как реализация случайной величины - дискретной или непрерывной.

Компоненты временного ряда. В практике прогнозирования принято считать, что значения уровней временных рядов экономических показателей состоят из следующих компонент: тренда, сезонной, циклической и случайной составляющих.

Под трендом понимают изменение, определяющее общее направление развития, основную тенденцию временного ряда. Это систематическая составляющая долговременного действия. Наряду с долговременными тенденциями во временных рядах экономических процессов часто имеют место более или менее регулярные колебания -

периодические составляющие рядов динамики. Если период колебаний не превышает 1 года, то их называют сезонными. Чаще всего причиной их возникновения считаются природно-климатические условия. Иногда причины сезонных колебаний имеют социальный характер, например, увеличение закупок в предпраздничный период, увеличение платежей в конце квартала и т.д. При большем периоде колебания, считают, что во временных рядах имеет место циклическая составляющая. Примерами могут служить демографические, инвестиционные и другие циклы. Если из временного ряда удалить тренд и периодические составляющие, то останется нерегулярная компонента.

Экономисты разделяют факторы, под действием которых формируется нерегулярная компонента, на 2 вида: _ факторы резкого, внезапного действия; _ текущие факторы.

Первый тип факторов (например, стихийные бедствия, эпидемии и др.), как правило, вызывает более значительные отклонения по сравнению со случайными колебаниями- иногда такие отклонения называют катастрофическими колебаниями. Факторы второго типа вызывают случайные колебания, являющиеся результатом действия большого числа побочных причин. Влияние каждого из текущих факторов незначительно, но ощущается их суммарное воздействие.Если временной ряд представляется в виде суммы соответствующих компонент, то полученная модель носит название аддитивной (1.1), если в виде произведения - мультипликативной (1.2) или смешанного типа (1.3):

Yt = ut + st + vt + et (1.1) Yt = ut _ st _ vt _ et (1.2) Yt = ut _ st _ vt + et (1.3),

где yt- уровни временного ряда;

ut -трендовая составляющая;st- сезонная компонента;vt - циклическая компонента;et- случайная компонента.

7)) Показатели изменения уровней ряда динамики

Показатели изменения уровней ряда динамики. Анализ скорости развития явления во времени характеризуется с помощью статистических показателей, которые получаются в результате сравнения уровней между собой. К ним относятся: абсолютный прирост, темп роста и прироста, абсолютное значение одного процента прироста

Абсолютный прирост () рассчитывается как разность между двумя уровнями ряда. В зависимости от базы сравнения могут быть цепными или как базисными. если к=1, то уровень у i -1 предыдущим для данного ряда, а абсолютные приросты изменения уровня будут цепными.

Темп роста - относительный показатель, рассчитывается как отношение двух уровней ряда. Интенсивность уровней оценивается отношением отчетного уровня к базисному, и выражается коэффициентом роста и темпом роста. Коэффициент роста показывает во сколько раз данный уровень ряда больше базисного уровня. В качестве базисного уровня в зависимости от цели исследования может приниматься какой-то постоянный для всех уровень, либо для каждого последующего предшествующий ему.

базисный темп рост или цепные темпы роста

Темп прироста – относительный показатель, показывающий, на сколько процентов данный уровень больше другого, принимаемого за базу сравнения. Можно рассчитать двояко.

или

Исчисление средних показателей в рядах динамики. Обобщенной характеристикой динамического ряда может служить прежде всего средний уровень ряда У. Она называется средней хронологической. Для разных видов рядов динамики средний уровень рассчитывается неодинаково.

В интервальном ряду абсолютных величин с равными периодами средний уровень рассчитывается как средняя арифметическая простая из уровней ряда. На примере

Аналогично определяется средний уровень и в рядах средних величин. Так неправильно. Несколько по другому рассчитывается средний уровень для моментных рядов. Для моментного ряда, содержащего п уровней с равными промежутками между моментами, средний уровень определяется по формуле

Эта средняя известна в статистике как средняя хронологическая для моментных рядов.

В случае неравных промежутков между датами среднюю хронологическую для моментного ряда можно рассчитать как среднюю арифметическую из средних значений уровней не каждую пару моментов, взвешенных по величине расстояний между датами.

Например. Пусть имеются следующие данные о наличии товарных остатков на складе за 2005г.

Дата учета	01.01.2005	01.03.2005	01.06.2005	01.11.2005	01.01.2006
Остатки товаров у.

Тогда средний месячный остаток товаров за 2005г. составит.

Средний абсолютный прирост уровней рассчитывается как средняя арифметическая простая из отдельных цепных приростов

У 0 -как базисный для расчета приростов с 2002 года, поэтому периодов 5.

Особое значение в анализе рядов динамики придается расчету средних темпов роста. Наиболее часто средний темп роста рассчитывается как средняя геометрическая из цепных темпов роста, рассчитанных в каждый период по отношению к предыдущему.

Или (1)

Вместе с тем при расчете среднего коэффициента роста порой более важно ориентироваться на достижение обшей суммы уровней, а не только конечного уровня. Например, когда идет речь о динамике таких показателей, как вложение инвестиций, ввод в действие жилой площади, строительство автомобильных дорог, то здесь важно определить средний темп роста, при котором достигается суммарное значение показателя за анализируемый период, а не только конечный уровень. Тогда средний уровень вычисляется по формуле и называется средней параболической

(2)

Полученное значение правой части определяется по таблице, ориентированной на получение суммы уровней за период.

Например, определить средний коэффициент роста ввода в действие жилой площади за 2000-2005 гг

Сначала рассчитаем средний темп роста по формуле (1)

т.е. ежегодно ввод в действие жилой площади снижается на 0,3%. Здесь расчет среднего годового темпа роста надо выполнять, ориентируясь на общую сумму ввода в действие жилья за весь период, тогда используется формула

при п=5 ищем значение, близкое к полученному нами отношению, это 5,468 и оно соответствует к=1,03 или Т=103%, что означает увеличение ввода в действие жилой площади в указанный период ежегодно в среднем на 3%. Аналогично решается при снижении уровней

Средние темпы прироста рассчитывается на основе средних темпов роста путем вычитания из последних 100%.

Т пр =Т р -100%. В предыдущем примере средний темп рост составляет 103% тогда средний темп прироста = 103%-100%=3%.

Показатели изменения уровней ряда могут быть использованы при выборе аналитической кривой для выравнивания ряда. Например, выравнивание по прямой линии эффективно для рядов уровней, которых первые разности (абсолютные приросты) уровней более или менее постоянны. Парабола 2-го порядка отражает развитие с ускоренным или замедленным изменением уровней ряда., т.е. при этом абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) постоянны.

Если при последовательном расположении t значения уровней меняются в геометрической прогрессии, то такое развитие можно отразить показательной функцией.

8)) Обобщающие характеристики ряда динамики (средние уровней ряда; средние показатели уровней ряда)

Рядами динамики называются ряды расположенных в хронологическом порядке показателей, характеризующих изменение какой-либо величины во времени. Ряды динамики включают два основных элемента: показатели времени - t и соответствующие им показатели величины - Y.

Средние показатели динамики

1. Средний уровень

Характеризует типичную величину показателей

В интервальном динамическом ряду рассчитывается как простое арифметическое среднее

Y_{avg} = \frac{\sum Y_i}{n}

В моментном динамическом ряду с равными промежутками времени между отсчетами как хронологическое среднее

Y_{avg} =\frac {\frac{1}{2}Y_1 + Y_2 + ... + Y_{n-1} + \frac{1}{2}Y_n}{n-1}

2. Средний абсолютный прирост

Обобщающий показатель скорости абсолютного изменения значений динамического ряда

\Delta_{avg}Y = \frac{\Delta Y_b_i}{n-1}

3. Средний темп роста

Обобщающий характеристика темпов роста ряда динамики

T_{avg} = {T_b_i}^{\frac{1}{i-1}} (корень степени i - 1)

4. Средний темп прироста

Отношение тоже что и между темпом роста и темпом прироста

T_{avg}\Delta = T_{avg}-1

Для обобщающей характеристики динамики используются:

1средние уровни ряда;

2средние показатели изменения уровней ряда:

Средний абсолютный прирост;

Средний коэффициент роста;

Средний темп прироста.

Средний уровень ряда даёт обобщённую характеристику показателя за весь период, охватываемый рядом динамики.

Средний уровень в интервальном и моментальном рядах динамики определяется по разному. В интервальном ряду с равными периодами (интервалами) средний уровень рассчитывается по формуле простой средней арифметической. Например, средний уровень добычи нефти, выплавки чугуна и так далее ежегодно (за месяц) за рассматриваемый период. Таким образом, чтобы исчислить среднюю из интервального ряда, нужно сложить члены ряда и разделить полученную сумму на их число. Эта средняя известна в статистике как Средняя характеристическая для моментального ряда. Таким образом, средняя хронологическая из моментального ряда динамики равняется сумме показателей этого ряда (при этом начальный и конечный уровни должны быть взяты в половинном размере), делённой на число показателей без одного.

В случае неравных интервалов времени между фактами (моментами, датами) средний уровень ряда определяется в следующей последовательности: 1) определяется средние за интервалы, ограниченные двумя датами; 2) расчёт из них общей средней; при этом средние за более длительные интервалы должны быть взяты с весами, кратные их длине.

Темпы роста (темпы динамики ТР ) – это относительный статистический показатель, определяемый как отношение одного уровня к другому одного и того же и показывающий во сколько раз один уровень больше(меньше) другого.

В зависимости от выбора базы сравнения темпы роста рассчитываются как цепные, когда каждый уровень сопоставляется с уровнем предыдущего периода и как базисные, когда все уровни ряда сопоставляются с уровнем одного какого-то периода, принятого за базу сравнения (как правило, это бывает начальный уровень ряда, но может быть и уровень любого другого периода) Соответственно цепные темпы роста (Трцi) характеризуют интенсивность развития явления в каждом отдельном периоде, а базисное – интенсивности развития за любой отрезок времени (отделяющий данный уровень от базисного). В том и другом случае темпы роста могут быть выражены в виде коэффициентов, если основание отношения принимается за единицу, и в виде процентов, если основание принимается за 100.

Темп прироста (Тп) показывает на сколько процентов изменился сравниваемый уровень с уровнем, за базу сравнения. Этот показатель можно рассчитать: 1) путём вычисления 100% и соответствующего темпа роста или 2) как процентное отношение абсолютного прироста к тому базисному уровню, по сравнению с которым абсолютный прирост рассчитан. Отсюда вывод, что между показателями темпа прироста и темпа роста имеется взаимосвязь и Если уровни ряда динамики уменьшаются (сокращаются), то соответственно показатели темпа прироста со знаком “-” и со знаком “+”, если уровни увеличиваются. Таким образом темп прироста характеризует относительное увеличение или уменьшение уровня явления.
Показатель абсолютного значения 1% прироста (А%) определяется как частное от деления абсолютного прироста на темп прироста (за соответствующий период) А%=?y: Тn(%).

Абсолютное значение 1% прироста равняется одной сотой предыдущего уровня. Нетрудно видеть отсюда, что расчёт абсолютного значения 1% прироста имеет смысл только для цепных приростов и темпов прироста.
Для базисного прироста накопленные приросты с одним и тем же первоначальным уровнем и, следовательно, для всех приростов будет сокращаться одно и то же значение 1% прироста.

9)) Методы сглаживания динамических рядов

Санкт-Петербургский юридический институт (филиал) Академии

Генеральной прокуратуры Российской Федерации

Кафедра общегосударственных и социально-экономических

дисциплин

Е.А. Разумовская

Показатели

Число тяжких прест.
(старый перечень)

Число тяжких прест.
(новый перечень)

Сомкнутый ряд

Практикум по курсу

«Правовая статистика»

Часть 2

Санкт-Петербург

ОБРАБОТКА ДИНАМИЧЕСКИХ РЯДОВ

1. ОПИСАНИЕ РАБОТЫ

Цель работы

Анализ статистики преступности для выявления закономерностей, тенденций и прогнозирования развития процесса.

Метод выполнения

Обработка исходных данных методами укрупнения ,сглаживания исмыкания .

ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ

Изучение статистики преступности имеет большое практическое значение. Анализ закономерностей развития этого процесса дает возможность правоохранительным органам прогнозировать будущее развитие преступности, оптимально распределять силы и средства для борьбы с ней.

Преступность – это сложный общественный процесс, его развитие определяют различные факторы, в первую очередь – экономические. Динамика (т.е. развитие во времени) преступности зависит также от политической ситуации, исторических традиций, наличия особо криминогенных зон и объектов. Деятельность правоохранительных органов тоже можно отнести к факторам, влияющим на развитие преступности.

Трудность анализа состоит в том, что на основные тенденции развития процесса накладываются случайные отклонения, колебания и выбросы. Основная задача статистической обработки состоит как раз в отсечении этой случайной компоненты и выявления основных тенденций, закономерностей развития. Именно такая обработка исходных данных должна быть проведена в данной работе.

Понятие динамического ряда

Ряд в статистике – это упорядоченная совокупность числовых данных, полученных при наблюдении изучаемого явления.

Ряды позволяют производить следующие статистические исследования:

сравнение явлений в процессе их развития во времени,

сравнение явлений по различным их формам и видам,

выявление взаимной зависимости явлений или зависимости от общей причины.

Пример явления, развивающегося во времени: число зарегистрированных преступлений данного вида на данной территории. Если регистрировать количество преступлений регулярно на протяжении достаточно длительного промежутка времени, затем правильно обработать полученный ряд данных, то можно выявить тенденции развития процесса, спрогнозировать будущие изменение ситуации и заранее подготовить адекватные меры борьбы с преступностью.

Процесс развития, изменения или движения социальных явлений во времени в статистике принято называть динамикой .

Динамический ряд - упорядоченная совокупность значений выбранного статистического показателя, изменяющихся во времени.

Величины ряда могут характеризовать явление по-разному:

Интервальный ряд отражает величину показателей, полученных за определённые периоды (интервалы) времени.

Например, ряд, содержащий количество гражданских дел, рассмотренных в суде за каждый месяц календарного года.

Моментный ряд характеризует уровни правового процесса на определенные моменты времени (даты отчета).

Например, количество заключенных на начало каждого календарного года.

Важнейшее условие построения и исследования рядов динамики – это однородность (сопоставимость) значений, относящихся к различным периодам.

Однородность во времени требует, чтобы значения ряда соответствовали показателю, характеризующему явление, за один и тот же отрезок времени, или чтобы соседние значения ряда были разнесены во времени друг от друга на равные промежутки.

Однородность в пространстве требует, чтобы территория, которую характеризует каждый показатель ряда, не изменялась на исследуемом временном отрезке.

Однородность по кругу охватываемых объектов требует, чтобы данные рядов относились к одинаковому количеству объектов (людей, административных единиц, возрастному промежутку и т.д.)

Однородность по сущности исследуемых величин требует, чтобы на рассматриваемом временном отрезке не изменялось уголовное законодательство.

Однородность по методологии требует, чтобы на рассматриваемом временном отрезке не изменялась методика получения показателя.

Методы укрупнения и сглаживания динамических рядов

Укрупнение и сглаживание – это математические операции над данными динамического ряда, которые позволяют выявлять тенденции, т.е. наиболее медленные составляющие изучаемого процесса, которые наблюдаются на фоне быстрых случайных всплесков и колебаний.

Такой подход к динамическому ряду, описывающему социальное явление, означает, что явление рассматривается как арифметическая сумма быстро и медленно меняющихся процессов.

РЯД(t ) = МЕДЛ(t ) + БЫСТР(t )

Целью обработки динамического ряда является разделение этих слагаемых. Во многих случаях такая модель социальных явлений правомерна.

Укрупнение динамического ряда - разбиение исходного ряда на неперекрывающиеся группы соседних данных (пары, тройки, и.т.д.), а затем вычисление суммы внутри каждой группы.

Получается новый ряд, число значений в котором будет меньше исходного в два, три или более раз, соответственно. Рассмотрим пример статистики женщин, совершивших преступления в период 2008 – 2010 годов по полугодиям.

Наблюдаются сезонные колебания данных, для выявления тенденции применим укрупнение: сгруппируем данные по 2 и сложим в каждой группе.

Исходный ряд :x 1 = 110 210,x 2 = 90 624,…,x 6 = 77 916.

Укрупнение по 2 :y1 = 110 210 + 90 624 = 200 834,

y2 = 105 796 + 66 406 = 194 202,

y3 = 94 459 + 77 916 = 172 375.

Получим данные по годам, а не по полугодиям: вместо 6 чисел - 3, но стала явно видна тенденция к снижению показателя. Аналогичным образом можно проводить укрупнение по 3, 4 и более периодов в одной группе.

Сглаживание динамического ряда - разбиение исходного ряда на перекрывающиеся группы данных по два, три или более смежных значений, (сдвиг по исходному ряду на одно значение), а затем вычисление среднего арифметического в каждой группе (скользящее среднее).

После обработки остается на 1, 2 и т.д. значения меньше в зависимости от величины групп (2, 3,…).

Рассмотрим метод сглаживания на том же примере статистики женщин-преступниц, применим сглаживание по 3 (среднее арифметическое первых трех элементов, затем 2, 3 и 4 и т.д. – это пересекающиеся группы данных).

Сглаживание по 3 :y 1 = (x 1 +x 2 +x 3) / 3 = 102 210,

y 2 = (x 2 +x 3 +x 4) / 3 = 87 609,

y 3 = (x 3 +x 4 +x 5) / 3 = 88 887,

y 4 = (x 4 +x 5 +x 6) / 3 = 79 594.

После сглаживания можно отметить следующее поведение процесса: снижение, стабильность, снова снижение показателя, однако, данных явно недостаточно, чтобы отфильтровать сезонные колебания.

Укрупнение и сглаживание ведут к уменьшению случайных всплесков, особенно хорошо тенденции видны на графиках , построенных по укрупненным или сглаженным данным. Укрупнение применяют к интервальным динамическим рядам, а сглаживание - как к интервальным, так и к моментным рядам.

Метод смыкания динамических рядов

Для изучения закономерностей и тенденций правовых процессов нужны однородные совокупности данных, однако в правовой сфере происходят существенные сдвиги: изменения законодательства, форм учета, укрупнение и разукрупнение территориально-административных единиц (например, изменение перечня тяжких преступлений, объединение субъектов РФ и т.д.). Для компенсации возникшей неоднородности данных используют:

Метод смыкания динамических рядов – выбор промежутка времени, на котором известны старые и новые показатели, принятие его за базовый (100%) и пропорциональный пересчет старых показателей влево, а новых – вправо по временной оси.

Рассмотрим статистику преступности в условном городе Nза 1991 – 1996 годы, ряд не обладает свойством однородности, т.к. в 1994 году законодательно изменился перечень тяжких преступлений.

В переходный год известны показатели по старой и новой форме, примем этот год за базовый и присвоим ему значение 100% (проценты не пишем). Найдем коэффициенты пропорциональности для старых данных по 1994 году: 100 / 80 = 1,25, для новых данных: 100 / 150 = 0,67. Умножим старые данные 1991 – 1993 годов на 1,25, новые данные 1995 – 1996 годов – на 0,67 и получим сомкнутый ряд сопоставимых показателей, по которому можно изучать тенденции процесса.

Исходные данные задачи

В данной работе изучается статистика преступности (криминальная статистика) заданного вида в пределах одного населённого пункта, регистрировавшаяся помесячно на протяжении трех лет. Такой набор статистической информации является типичным примером динамического ряда интервального типа .

В приложении № 1 методического руководства дано общее описание листа Excel, на котором нужно выполнить задание. В приложении № 2 приведена статистическая таблица –сводка количества преступлений 14 видов в двух городах. Информация представлена за три года: два года до изменения территориальных границ городов, один год – после, в первый месяц третьего года (январь) приведена статистика преступлений как в старых, так и в новых границах городов.

Рассмотрим информацию за первые два года - это двадцать четыре целых числа. Обозначим их:

а 1 , а 2 , … , а 24

Как отмечалось в предыдущем пункте, динамический ряд пригоден для статистического анализа, если он соответствует условиям однородности. В нашем случае первичные статистические данные за два года удовлетворяют критерию однородности:

во времени - сведения о количестве преступлений собраны за одинаковые временные интервалы, следующие по порядку один за другим;

в пространстве - данные относятся к одному территориальному объекту в одних и тех же границах;

по сущности – данные относятся к одному классу явлений, в нашем случае, к одним видам преступлений.

Подразумеваются также выполненными следующие условия однородности: неизменность законодательства в части классификации данных преступлений, единство методики сбора и регистрации первичной информации на протяжении всего периода наблюдений.

Укрупнение ряда (кратности 2, 3, 4, 6)

Новый, укрупненный в два раза ряд формируется из исходных данных

а 1 , а 2 , … , а 24 по формуле:

b i / 2 = a i -1 + a i , i = 2, 4, 6, … , 24 (1)

Иными словами, при формировании укрупненного вдвое ряда b первое число исходного рядаa складывается со вторым, третье с четвертым и т.д.

После укрупнения исходного динамического ряда в два раза (кратность равна двум) данных становится в два раза меньше. Таким образом, метод укрупнения позволяет взглянуть на процесс в целом, выделить главное, опустив мелкие детали.

Аналогичным образом можно укрупнить ряд в три, четыре, шесть и более раз (задать различную кратность укрупненного ряда):

c i/3 = a i-2 + a i-1 + a i , i = 3, 6, 9, …, 24 (2)

d i/4 = a i-3 + a i-2 + a i-1 + a i , i = 4, 8, 12, …, 24 (3)

e i/6 = a i-5 + a i-4 + a i-3 + a i-2 + a i-1 + a i , i = 6, 12, 18, 24 (4)

При формировании ряда с исходные данные рядаа разбиваются на группы по три штуки и складываются, для рядаd - в группы по четыре штуки, для рядаe – в группы по шесть штук. Соответственно, рядb получился короче исходного рядаа в два раза, рядс – в три раза, рядd – в четыре раза, рядe – в шесть раз.

Какая же кратность укрупнения является оптимальной? Чтобы ответить на этот вопрос, нужно знать временные параметры изменения основной тенденции процесса: продолжительность роста или снижения, периодичность сезонных колебаний и т.д.

В реальных условиях эти параметры сами являются предметом изучения. Поэтому лишь эмпирическим путем можно определить оптимальную кратность укрупнения динамического ряда в нашей задаче. Метод эффективно работает, когда характер процесса (стабильность, рост, снижение и т.д.) проявляются достаточно долго.

Сглаживание ряда (кратности 3, 4, 5)

Сглаженный по три элемента (кратность равна 3) ряд образуется на основе первичных данных по формуле скользящего среднего:

f i = (a i + a i +1 + a i +2) / 3, i = 1, 2, …, 22 (5)

Иными словами, берут первое, второе и третье число ряда a , находят среднее арифметическое (складывают их, и сумму делят на 3), получается первое число рядаf . Затем берут второе, третье и четвертое числа рядаa (со сдвигом на один элемент ряда – поэтому и называется метод скользящего среднего) и, проделав аналогичные операции, получают второй элемент рядаf , и т.д.

Следует обратить внимание на то, что новый ряд на два элемента короче исходного. В соответствии с формулой сглаживание проводится по трем соседним элементам исходного ряда.

Аналогичным образом можно применить сглаживание по четырем, пяти и более элементам (кратность равна 4, 5 и т.д.):

g i = (a i + a i+1 + a i+2 + a i+3) / 4, i = 1, 2, …, 21 (6)

h i = (a i + a i+1 + a i+2 + a i+3 + a i+4) / 5, i = 1, 2, …, 20 (7)

При формировании ряда g исходные данные рядаа берут по четыре штуки и находят их среднее арифметическое, для рядаh - по пять штук. Соответственно, рядf получился короче исходного рядаа на два элемента, рядg – на три элемента, рядh – на четыре элемента.

Так же, как в методе укрупнения, параметр кратности (количество элементов исходного ряда, выбранное для вычисления среднего) нельзя рассчитать заранее, его следует определить эмпирически по полученным результатам.

Сглаженный ряд позволяет изучать средний уровень преступности и может служить основой для прогнозирования будущего развития процесса. Метод сглаживания особенно эффективен для выявления сезонных колебаний и поиска скачков в среднем уровне процесса.

Анализ результатов

После того, как проведена обработка первичных данных по формулам для различной кратности, построены графики укрупненных и сглаженных рядов, наступает следующий этап анализа – выявление тенденции изменения преступности.