Зерно — является одним из важнейших основных продуктов питания человека, а также сырьём для многих перерабатывающих промышленностей и кормом для сельскохозяйственных животных. Для анализа производства зерна используются различные статистические методы, одним из которых является метод аналитической группировки. Характерной особенностью аналитической группировки является образование границ и групп по факторному признаку, которые позволяют выявить наличие связей и определить их направление (связь обратная или прямая). Делается аналитическая группировка по группировочному признаку- признаку, положенному в основании группировки[1].
На основе исходных данных сельскохозяйственных организаций районов Воронежской области была проведена аналитическая группировка по величине производственных затрат на 1 га посева зерновых культур. Для этого был построен ранжированный ряд распределения 32 районов Воронежской области по величине производственных затрат на 1 га посева зерновых культур. В результате построения мы получили наименьшие производственные затраты- 2,5 тыс. руб., а наибольшие – 10,2 тыс. руб.
Число групп в аналитической группировке (n), на которое необходимо распределить исходную информацию, определяется по формуле:
n = 1+3.322 lg N, где N – число районов,
n =1+3.322*lg32 = 6 (групп).
На основе полученных данных ранжированного ряда
рассчитывается величина интервала:
Далее определяются границы групп путем подсчета числа районов, которые войдут в каждую группу, и на их основе строим интервальный ряд распределения районов (таблица 1).
Используя данные таблицы 1 определим следующие показатели:
1. Среднее значение изучаемого признака (средние производственные затраты на 1 га посева зерновых культур) по формуле средней арифметической взвешенной:
Таблица 1- Расчет основных характеристик интервального ряда распределения районов по производственным затратам на 1 га посева зерновых культур.
Границы групп, тыс., руб. | Число районов (f) | Середина интервала, тыс.,руб (х) | x* f | ![]() |
![]() |
![]() |
2,5-3,8 | 8 | 3,2 | 25,2 | -2 | 3,9 | 31,5 |
3,8-5,10 | 12 | 4,5 | 53,4 | -0,7 | 0,5 | 5,6 |
5,10-6,4 | 4 | 5,8 | 23 | 0,6 | 0,4 | 1,5 |
6,4-7,7 | 4 | 7,1 | 28,2 | 1,9 | 3,7 | 14,7 |
7,7-8,9 | 3 | 8,3 | 24,9 | 3,2 | 10 | 30,1 |
8,9-10,2 | 1 | 9,6 | 9,6 | 4,4 | 19,5 | 19,5 |
Итого | 32 | 164,3 | 102,9 |
2. Показатели вариации:
- Размах вариации – это разница между максимальным и минимальным значением признака:
- Дисперсию-это средний квадрат отклонений значений признака от его среднего значения:
σ2 =
-
Среднеквадратическое отклонение – представляет собой корень квадратный из дисперсии:
Среднеквадратическое отклонение определяет вариацию признака в результате случайных и индивидуальных особенностях единиц. Средняя величина характеризует общее условие всех единиц совокупности.
- Коэффициент вариации:
V=
Полученный коэффициент вариации больше 33%, что говорит о том, что средние производственные затраты на 1га посева зерновых культур (5,1 тыс. руб.) можно считать не типичной обобщающей характеристикой исследуемой совокупности, которая является не однородной[2].
Для более равномерного распределения единиц совокупности по группам построим новый интервальный ряд распределения с использованием правила трех сигм, которое в лучшей степени учитывает вариацию группировочного признака, и оформим его в виде таблицы 2.
Если в группе только один район, то такие группы не предусмотрены, они не дают выводов, поэтому группы объединяются с близ лежащими группами посредством укрупнения интервалов. При этом часто вновь образованные группы имеют открытые интервалы. Таким образом, необходимо объединить 1 и 2 группу, 4, 5 и 6 группу. В результате объединения мы получаем 3 группы: I группа – 5 районов, II группа – 12 районов, III группа –15районов.
Таблица 2-Интервальный ряд распределения районов по правилу трех сигм.
Номер руппы | Нижняя граница | Верхняя граница | Количество районов | ||
формула | значение тыс.,руб | формула | значение тыс.,руб. | ||
I | ![]() |
-0,2 | ![]() |
1,5 | - |
II | ![]() |
1,5 | ![]() |
3,3 | 5 |
III | ![]() |
3,3 | ![]() |
5,1 | 12 |
IV | ![]() |
5,1 | ![]() |
6,9 | 10 |
V | ![]() |
6,9 | ![]() |
8,7 | 4 |
VI | ![]() |
8,7 | ![]() |
10,5 | 1 |
На основе данных таблицы 2 рассчитываются средние или аналитические показатели и представляются в виде таблицы 3.
Таблица 3-Статистико-аналитические показатели по группировке районов Воронежской области по производственным затратам на 1 га посева зерновых культур,
Границы групп тыс.руб. | Количество районов | Урожайность, ц/га. | Произведено на 100 га пашни, ц | Уровень концентрации, га | Затраты труда на 1 ц ,чел.-час. | Себестоимость 1 ц реализованного зерна руб. | Цена реализации зерна,руб. | Уровень рентабельности, % |
1,6-3,4 | 5 | 24,7 | 1065 | 48382 | 0,32 | 582 | 564 | 17,3 |
3,4-5,2 | 12 | 32,3 | 1295 | 47136 | 0,24 | 432 | 618 | 31,9 |
5,2-10,6 | 15 | 34,4 | 1278 | 46067 | 0,3 | 455 | 578 | 21,8 |
Итого: | 32 | 31,9 | 1252 | 46830 | 0,28 | 462 | 592 | 25,0 |
Данные аналитической группировки, представленные в таблице 3, выявили, что с повышением производственных затрат на 1 га посева зерновых культур с 1,6тыс. руб. в I группе до 10,6 тыс. руб. в IV группе повышается урожайность зерновых культур с 24,7ц/га до 34,4 ц /га, то есть наблюдается прямая связь.
По данным таблицы 3 также можно увидеть обратную зависимость между производственными затратами на 1 га посева зерновых культур и площадью зерновых культур, то есть с увеличением производственных затрат уровень концентрации снижается с 48382 га. в I группе до 46067 га. в IV группе.
Проведѐм однофакторный дисперсионный анализ зависимости урожайности зерновых культур от уровня производственных затрат на 1га посева зерновых культур, в следующей последовательности:
1. Определим общую вариацию, которая показывает влияние на урожайность зерновых культур всех факторов (исходные данные представлены в таблице 5):
где х- индивидуальное значение признака;
х̄- средний уровень признака.
2. Определим факторную вариацию, которая показывает влияние на урожайность зерновых культур только изучаемого фактора (производственные затраты на 1га):
где -средние данные по каждой группе;
f-количество районов в группе
Wфактор = [(24,7-31,9)2*5+(32,3-31,9)2*12+(34,4-31,9)2*15]=259+2+89=350
3. Определим остаточную вариацию, которая показывает влияние на урожайность зерновых культур всех остальных факторов, кроме изучаемого:
Wостат =Wобщ - Wфактор=1148,0-350=798
4.Определяем общую дисперсию:
где N – число единиц совокупности( число изучаемых районов).
5.Определяем факторную дисперсию:
где n- число групп.
7.Определим фактический или расчетный критерий Фишера:
Fфакт =
Теоретическое значение критерия Фишера ( Fтеор) определялось по таблицам и составило Fтеор =3,33. Сравнивая фактическое и ттеоретическое значения критерия Фишера видно, что Fфакт> F теор (6,4>3,33). Поэтому влияние производственных затрат на 1 га посева зерновых культур на их урожайность является существенным или статистически значимым для данной выборки.
Библиографический список
- А.Е. Барбашина, А.М. Восковых Использование аналитической группироваки и дисперсионного метода для анализа производства зерна //Молодежный вектор развития аграрной науки: материалы 66 студенческой научной конференции, Ч-IV,- Воронеж: ФГБОУ ВПО Воронежский ГАУ, 2015, с 25-33
- Основные показатели растениеводства районов Воронежской области за 2014 год: Статистический сборник / Воронежстат. – Воронеж, 2014.- 80с.
- Зерновая отрасль России в условиях ВТО: положительные и отрицательные моменты Хаустова Г.И. Володин В.А, Альманах современной науки и образования, 2013, №7(740). с46-51