Многофакторные модели индексов
Рассмотренные нами двухфакторные системы экономических индексов позволяют построить и многофакторные модели индексов.
Назначение многофакторных моделей индексов – изучение влияния отдельных взаимосвязанных факторов на экономическое явление или процесс.
В основе построения таких моделей лежит принцип абстрагирования от изменения всех факторов, кроме изучаемого фактора. Он состоите том, что при построении индексов, характеризующих изменение отдельных факторов, изучаемый фактор изменяется: берется в числителе и знаменателе индекса за разные периоды времени, а остальные факторы – остаются на уровне одного периода. Отсюда следует, что можно построить 2 системы индексов:
1) при базисной системе весов;
2) при отчетной системе весов.
Если модель строится при базисной системе весов, то фактор, влияние которого уже изучено, в последующих индексах фиксируется на уровне отчетного периода, а если модель строится при отчетной системе весов, то такой фактор фиксируется на уровне базисного периода. Предположим, что на изучаемое нами экономическое явление, например, среднюю выработку продукции на одного работника (W) оказывают влияние четыре фактора:
1) средняя часовая выработка продукции на одного рабочего (а);
2) продолжительность рабочего дня (b);
3) число дней, отработанных одним рабочим (с);
4) удельный вес рабочих в численности работников (d),
и построим четырехфакторные модели экономических индексов по формуле:

а) при базисной системе весов
;
б) при отчетной системе весов
.
Выбор системы весов зависит от характера изучаемых показателей. Как правило, если первый показатель
является качественным, как в нашем примере, то используется отчетная система весов, а если объемным – базисная система весов.
Каждый из индексов не только характеризует изменение индексируемого показателя в динамике, но и позволяет определить влияние этого фактора на изменение обобщающего показателя W в абсолютном и относительном выражении. Для расчета изменения W за счет каждого из показателей-факторов в абсолютном выражении следует из числителя соответствующего индекса вычесть его знаменатель или произвести расчет по следующим формулам:
1) за счет изменения фактора а
а)
; б)
;
2) за счет изменения фактора b
а)
; б)
;
3) за счет изменения фактора c
а)
; б)
;
4) за счет изменения фактора d
а)
; б)
.
Взаимосвязь исчисленных абсолютных изменений за счет отдельных факторов:
.
Для расчета изменения обобщающего показателя за счет отдельных факторов в относительном выражении следует в указанных формулах приравнять все базисные показатели к единицам, отчетные заменить индексами соответствующих показателей, а
выразить в процентах.
§
Средние индексы применяются в том случае, когда в исходной информации нет данных для расчета индексов в агрегатной форме. Получают средний индекс путем замены в исходном агрегатном индексе индексируемого показателя его выражением, выведенным из индивидуального индекса. Если такая замена произведена в числителе исходного агрегатного индекса, то получим средний арифметический индекс, а если в знаменателе, то – средний гармонический индекс. Рассмотрим методику такого преобразования на примере индексов физического объема товарооборота и цен.
Например, имеются следующие данные фирмы о продаже фруктов (табл. 10.2).
Таблица l0.2.
Знаменатель этого индекса – товарооборот базисного периода, известен, а данных для расчета числителя нет, но есть индивидуальные индексы физического объема товарооборота, исчисляемые по формуле
, откуда
. Подставив это выражение в числитель агрегатного индекса, получим средний арифметический индекс физического объема товарооборота
.
Рассчитаем его:
, или 111,7%.
На практике средние арифметические индексы используются при расчете индексов объемных показателей, когда знаменатель исходного агрегатного индекса является реальной величиной. Весами индивидуальных индексов в них являются слагаемые знаменателя исходного агрегатного индекса.
Теперь допустим, что по той же фирме известны следующие данные (табл. 10.3).
Агрегатный индекс цен определяется по формуле
.
Числитель этого индекса – реальный товарооборот отчетного периода – известен, а данных для расчета знаменателя нет, но известны индивидуальные индексы цен, исчисленные по формуле
, откуда
. Подставив это выражение в знаменатель формулы агрегатного индекса цен, получим средний гармонический индекс цен
.
Рассчитаем его величину для примера:
, или 102,8%.
На практике средние гармонические индексы используются при расчете индексов качественных показателей, когда числитель агрегатного индекса является реальной величиной. Весами индивидуальных индексов в них являются слагаемые числителя исходного агрегатного индекса.
§
В зависимости от базы сравнения индексы могут быть базисными и цепными. Если изучается общее изменение явления за весь исследуемый период времени, то следует исчислять базисные индексы, а если изучается изменение явления от одного периода к другому, то – цепные индексы.
Базисные индексы характеризуют изменение уровней явления по сравнению с одной, постоянной базой сравнения. Цепные индексы характеризуют изменение уровней явления по сравнению с постоянно меняющейся базой сравнения. Обычно производится сравнение каждого последующего уровня с предыдущим. Базисные и цепные индивидуальные индексы взаимосвязаны друг с другом следующим образом: 1) отношение последующего базисного индекса к предыдущему дает соответствующий цепной индекс; 2) произведение ряда последовательных цепных индивидуальных индексов дает соответствующий базисный индекс.
Общие индексы также могут быть базисными и цепными, но при их построении возникает вопрос о системе весов, так как их можно построить с постоянными и с переменными весами. На практике с постоянными весами обычно строят индексы объемных показателей, а с переменными – индексы качественных показателей.
Например, если имеются данные о количестве проданных фирмой за 4 года разнородных товаров
и ценах на эти товары,
, то общие индексы физического объема товарооборота будут построены с постоянными весами – ценами базисного периода по следующим формулам:
1) базисные
;
2) цепные
.
Общие индексы цен будут построены с переменными весами по следующим формулам:
1) базисные
;
;
2) цепные
.
Взаимосвязь, имеющая место в индивидуальных базисных и цепных индексах сохраняется в общих индексах только с постоянными весами.
§
Обобщающую характеристику многих экономических явлений статистика обеспечивает с помощью средних величин. А величина средней зависит не только от величины признака у каждой единицы совокупности, но и от распределения единиц совокупности по данному признаку, т. е. от структуры совокупности. Поэтому при изучении динамики явлений, уровни которых выражены средними величинами, возникает задача определить динамику средних показателей под влиянием каждого фактора в отдельности. Решается эта задача с помощью системы взаимосвязанных индексов переменного состава, постоянного состава и структурных сдвигов.
Рассмотрим применение такой системы индексов на примере расчета индексов себестоимости продукции по следующим данным объединения, имеющего две фирмы, о производстве электроплит (табл. 10.4).
Таблица 10.4
| Исходные данные | Расчетные данные | ||||||||
| Фирмы | Произведено, шт. | Себестоимость | Издержки производства, тыс. руб | Структура продукции | |||||
| Базисный период | Отчетный период | Базисный период | Отчетный период | Базисный период | Отчетный период | Отчетный период по себестоимости базисного | Базисный период | Отчетный период | |
| 5=1х3 | 6=2х4 | 7=2х3 | |||||||
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | |
| 6,0 | 5,7 | 0,8 | 0,5 | ||||||
| 5,0 | 4,5 | 0,2 | 0,5 | ||||||
| Итого | – | – | 1,0 | 1,0 |
Рассчитаем индивидуальные индексы себестоимости продукции по каждой фирме по формуле:
;
1)
, или 95%; 2)
, или 90%,
т. е. в первой фирме себестоимость электроплит снижена на 5%, а во второй – на 10%. Для изучения динамики себестоимости продукции в целом по двум фирмам необходимо рассчитать издержки производства zq в 5, 6 и 7 графах таблицы и показатели структуры продукции d в 8 и 9 графах таблицы.
Теперь рассчитаем индексы себестоимости продукции по двум фирмам в целом:
1. Индекс себестоимости продукции переменного состава определяется как отношение средней отчетной себестоимости продукции к ее средней базисной себестоимости. Он может быть построен двумя способами:
а) по абсолютным данным о количестве произведенной продукции:
, или 87,9%,
откуда
тыс. руб.,
т. е. средняя себестоимость одной электроплиты снижена на 0,7 тыс. руб., или на 12,1% (87,9% – 100,0%). Это снижение произошло под влиянием двух факторов: снижения себестоимости продукции в каждой фирме и изменения структуры продукции, т. е. распределения продукции между фирмами;
б) по относительным показателям структуры продукции:
, или 87,9%.
2. Индекс себестоимости продукции постоянного состава:
а) по абсолютным данным о количестве произведенной продукции
, или 92,7% ,
и
тыс. руб.,
т. е. снижение себестоимости продукции в каждой фирме привело к снижению себестоимости электроплит в среднем на 0,4 тыс. руб., или на 7,3%.
б) по относительным показателям структуры продукции
, или 92,7%.
Таким образом, за счет двух факторов средняя себестоимость продукции снижена на 12,1%, а за счет одного – первого фактора – только на 7,3%. Следовательно, второй фактор изменения в структуре произведенной продукции также привел к снижению средней себестоимости продукции. Чтобы определить величину этого снижения рассчитаем:
3. Индекс влияния структурных сдвигов:
а) по абсолютным данным о количестве произведенной продукции:
, или 94,8%,
тыс. руб.;
б) по относительным показателям структуры продукции:
, или 94,8%,
т. е. структурные сдвиги привели к снижению средней себестоимости продукции на 0 3 тыс. руб., или на 5,2% (94,8% – 100,0%).
Для выявления структурных сдвигов обратимся к нашей таблице. Мы видим, что доля продукции с более низкой себестоимостью производимой второй фирмой, в общем объеме продукции возросла с 20% в базисном периоде до 50% в отчетном, а с высокой себестоимостью сократилась с 80 до 50%.
Проверим взаимосвязь исчисленных показателей:
а) индексов
;
б) абсолютных изменений
тыс. руб.
Эти индексы позволяют также рассчитать изменение издержек производства за счет изменения:
1) средней себестоимости продукции
тыс. руб.
В том числе:
2) себестоимости продукции на отдельных предприятиях
тыс. руб.
3) структурных сдвигов в выпуске продукции
тыс. руб.
Проверим взаимосвязь полученных показателей
тыс. руб.
Таким образом, экономия издержек производства за счет снижения средней себестоимости продукции составила 420 тыс. руб., в том числе 240 тыс. руб. – за счет снижения себестоимости продукции на каждой фирме и 180 тыс. руб. – за счет структурных сдвигов в выпуске продукции.
Аналогичным образом исчисляются индексы переменного состава, постоянного состава и структурных сдвигов по другим качественным показателям: цене, заработной плате, производительности труда и т. п.
Контрольные вопросы
(выберите правильный ответ)
1. Что характеризуют индексы?
а) абсолютные уровни явлений;
б) относительное изменение явлений во времени или соотношение в пространстве;
в) структуру явлений в процентах.
2. Индивидуальный индекс цен в торговле характеризует:
а) абсолютное изменение цен на один товар;
б) цену товара;
в) относительное изменение цены одного товара.
3. Какие показатели служат весами в агрегатных индексах физического объема товарооборота?
а) товарооборот;
б) цены на товары;
в) количество проданных товаров.
4. Выберите формулы для расчета агрегатного индекса:
1) цен;
2) физического объема товарооборота:
а)
; б)
; в)
; г)
;

д)
.
5. Что характеризует разность между числителем и знаменателем агрегатного индекса цен?
а) процент изменения товарооборота за счет изменения цен;
б) абсолютное изменение цен;
в) абсолютное изменение товарооборота за счет изменения цен.
6. Укажите, какая из приведенных систем индексов является правильной:
а)
; б)
; в)
.
7. По каким из нижеследующих формул исчисляются средние индексы:
1) себестоимости продукции?
2) физического объема товарооборота?
а)
; б)
; в)
; г)
;
д)
.
8. Какую базу сравнения имеют цепные индексы?
а) постоянную;
б) изменяющуюся от одного индекса к другому;
в) любую.
9. Индексы себестоимости продукции переменного состава характеризуют изменение:
а) себестоимости продукции на отдельных предприятиях;
б) средней себестоимости продукции;
в) издержек производства;
10. Если исчислены индексы заработной платы переменного состава и постоянного состава, то индекс влияния структурных сдвигов исчисляется как:
а) отношение индекса постоянного состава к индексу переменного состава;
б) разность между индексами переменного состава и постоянного состава;
в) отношение индекса переменного состава к индексу постоянного состава.
§
Тема 11. Ряды динамики
Ряды динамики – это ряды статистических показателей, характеризующих развитие явлений природы и общества во времени. Публикуемые Госкомстатом России статистические сборники содержат большое количество рядов динамики в табличной форме. Ряды динамики позволяют выявить закономерности развития изучаемых явлений.
Ряды динамики содержат два вида показателей. Показатели времени (годы, кварталы, месяцы и др.) или моменты времени (на начало года, на начало каждого месяца и т.п.), и показатели уровней ряда. Показатели уровней рядов динамики могут быть выражены абсолютными величинами (производство продукта в тоннах или рублях), относительными величинами (удельный вес городского населения в процентах) и средними величинами (средняя заработная плата работников отрасли по годам и т. п.). В табличной форме ряд динамики содержит два столбца или две строки.
Правильное построение рядов динамики предполагает выполнение ряда требований:
1) все показатели ряда динамики должны быть научно обоснованными, достоверными;
2) показатели ряда динамики должны быть сопоставимы по времени, т. е. должны быть исчислены за одинаковые периоды времени или на одинаковые даты;
3) показатели ряда динамики должны быть сопоставимы по территории;
4) показатели ряда динамики должны быть сопоставимы по содержанию, т. е. исчислены по единой методологии, одинаковым способом;
5) показатели ряда динамики должны быть сопоставимы по кругу учитываемых хозяйств. Все показатели ряда динамики должны быть приведены в одних и тех же единицах измерения.
Статистические показатели могут характеризовать либо результаты изучаемого процесса за период времени, либо состояние изучаемого явления на определенный момент времени, т. е. показатели могут быть интервальными (периодическими) и моментными. Соответственно первоначально ряды динамики могут быть либо интервальными, либо моментными. Моментные ряды динамики в свою очередь могут быть с равными и неравными промежутками времени.
Первоначальные ряды динамики могут быть преобразованы в ряд средних величин и ряд относительных величин (цепной и базисный). Такие ряды динамики называют производными рядами динамики.
Методика расчета среднего уровня в радах динамики различна, обусловлена видом ряда динамики. На примерах рассмотрим виды рядов динамики и формулы для расчета среднего уровня.
Интервальные ряды динамики. Уровни интервального ряда характеризуют результат изучаемого процесса за период времени: производство или реализация продукции (за год, квартал, месяц и др. периоды), число принятых на работу, число родившихся и т. п. Уровни интервального ряда можно суммировать. При этом получаем такой же показатель за более длительные интервалы времени.
Средний уровень в интервальных рядах динамики
исчисляется по формуле средней арифметической простой
,
где
– уровни ряда,
п – число периодов (число уровней ряда).
Рассмотрим методику расчета среднего уровня интервального ряда динамики на примере данных о продаже сахара в России (табл. 11.1).
Таблица 11.1
| Годы | Продано сахара, тыс. г. |
, тыс. т,
т. е. это среднегодовой объем реализации сахара населению России за 1994 -1996 гг. Всего за три года было продано 8137 тыс. т сахара.
Моментные ряды динамики. Уровни моментных рядов динамики характеризуют состояние изучаемого явления на определенные моменты времени. Каждый последующий уровень включает в себя полностью или частично предыдущий показатель. Так, например, число работников на 1 апреля 1999 г. полностью или частично включает число работников на 1 марта.
Если сложить эти показатели, то получим повторный счет тех работников, которые работали в течение всего месяца. Полученная сумма экономического содержания не имеет, это расчетный показатель.
В моментных рядах динамики с равными интервалами времени средний уровень ряда исчисляется по формуле средней хронологической
,
где
– уровни моментного ряда;
п – число моментов (уровней ряда);
п – 1 – число периодов времени (лет, кварталов, месяцев).
Рассмотрим методику такого расчета по следующим данным о списочной численности работников предприятия за 1 квартал.
Таблица 11.2
| Момент времени | Число работников |
| На 1 января | |
| На 1 февраля | |
| На 1 марта | |
| На 1 апреля |
Необходимо вычислить средний уровень ряда динамики, в данном примере – среднюю списочную численность работников предприятия:
человек.
Расчет выполнен по формуле средней хронологической. Средняя списочная численность работников предприятия за 1 квартал составила 155 человек. В знаменателе – 3 месяца в квартале, а в числителе (465) – это расчетное число, экономического содержания не имеет. В подавляющем числе экономических расчетов месяцы, независимо от числа календарных дней, считаются равными.
В моментных рядах динамики с неравными интервалами времени средний уровень ряда исчисляется по формуле средней арифметической взвешенной. В качестве весов средней величины принимается продолжительность времени (t-дни, месяцы). Выполним расчет по этой формуле.
Списочная численность работников предприятия за октябрь такова: на 1 октября – 200 человек, 7 октября принято 15 человек, 12 октября уволен 1 человек, 21 октября принято 10 человек и до конца месяца приема и увольнения работников не было. Эту информацию можно представить в следующем виде (табл. 11.3).
Таблица 11.3
| Число работников | Число дней (период времени) |
| 6 (с 1 по 6 включительно) | |
| 5 (с 7 по 11 включительно) | |
| 9 (с 12 по 20 включительно) | |
| 11 (с 21 по 31 включительно) |
При определении среднего уровня ряда надо учесть продолжительность периодов между датами, т. е. применять формулу средней арифметической взвешенной:
человек.

В данной формуле числитель
имеет экономическое содержание. В приведенном примере числитель (6665 человеко-дней) – это календарный фонд времени работников предприятия за октябрь. В знаменателе (31 день) – календарное число дней в месяце.
В тех случаях, когда имеем моментный ряд динамики с неравными интервалами времени, а конкретные даты изменения показателя неизвестны исследователю, то сначала надо вычислить среднюю величину
для каждого интервала времени по формуле средней арифметической простой, а затем вычислить средний уровень для всего ряда динамики, взвесив исчисленные средние величины продолжительностью соответствующего интервала времени
. Формулы имеют следующий вид:
.
Рассмотренные выше ряды динамики состоят из абсолютных показателей, получаемых в результате статистических наблюдений. Построенные первоначально ряды динамики абсолютных показателей могут быть преобразованы в ряды производные: ряды средних величин и ряды относительных величин. Ряды относительных величин могут быть цепные (в % к предыдущему периоду) или базисные (в % к начальному периоду, принятому за базу сравнения). Расчет среднего уровня в производных рядах динамики выполняется по другим формулам.
Ряд средних величин. Сначала преобразуем приведенный выше моментный ряд динамики с равными интервалами времени в ряд средних величин. Для этого вычислим среднюю списочную численность работников предприятия за каждый месяц, как среднюю из показателей на начало и конец месяца
:
за январь
; за февраль
; за март:
.
Представим это в табличной форме.
Таблица 11.4
| Месяцы | Среднесписочная численность работников |
| Январь | 147,5 |
| Февраль | 153,5 |
| Март | 164,0 |
Средний уровень в производных рядах средних величин рассчитывается по формуле средней арифметической простой:
человек.
Заметим, что средняя списочная численность работников предприятия за 1 квартал, вычисленная по формуле средней хронологической на базе данных на 1 число каждого месяца, и вычисленная по формуле средней арифметической по данным производного ряда, равны между собой, т. е. 155 человек. Сравнение расчетов позволяет понять, почему в формуле средней хронологической начальный и конечный уровни ряда берутся в половинном размере, а все промежуточные уровни берутся в полном размере.
Ряды средних величин, производные от моментных или интервальных рядов динамики, не следует смешивать с рядами динамики, g которых уровни выражены средней величиной. Например, средняя урожайность пшеницы по годам, средняя заработная плата и т. д.
Ряды относительных величин. В экономической практике очень широко используют ряды относительных величин. Практически любой первоначальный ряд динамики можно преобразовать в ряд относительных величин. По сути, преобразование означает замену абсолютных показателей ряда относительными величинами динамики.
Средний уровень ряда в относительных рядах динамики называется среднегодовым темпом роста. Методы его расчета и анализа рассмотрены ниже.
§
Для обоснованной оценки развития явлений во времени необходимо исчислить аналитические показатели: абсолютный прирост, коэффициент роста, темп роста, темп прироста, абсолютное значение одного процента прироста.
В табл. 11.3 приведен цифровой пример, а ниже даны формулы расчета и экономическая интерпретация показателей.
Таблица 11.5
Анализ динамики производства продукта “А ” по предприятию за 1994 -1998 гг.
| Годы | Произведено, тыс. т | Абсолютные приросты, тыс. т | Коэффициенты роста | Темпы роста, % | Темпы прироста, % | Значение 1% прироста, тыс. т | ||||
| цепные | базисные | цепные | базисные | цепные | базисные | цепные | базисные | |||
| – | – | – | 1,00 | – | – | – | – | |||
| 1,050 | 1,05 | 105,0 | 5,0 | 5,0 | 2,00 | |||||
| 1,038 | 1,09 | 103,8 | 3,8 | 9,0 | 2,10 | |||||
| 1,055 | 1,15 | 105,5 | 5,5 | 15,0 | 2,18 | |||||
| 1,017 | 1,17 | 101,7 | 1,7 | 17,0 | 2.30 |
Абсолютные приросты
показывают, на сколько единиц изменился последующий уровень ряда по сравнению с предыдущим (гр. 3 – цепные абсолютные приросты) или по сравнению с начальным уровнем (гр. 4 – базисные абсолютные приросты). Формулы расчета можно записать следующим образом:
;
где
– базисный абсолютный прирост;
– цепной абсолютный прирост;
– уровень ряда за отчетный период;
– уровень ряда предыдущего периода;
– начальный уровень ряда.
Показатели абсолютного прироста свидетельствуют о том, что, например, в 1998 г. производство продукта “А” увеличилось по сравнению с 1997 г. на 4 тыс. т, а по сравнению с 1994 г. – на 34 тыс. т; по остальным годам см. табл. 11.5 гр. 3 и 4.
Коэффициент роста показывает, во сколько раз изменился уровень ряда по сравнению с предыдущим (гр.5 – цепные коэффициенты роста или снижения) или по сравнению с начальным уровнем (гр.6 – базисные коэффициенты роста или снижения). Формулы расчета можно записать следующим образом:
.
Темпы роста показывают, сколько процентов составляет последующий уровень ряда по сравнению с предыдущим (гр. 7 – цепные темпы роста) или по сравнению с начальным уровнем (гр. 8 -базисные темпы роста). Формулы расчета можно записать следующим образом:
, или
.
Так, например, в 1997 г. объем производства продукта “А” по сравнению с 1996 г. составил:
,
а по сравнению с 1994 г.
.
Темпы прироста показывают, на сколько процентов увеличился уровень отчетного периода по сравнению с предыдущим (гр. 9 – цепные темпы прироста) или по сравнению с начальным уровнем (гр. 10 – базисные темпы прироста). Формулы расчета можно записать еле-дующим образом:
или
.
Так, например, в 1996 г. по сравнению с 1995 г. продукта “А” произведено больше на 3,8 % (103,8%- 100%) или
, а по сравнению с 1994 г. – на 9% (109% – 100%).
Если абсолютные уровни в ряду уменьшаются, то темп будет меньше 100% и соответственно будет темп снижения (темп прироста со знаком минус).
Абсолютное значение 1% прироста (гр. 11) показывает, на сколько единиц надо произвести больше в данном периоде, чтобы уровень данного периода возрос по сравнению с предыдущим на 1 %. В нашем примере в 1995 г. надо было произвести 2,0 тыс. т, а в 1998 г. – 2,3 тыс. т, т. е. значительно больше.
Определить величину абсолютного значения 1% прироста можно двумя способами:
1) уровень предшествующего периода разделить на 100;
2) цепные абсолютные приросты разделить на соответствующие цепные темпы прироста.
Абсолютное значение 1 % прироста равно:
.
В динамике, особенно за длительный период, важен совместный анализ темпов прироста с содержанием каждого процента прироста или снижения.
Рассмотренная методика анализа рядов динамики применима как для рядов динамики, уровни которых выражены абсолютными величинами (т, тыс. руб., число работников и т. д.), так и для рядов динамики, уровни которых выражены относительными показателями (процент брака, процент зольности угля и др.), или средними величинами (средняя урожайность в ц/га, средняя заработная плата и т. п.).
Наряду с рассмотренными аналитическими показателями, исчисляемыми за каждый год в сравнении с предшествующим или начальным уровнем, при анализе рядов динамики необходимо исчислить средние за период аналитические показатели: средний уровень ряда, средний годовой абсолютный прирост (уменьшение) и средний годовой темп роста и темп прироста.
Методы расчета среднего уровня ряда динамики были рассмотрены выше. В рассматриваемом нами интервальном ряду динамики средний уровень ряда исчисляется по формуле средней арифметической простой
тыс. т.
Среднегодовой объем производства продукта за 1994 – 1998 гг. составил 218,4 тыс. т.
Среднегодовой абсолютный прирост исчисляется также по формуле средней арифметической простой
тыс. т.
Ежегодные абсолютные приросты изменялись по годам от 4 до 12 тыс.т (см. гр. 3), а среднегодовой прирост производства за период 1995 – 1998 гг. составил 8,5 тыс. т.
Методы расчета среднего темпа роста и среднего темпа прироста требуют более подробного рассмотрения. Рассмотрим их на примере приведенных в таблице годовых показателей уровня ряда.
Средний годовой темп роста и средний годовой темп прироста. Прежде всего, отметим, что приведенные в табл. 11.5 темпы роста (гр. 7 и 8) являются рядами динамики относительных величин – производными от интервального ряда динамики (гр. 2). Ежегодные темпы роста (гр. 7) изменяются по годам (105%; 103,8%; 105,5%;. 101,7%). Как вычислить среднюю величину из ежегодных темпов роста? Эта величина называется среднегодовым темпом роста.

Среднегодовой темп роста исчисляется в следующей последовательности:
1) по формуле средней геометрической исчисляют среднегодовой коэффициент роста (снижения)
;
2) на базе среднегодового коэффициента роста определяют среднегодовой темп роста
путем умножения коэффициента роста на 100%:
.
Среднегодовой темп прироста
определяют путем вычитания из темпа роста 100%:
.
Среднегодовой коэффициент роста (снижения) по формулам средней геометрической может быть исчислен двумя способами:
1) на базе абсолютных показателей ряда динамики по формуле:
,
где: п – число уровней;
п – 1 – число лет в период;
2) на базе ежегодных коэффициентов роста по формуле:
,
где: т – число коэффициентов.
Результаты расчета по формулам равны, так как в обеих формулах показатель степени – число лет в периоде, в течение которого происходило изменение. А подкоренное выражение – это коэффициент роста показателя за весь период времени (см. табл. 11.5, гр. 6, по строке за 1998 г.).
Среднегодовой темп роста равен
.
Среднегодовой темп прироста определяется путем вычитания из среднегодового темпа роста 100%. В нашем примере среднегодовой темп прироста равен:
.
Следовательно, за период 1995 – 1998 гг. объем производства продукта “А” в среднем за год возрастал на 4,0%. Ежегодные темпы прироста колебались от 1,7% в 1998 г. до 5,5% в 1997 г. (за каждый год темпы прироста см. в табл. 11.5, гр. 9).
Среднегодовой темп роста (прироста) позволяет сравнивать динамику развития взаимосвязанных явлений за длительный период времени (например, среднегодовые темпы роста численности работающих по отраслям экономики, объема производства продукции и др.), сравнивать динамику какого-либо явления по разным странам, исследовать динамику какого-либо явления по периодам исторического развития страны.
§
Сезонные колебания потребления горючего
Анализ сезонных колебаний
Изучение сезонных колебаний проводится с целью выявления закономерно повторяющихся различий в уровне рядов динамики в зависимости от времени года. Так, например, реализация сахара населению в летний период значительно возрастает в связи с консервированием фруктов и ягод. Потребность в рабочей силе в сельскохозяйственном производстве различна в зависимости от времени года. Задача статистики состоит в том, чтобы измерить сезонные различия в уровне показателей, и чтобы выявленные сезонные различия были закономерными (а не случайными) необходимо строить анализ на базе данных за несколько лет, по крайней мере, не менее чем за три года. В табл. 11.6 приведены исходные данные, и методика анализа сезонных колебаний методом простой средней арифметической.
Таблица 11.6
| Месяцы | Расход горючего, т | Сумма за 3 года (2 3 4) | Средняя месячная за 3 года, т | Индекс сезонности, % | ||
| 1 год | 2 год | 3 год | ||||
| Январь | 67,1 | |||||
| Февраль | 65,7 | |||||
| Март | 75,1 | |||||
| Апрель | 99,2 | |||||
| Май | 104,6 | |||||
| Июнь | 126,6 | |||||
| Июль | 130,0 | |||||
| Август | 123,5 | |||||
| Сентябрь | 110,3 | |||||
| Октябрь | 112,1 | |||||
| Ноябрь | 98,3 | |||||
| Декабрь | 87,5 | |||||
| Итого | 100,0 |
Средняя величина за каждый месяц исчисляется по формуле средней арифметической простой. Например, за январь:
.
Индекс сезонности (табл. 11.5 гр. 7.) исчисляется путем деления средних величин за каждый месяц на общую среднюю месячную величину, принятую за 100%. Средняя месячная за весь период может быть исчислена путем деления общего расхода горючего за три года на 36 месяцев:
т,
или путем деления на 12 суммы средних месячных, т. е. суммарного итога по гр. 6:
т.
Для наглядности на основе индексов сезонности строится график сезонной волны (рис. 11.1). По оси абсцисс располагают месяцы, а по оси ординат – индексы сезонности в процентах (табл. 11.6, гр. 7). Общая средняя месячная за все годы располагается на уровне 100%, а средние месячные индексы сезонности в виде точек наносят на поле графика в соответствии с принятым масштабом по оси ординат. Точки соединяют между собой отрезками прямых линий.

Рис. 11.1. Сезонные колебания потребления горючего
§
В сельскохозяйственных предприятиях за 3 года
В приведенном примере годовые объемы расхода горючего различаются незначительно. Если же в ряду динамики наряду с сезонными колебаниями имеется ярко выраженная тенденция роста (снижения), т. е. уровни в каждом последующем году систематически значительно возрастают (уменьшаются) по сравнению с уровнями предыдущего года, то более достоверные данные о размерах сезонности получим следующим образом:
1) для каждого года вычислим среднюю месячную величину;
2) исчислим индексы сезонности за каждый год путем деления данных за каждый месяц на среднюю месячную величину за этот год и умножения на 100%;
3) за весь период исчислим средние индексы сезонности по формуле средней арифметической простой из исчисленных за каждый год месячных индексов сезонности. Так, например, за январь средний индекс сезонности получим, если сложим январские значения индексов сезонности за все годы (допустим за три года) и разделим на число лет, т. е. на три. Аналогично исчислим за каждый месяц средние индексы сезонности.
Переход за каждый год от абсолютных месячных значений показателей к индексам сезонности позволяет устранить тенденцию роста (снижения) в ряду динамики и более точно измерить сезонные колебания.
В условиях рынка при заключении договоров на поставку различной продукции (сырья, материалов, электроэнергии, товаров) необходимо располагать информацией о сезонных потребностях в средствах производства, о спросе населения на отдельные виды товаров. Результаты исследования сезонных колебаний важны для эффективного управления экономическими процессами.
В экономической практике часто возникает необходимость сравнения между собой нескольких рядов динамики (например, показатели динамики производства электроэнергии, производства зерна, продажи легковых автомобилей и др.). Для этого нужно преобразовать абсолютные показатели сравниваемых рядов динамики в производные ряды относительных базисных величин, приняв показатели какого-либо одного года за единицу или за 100%.Такое преобразование нескольких рядов динамики называется приведением их к одинаковому основанию. Теоретически за базу сравнения может быть принят абсолютный уровень любого года, но в экономических исследованиях для базы сравнения надо выбирать период, имеющий определенное экономическое или историческое значение в развитии явлений. В настоящее время за базу сравнения целесообразно принять, например, уровень 1990 г.
§
Для исследования закономерности (тенденции) развития изучаемого явления необходимы данные за длительный период времени. Тенденцию развития конкретного явления определяет основной фактор. Но наряду с действием основного фактора в экономике на развитие явления оказывают прямое или косвенное влияние множество других факторов, случайных, разовых или периодически повторяющихся (годы, благоприятные для сельского хозяйства, засушливые и т. п.). Практически все ряды динамики экономических показателей на графике имеют форму кривой, ломаной линии с подъемами и снижениями. Во многих случаях по фактическим данным ряда динамики и по графику трудно определить даже общую тенденцию развития. Но статистика должна не только определить общую тенденцию развития явления (рост или снижение), но и дать количественные (цифровые) характеристики развития.
Тенденции развития явлений изучают методами выравнивания рядов динамики:
1) метод укрупнения интервалов;
2) метод скользящей средней;
3) метод аналитического выравнивания.
В табл. 11.7 (гр. 2) приведены фактические данные о производстве зерна в России за 1981 – 1992 гг. (во всех категориях хозяйств, в весе после доработки) и расчеты по выравниванию этого ряда тремя методами.
Метод укрупнения интервалов времени (гр. 3).
Учитывая, что ряд динамики небольшой, интервалы взяты трехлетние и для каждого интервала исчислены средние. Среднегодовой объем производства зерна по трехлетним периодам исчислен по формуле средней арифметической простой и отнесен к среднему году соответствующего периода. Так, например, за первые три года (1981 – 1983 гг.) средняя величина записана против 1982 г.:
млн. т.
За следующий трехлетний период (1984 – 1986 гг.) средняя величина
млн. т
записана против 1985 г.
За остальные периоды результаты расчета приведены в гр. 3.
Приведенные в гр. 3 показатели среднегодового объема производства зерна в России свидетельствуют о закономерном увеличении производства зерна в России за период 1981 – 1992 гг.
Метод скользящей средней (см. гр. 4 и 5) также основан на исчислении средних величин за укрупненные периоды времени. Цель та же – абстрагироваться от влияния случайных факторов, взаимопогасить их влияние в отдельные годы. Но метод расчета другой.
В приведенном примере исчислены пятизвенные (по пятилетним периодам) скользящие средние и отнесены к серединному году в соответствующем пятилетнем периоде. Так, за первые пять лет (1981 — 1985 гг.) по формуле средней арифметической простой исчислен среднегодовой объем производства зерна и записан в табл. 11.7 против 1983 г.
млн. т;
за второй пятилетний период (1982 – 1986 гг.) результат записан против 1984 г.
млн.т.
За последующие пятилетние периоды расчет производится аналогичным способом путем исключения начального года и прибавления следующего за пятилетним периодом года и деления полученной суммы на пять. При этом методе концы ряда остаются пустыми.
Какой продолжительности должны быть периоды времени? Три, пять, десять лет? Вопрос решает исследователь. В принципе, чем больше период, тем больше происходит сглаживание. Но надо учитывать длину ряда динамики; не забывать, что метод скользящей средней оставляет срезанные концы выравненного ряда; учитывать этапы развития, например, в нашей стране долгие годы социально-экономическое развитие планировалось и соответственно анализировалось по пятилеткам.
Таблица 11.7
§
| Годы | Произведено, млн. т | Средняя за 3 года, млн. т | Скользящая сумма за 5 лет, млн. т | Расчетные показатели | |||||
| t | ![]() | yt | ![]() | ||||||
| Сумма | Средняя | ||||||||
| 73,8 | – | – | – | 73,8 | 89,5 | ||||
| 98,0 | 92,0 | – | – | 196,0 | 91,1 | ||||
| 104,3 | – | 459,8 | 92,0 | 312,9 | 92,6 | ||||
| 85,1 | – | 493,5 | 98,7 | 340,4 | 94,2 | ||||
| 98,6 | 97,1 | 494,1 | 98,8 | 493,0 | 95,8 | ||||
| 107,5 | – | 483,5 | 96,7 | 645,0 | 97,3 | ||||
| 98,6 | – | 503,2 | 100,6 | 690,2 | 98,9 | ||||
| 93,7 | 99,1 | 521,3 | 104,3 | 749,6 | 100,4 | ||||
| 104,8 | – | 502,9 | 100,6 | 943,2 | 102,0 | ||||
| 116,7 | – | 511,2 | 102,2 | 1167,0 | 103,5 | ||||
| 89,1 | 104,2 | – | – | 980,1 | 105,1 | ||||
| 106,9 | – | – | – | 1282,8 | 106,7 | ||||
| Итого | 1177,1 | – | – | – | 7874,0 | 1177,1 |
Метод аналитического выравнивания (гр. 6-9) основан на вычислении значений выравненного ряда по соответствующим математическим формулам. В табл. 11.7 приведены вычисления по уравнению прямой линии
,
где:
– уровни выровненного ряда (теоретические показатели);
t – года (1, 2, 3, …, п);
a и b – неизвестные параметры уравнения.
Для определения параметров надо решить систему уравнений

Необходимые величины для решения системы уравнений вычислены и приведены в табл. 11.7 (см. гр. 6 – 8). Подставим их в систему уравнений:

Умножим первое уравнение на – 6,5, сложим со вторым уравнением системы и получим уравнение:

В результате вычислений получаем: а = 87,96; b = 1,555.
Подставим значение параметров и получим уравнение прямой линии:
.
Для каждого года подставляем значение t и получаем уровни выравненного ряда (см. гр. 9):
1981 г.
;
1982 г.
;
1983 г.
и т. д.
Заметим, что
.
В выравненном ряду происходит равномерное возрастание уровней ряда в среднем за год на 1,555 млн. т (значение параметра b). Метод основан на абстрагировании влияния всех остальных факторов, кроме основного.
Явления могут развиваться в динамике равномерно (рост или снижение). В этих случаях чаще всего подходит уравнение прямой линии. Если же развитие неравномерно, например, сначала очень медленный рост, а с определенного момента резкое возрастание, или, наоборот, сначала резкое снижение, а затем замедление темпов спада, то выравнивание надо выполнить по другим формулам (уравнение параболы, гиперболы и др.). При необходимости надо обратиться к учебникам по статистике или специальным монографиям, где более подробно изложены вопросы выбора формулы для адекватного отражения фактически сложившейся тенденции исследуемого рада динамики.

Рис. 11.2. Производство зерна в России за 1981 -1982 гг.
Для наглядности показатели уровней фактического ряда динамики и выравненных рядов нанесем на график (рис. 11.2). Фактические данные представляет ломаная линия черного цвета, свидетельствующая о подъемах и снижениях объема производства зерна. Остальные линии на графике показывают, что применение метода скользящей средней (линия со срезанными концами) позволяет существенно выровнять уровни динамического ряда и соответственно на графике ломаную кривую линию сделать более плавной, сглаженной. Однако выравненные линии все же остаются кривыми линиями. Построенная на базе теоретических значений ряда, полученных по математическим формулам, линия строго соответствует прямой линии.
Каждый из трех рассмотренных методов имеет свои достоинства, но в большинстве случаев метод аналитического выравнивания предпочтителен. Однако его применение связано с большими вычислительными работами: решение системы уравнений; проверка обоснованности выбранной функции (формы связи); вычисление уровней выровненного ряда; построение графика. Для успешного выполнения таких работ целесообразно использовать компьютер и соответствующие программы.
Контрольные вопросы
(выберите правильный ответ)
1. Определите правильный результат расчета среднесписочной численности работников предприятия, если численность на начало года составляла 200 человек, на середину года – 198 человек и на конец года – 220 человек:
а)
; б)
; в)
.
2. Назовите правильный результат расчета среднегодового размера сберегательного вклада, если сумма вклада с января по май включительно составляла 50 тыс. руб.; с июня по сентябрь – 65 тыс. руб.; с октября по декабрь – 70 тыс. руб.:
а)
; б)
; в)
.
3. Определите правильный метод расчета остатка товаров в магазине за 1 квартал, если остаток товаров на 01.01 – 600 тыс. руб.; на 01.02 -540 тыс. руб.; на 01.03 – 560 тыс. руб.; на 01.04 – 620; на 01.05 – 580 тыс. руб.:
а)
; б)
; в)
; г)
.
4. Определите правильный метод расчета среднего остатка товаров по магазину за 1 квартал, если средний остаток товаров составил за январь – 500 тыс. руб.; за февраль – 460 тыс. руб.; за март – 530 тыс. руб.; за апрель – 520 тыс. руб.:
а)
; б)
; в)
.
5. Определите правильный результат расчета среднесписочной численности работников предприятия за год, если средняя списочная численность работников составила за 1 полугодие – 200 человек; за 3 квартал – 220 человек; за октябрь – 190 человек; за ноябрь – 230 человек; за декабрь — 180 человек:
а)
; б)
;
в)
; г)
.
6. Товарооборот магазина составил, млн. руб.: 1995 г. – 200; 1996 г. – 220; 1997 г. – 226; 1998 г. – 230. Определите правильный результат расчета среднегодового абсолютного прироста за анализируемый период, млн. руб.:

а)
; б)
; в)
; г)
.
7. Объем производства продукции по предприятию в 1997 г. по сравнению с 1996 г. увеличился на 5%, а в 1998 г. по сравнению с 1997 г. увеличился на 7%. Определите правильный метод расчета темпа прироста объема производства продукции в 1998 г. по сравнению с 1996 г.:
а)
; б)
; в)
.
8. Назовите правильный метод вычисления среднегодового темпа роста, если производство продукта в 1994 г. составило 200 т, а в 1998 г. – 225 т, т. е. увеличилось на 12,5%:
а)
; б)
; в)
.
9. Объем производства продукции предприятия в 1998 г. по сравнению с 1994 г. увеличился на 26%. Определите правильный метод вычисления среднегодового темпа роста за анализируемый период:
а)
; б)
; в)
;
г)
.
10. Численность персонала по предприятию на начало 1999 г. по сравнению с началом 1995 г. уменьшилась на 20%. Определите правильный метод вычисления среднегодового темпа снижения численности персонала за анализируемый период:
а)
; б)
; в)
;
г)
.
§
Общее представление о корреляционно-регрессионном анализе
Тема 12. Методы изучения взаимосвязи социально-экономических явлений с помощью корреляционно-регрессионного анализа
Существующие между явлениями формы и виды связей весьма разнообразны по своей классификации. Предметом статистики являются только такие из них, которые имеют количественный характер и изучаются с помощью количественных методов. Рассмотрим метод корреляционно-регрессионного анализа, который является основным в изучении взаимосвязей явлений.
Данный метод содержит две свои составляющие части – корреляционный анализ и регрессионный анализ. Корреляционный анализ – это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ – это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.
Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока: слабая – от 0,1 до 0,3; умеренная – от 0,3 до 0,5; заметная – от 0,5 до 0,7; высокая – от 0,7 до 0,9; весьма высокая (сильная) – от 0,9 до 1,0.
Данная корреляция характеризует линейную взаимосвязь в вариациях переменных. Она может быть парной (две коррелирующие переменные) или множественной (более двух переменных), прямой или обратной – положительной или отрицательной, когда переменные варьируют соответственно в одинаковых или разных направлениях.
Если переменные – количественные и равноценные в своих независимых наблюдениях при их общем количестве n, то важнейшими эмпирическими мерами тесноты их линейной взаимосвязи являются коэффициент парной корреляции знаков австрийского психолога Г. Т. Фехнера (1801 – 1887) и коэффициенты парной, чистой (частной) и множественной (совокупной) корреляции английского статистика-биометрика К. Пирсона (1857 – 1936).
Коэффициент парной корреляции знаков Фехнера определяет согласованность направлений в индивидуальных отклонениях переменных х и y от своих средних
и
.
Он равен отношению разности сумм совпадающих C и несовпадающих H пар знаков в отклонениях
и
к сумме этих сумм:
, (1)
где n – число наблюдений.
Величина
изменяется от -1 до 1. Если какое-то одно отклонение
или
, то оно не входит в расчет. Если же сразу оба отклонения нулевые:
, то такой случай считается совпадающим по знакам и входит в состав С. В табл. 12.1 показаны данные для расчета
по формуле (1).
Таблица 12.1
§
| Магазин | Число работников, тыс. чел. | Товарооборот, усл. ден. ед. | Отклонение от средних величин и ![]() | Сравнение знаков и ![]() | ||
| к | ![]() | ![]() | ![]() | ![]() | совпадение![]() | несовпадение![]() |
| 0,2 | 3,1 | 0,0 | -0,9 | |||
| 0,1 | 3,1 | -0,1 | -0,9 | |||
| 0,4 | 5,0 | 0,2 | 1,0 | |||
| 0,2 | 4,4 | 0,0 | 0,4 | |||
| 0,1 | 4,4 | -0,1 | 0,4 | |||
| Итого | 1,0 | 20,0 | – | – |
По (1) имеем
.
Направление взаимосвязи в вариациях численности работников и объема товарооборота – положительное (прямолинейное): знаки в отклонениях
и
в своем большинстве (в 3 случаях из 5) совпадают между собой. Теснота взаимосвязи переменных по шкале Чеддока – слабая.
Коэффициенты парной, чистой (частной) и множественной (совокупной) линейной корреляции Пирсона, в отличие от коэффициента Фехнера, учитывают не только знаки, но и величины отклонений переменных. Для их расчета используют разные методы. Так, согласно методу прямого счета по несгруппированным данным, коэффициент парной корреляции Пирсона имеет вид
. (2)
Этот коэффициент также изменяется от -1 до 1.
При наличии нескольких переменных рассчитывается коэффициент множественной (совокупной) линейной корреляции Пирсона. Для трех переменных х, у, z он имеет вид
. (3)
Этот коэффициент изменяется от 0 до 1.
Если элиминировать (совсем исключить или зафиксировать на постоянном уровне) влияние z на x и у, то их “общая” связь превратится в “чистую”, образуя чистый (частный) коэффициент линейной корреляции Пирсона
. (4)
Этот коэффициент изменяется от -1 до 1. Квадраты коэффициентов корреляции (2) – {4) называются коэффициентами (индексами) детерминации, соответственно, парной, чистой (частной), множественной (совокупной):
;
; (5)
.
Каждый из коэффициентов детерминации изменяется от 0 до 1. Он оценивает степень вариационной определенности в линейной взаимосвязи переменных, показывая долю вариации одной переменной у, обусловленную вариацией другой (других) – х и y. Многомерный случай наличия более трех переменных здесь не рассматривается.
Согласно работам английского статистика Р. Э. Фишера (1890 – 1962), статистическая значимость парного и чистого (частного) коэффициентов корреляции Пирсона проверяется в случае нормальности их распределения, на основании t-распределения английского статистика В. С. Госсета (псевдоним “Стьюдент”; 1876 – 1937) с заданным уровнем вероятностной значимости
и имеющимися степенями свободы
, где m – число связей (факторных переменных). Для парного коэффициента
имеем его среднеквадратическую ошибку
и фактическое значение t-критерия Стьюдента
;
. (6)
Для чистого коэффициента корреляции
при расчете его
, вместо
надо брать
, так как в этом случае т = 2 (две факторные переменные х и z). При большом числе
, вместо
или
в (6) можно брать п, пренебрегая точностью расчета.
Если
, то коэффициент парной корреляции – общий или чистый является статистически значимым, а при
– статистически незначимым.
Значимость коэффициента множественной корреляции R проверяется по F-критерию Фишера путем расчета его фактического значения
. (7)
При
коэффициент R считается статистически значимым с заданным уровнем значимости
и имеющимися степенями свободы
и
, а при
– статистически незначимым.
В совокупностях большого объема
для оценки значимости всех коэффициентов Пирсона вмести критериев t и F применяется непосредственно нормальный закон распределения (табулированная функция Лапласа-Шеппарда).
Наконец, если коэффициенты Пирсона не подчиняются нормальному закону, то в качестве критерия их значимости используется Z-критерий Фишера, который здесь не рассматривается.
Условный пример расчета (2) – (7) дан в табл. 12.2, где взяты исходные данные табл. 12.1 с добавлением к ним третьей переменной z – размера общей площади магазина (в 100 кв. м).
Таблица 12.2
§
| Магазины | Показатели | ||||||||
| k | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
| 0,2 | 3,1 | 0,1 | 0,62 | 0,02 | 0,31 | 0,04 | 9,61 | 0,01 | |
| 0,1 | 3,1 | 0,1 | 0,31 | 0,01 | 0,31 | 0,01 | 9,61 | 0,01 | |
| 0,4 | 5,0 | 1,0 | 2,00 | 0,40 | 5,00 | 0,16 | 25,00 | 1,00 | |
| 0,2 | 4,4 | 0,2 | 0,88 | 0,04 | 0,88 | 0,04 | 19,36 | 0,04 | |
| 0,1 | 4,4 | 0,6 | 0,44 | 0,06 | 2,64 | 0,01 | 19,36 | 0,36 | |
| Итого | 1,0 | 20,0 | 2,0 | 4,25 | 0,53 | 9,14 | 0,26 | 82,94 | 1,42 |
Согласно (2) – (5), коэффициенты линейной корреляции Пирсона равны:
;
;
;
;
;
;
;
.
Взаимосвязь переменных x и y является положительной, но не тесной, составляя по их парному коэффициенту корреляции величину
и по чистому – величину
и оценивается по шкале Чеддока соответственно как “заметная” и “слабая”.
Коэффициенты детерминации
и
свидетельствуют, что вариация у (товарооборота) обусловлена линейной вариацией х (численности работников) на 35,4% в их общей взаимосвязи и в чистой взаимосвязи – только на 0,37%. Такое положение обусловлено значительным влиянием на х и у третьей переменной z – занимаемой магазинами общей площади. Теснота ее взаимосвязи с ними составляет соответственно
и
.
Коэффициент множественной (совокупной) корреляции трех переменных показывает, что теснота линейной взаимосвязи x и z с у составляет величину R = 0,844, оцениваясь по шкале Чеддока как “высокая”, а коэффициент множественный детерминации – величину
, свидетельствуя, что 71,3 % всей вариации y (товарооборота) обусловлены совокупным воздействием на нее переменных х и z. Остальные 28,7% обусловлены воздействием на y других факторов или же криволинейной связью переменных у, х, z.
Для оценки значимости коэффициентов корреляции возьмем уровень значимости
. По исходным данным имеем степени свободы
для
и
для
. По теоретической таблице находим соответственно
и
. Для F-критерия имеем:
,
. По таблице находим
. Фактические значения каждого критерия по (6) и (7) равны:
;
;
.
Все расчетные критерии меньше своих табличных значений: все коэффициенты корреляции Пирсона статистически незначимы.
§
Коэффициенты линейной корреляции Пирсона имеют своей теоретической предпосылкой нормальное или близкое к нему распределение переменных и их количественное выражение. При других Условиях возникает непараметрическая корреляция, в частности, ранговая корреляция, которая применяется в тех случаях, когда наблюдения неравноценны между собой или когда переменные (признаки) – качественные. Ранги бывают несвязными и связными – соответственно неповторяющимися и повторяющимися по наблюдениям
, задаваясь субъективно или по специальным методикам.
Среди всех ранговых показателей важнейшими являются ранговые коэффициенты парной линейной корреляции
и
английских статистиков-биометриков Ч. Спирмена (1863 – 1945) и М. Кендэла (род. 1907). В случае неповторяющихся (несвязных) рангов
и
для переменных
и
в их наблюдениях
искомые ранговые коэффициенты равны:
а)
;
б)
, (8)
где:
– квадрат разности рангов
и
двух переменных х и y в наблюдении к;
– число рангов
, превышающих данный ранг
зависимой переменной у, при сравнении ее наблюдения k со всеми последующими наблюдениями
для
;
– аналогичное число последующих рангов, не превышающих данный ранг
;
– сумма превышающих и не превышающих рангов.
Ранги
и
для
и r обычно задаются целочисленными – от 1 до n и в зависимости от исходных значений переменных
и
: чем эти значения больше (меньше), тем выше (ниже) их ранги. Например, наименьшие значения х и y получают свои единичные
, а наибольшие – свои максимальные ранги
. В принципе возможна другая система ранжирования переменных по их наблюдениям.
Для многомерного случая наличия m переменных на основе
определяется коэффициент линейной конкордации (экспертного согласия) Кендэла – коэффициент множественной ранговой корреляции, который в случае несвязных рангов имеет вид
. (9)
Случай связных (повторяющихся) рангов для показателей
,
, W здесь не рассматривается ввиду громоздкости математических выражений и трудоемкости расчетов.
Значимость коэффициентов Спирмена и Кендэла оценивается по-разному. Значимость
при
проверяется по “Таблице значимости коэффициентов Спирмена”, которая разработана английскими биометриками Г. Т. Глиссером и Р. Ф. Винтером в 1961 г. и приводится в редких русских источниках. Поэтому чаще всего используется классический t-критерий Стьюдента путем расчета его фактического значения
на основе среднеквадратической ошибки 
. (10)
Если
, то коэффициент
статистически значим с заданным уровнем значимости
и имеющимися степенями свободы
, а при
– статистически незначим.
Значимость
при
оценивается аналогично (10), с учетом замены
на
и
на
.
При большом числе наблюдений, когда
, значимость
оценивается по нормальному закону, путем расчета на основе ошибки
его порогового значения
:
; (11)
где
– аргумент нормального закона (табулированной функции Лапласа-Шеппарда) при заданном уровне доверительной вероятности
.
Если
, то коэффициент
статистически значим, а при
– статистически незначим. Значимость W проверяется по
– распределению Пирсона путем расчета его фактического значения
. (12)
При
коэффициент W значим с уровнем значимости
и числом степеней свободы
, а при
– незначим.
Все критерии (10) – (12) рассмотрены для случая несвязных рангов. Практически считается, что
,
, W являются значимыми, когда они превышают число 0,5. В табл. 12.3 – 12.5 на условных данных проведен расчет коэффициентов для несвязных рангов с единым уровнем значимости
.
Таблица 12.3.
Подготовка данных для расчета рангового коэффициента
Спирмена
§
§
По данным товарных запасов х, товарооборота у, кредита z, в усл. ден. ед.
Подготовка данных для расчета коэффициента конкордации Кендэла
Для случая несвязных рангов по (9) получаем
.
Теснота взаимосвязи переменных х, у, z по шкале Чеддока – умеренная. По таблице распределения Пирсона находим
с уровнем значимости
и степенями свободы
. Фактическое значение критерия по (12) равно
.
Так как фактическое значение критерия Пирсона меньше табличного, то коэффициент конкордации W – статистически незначим.
Наряду с рассмотренными ранговыми коэффициентами корреляции Ч. Спирмена и М. Кендэла, для измерения корреляции качественных признаков применяются также коэффициенты контингенции (сходства) К. Пирсона, ассоциации (связи) английского статистика Э. Дж. Юла (1871 – 1951), взаимной сопряженности К. Пирсона и А.А. Чупрова (1874 – 1926), биссериальный коэффициент корреляции Тате и некоторые другие. Они отличаются от ранговых коэффициентов
и
тем, что используют для оценки качества не ранги (экспертные оценки), а численности единиц в выборке с данным качественным признаком или его частоты и доли.
Коэффициенты ассоциации Юла и контингенции Пирсона
и
определяют тесноту связи между двумя разными альтернативными признаками, каждый из которых принимает только два своих противоположных значения 1 или 0, означающих наличие или отсутствие данного качества. Численности единиц
этих признаков распределяются по двум своим группам в четырехклеточной таблице взаимной сопряженности, образуя ее соответствующие клеточные объемы а, b, с, d – частоты единиц с сопряженными альтернативными признаками, когда общий объем совокупности п составляют группировки
. Математические формулы коэффициентов
и
, приведены со своими расчетами после исходной табл. 12.6.
Таблица 12.6
Распределение п = 100 человек трудового персонала предприятия
§
§
По условию число групп обоих признаков составляет
. Распределительные частоты
даны в сопряженных клетках таблицы. Маргинальные частоты
и
рассчитаны в итоговых строках и столбцах. По (14.а) получаем:

;
.
Взаимосвязь качественных признаков х и у, согласно полученным значениям
и
, является прямолинейной и положительной, оцениваясь по шкале Чеддока для обоих коэффициентов как “умеренная”. Предпочтение следует отдать коэффициенту Чупрова как учитывающему число групп s и t в вариациях признаков х и у.
Модифицированные коэффициенты Пирсона и Чупрова отличаются от предыдущих (14.а) и (14.б) использованием вместо “средней квадратической сопряженности”
показателя “общей квадратической сопряженности”
– критерия Пирсона:
а)
; (15.а)
б)
. (15.б)
С учетом ранее найденного значения
по (15.а) получаем
. Тогда искомые коэффициенты (15.а), (15.б) равны:
.
Статистическая значимость коэффициентов сопряженности проверяется по табличному критерию
– квадрат Пирсона. Так,
для уровня значимости
и числа степеней свободы
.
Расчетное значение этого критерия
превышает табличное
, значит оба коэффициента сопряженности C и T статистически значимые.
Биссериальный коэффициент корреляции
Тате предназначен для измерения тесноты связи между альтернативным признаком х и количественным признаком у.
Исходные данные для расчета этого коэффициента содержит двумерная таблица сопряженности, имеющая две групповые строки (столбца)
для альтернативных значений
, при
, и несколько групповых столбцов (строк)
для
при
. Если признак у – интервальный, то он центрируется в виде

как полусумма нижнего (н) и верхнего (в) значений в группе j. Рабочее поле таблицы образуют распределенные по группам единицы наблюдения п – их частоты
с сопряженными признаками
и
в клетке ij. Рассчитывается биссериальный коэффициент по формуле:
; (16)
где


– средние величины количественного признака y в альтернативных группах 1 и 2;
– средняя величина и среднеквадратическое отклонение признака y во всей таблице;
– доли наблюденных единиц в альтернативных группах 1 и 2 соответственно с нужным и ненужным качественным признаком x;
– табличное значение Z-распределения Фишера в зависимости от доли единиц
. Условные данные для расчета биссериального коэффициента приведены в табл. 12.8.
Таблица 12.8
По (16) рассчитываем
;
;

;
.
Между альтернативными группами продовольственных и непродовольственных магазинов и объемами их товарооборота отсутствует корреляционная связь. Значимость
проверяется по t-критерию Стьюдента аналогично (6).
§
12.5.1. Общее представление о регрессионном анализе
После установления с помощью корреляционного анализа направления и тесноты связи между переменными величинами следует определить вид ее математической функции. Такая задача решается с помощью регрессионного анализа, который находит эту функцию с некоторой вероятностью по данным статистического наблюдения.
Вид функции определяется путем построения и анализа так называемого “уравнения регрессии”
, показывающего зависимость среднего значения переменной y от переменных
, вектора
и вектора параметров (коэффициентов)
, где
– свободный член уравнения,
,
– параметры (коэффициенты) факторов
.
Если уравнение регрессии имеет один фактор, то оно называется “парным”, а если более одного – “множественным”.
Уравнение регрессии сначала задается аналитически или же подбирается графически по расположению фактических данных у. После расчета своих коэффициентов и решения других вопросов оно проверяется по определенным критериям достоверности и при необходимости пересматривается до получения статистически значимого результата.
12.5.2. Определение коэффициентов уравнения регрессии методом наименьших квадратов
Если математический вид уравнения регрессии выбран, то далее определяются его коэффициенты
. Существует несколько методов их определения. Самый распространенный – метод наименьших квадратов (МНК), который состоит в сведении к минимуму общей суммы квадратов отклонений
фактических наблюдений
от теоретических значений
путем минимизации функционала:
. (17)
Этот функционал следует продифференцировать по искомым параметрам
, приравнять к нулю полученные выражения, упростить их и решить полученную систему дифференциальных уравнений, проверив ее, кроме того, на свою “минимальность” (во избежание “максимальности”) по знаку второй производной от функционала F. Решение этой системы не всегда существует и сопряжено со значительными сложностями. Наиболее надежный вариант, когда берется линейная функция
. (18)
Тогда после всех математических преобразований по МНК образуется линейная “система нормальных уравнений” (СНУ), содержащая исходные наблюдения переменных
и
и искомые коэффициенты регрессии
:
. (19)
Суммирование переменных x и y производится по наблюдениям
, индекс которых под знаками сумм снят ради упрощения. Решение СНУ в (19) можно получить по-разному, используя метод подстановки неизвестных, метод определителей Крамера, итерационный метод Гаусса-Зейделя, метод обратной матрицы и другие методы, а в случае парной регрессии ее решение при
получается сразу по методу прямого счета
. (20)
Для многомерного случая
факторов наилучшим методом решения СНУ является метод обратной матрицы, который позволяет получить не только наименее трудоемкое решение, но и оценить его на статистическую значимость. Матричная форма СНУ в (19) имеет вид:
, (21)
где
– краткие обозначения соответствующих результатов.
Матрица исходных факторов
, ее расширенная на первый (нулевой) единичный столбец
матрица
и транспонированная по отношению к
матрица
имеют вид
.
Единичные элементы
и
при
в двух последних матрицах необходимы для получения первого столбца и первой строки СНУ в (19), представляя собой зарезервированные места для расчета коэффициента
.
Размерность исходной факторной матрицы X равна
, ее расширенной матрицы
–
, транспонированной матрицы
–
, матрицы C –
, матрицы
–
, матриц
и
–
.
Так как квадратная матрица C в левой части СНУ является симметричной относительно положительных элементов главной диагонали (с левого верхнего угла в правый нижний угол) и ввиду этого невырожденной, то СНУ в (19) имеет единственное решение
. (22)
Это решение дает минимум, а не максимум функционала F в (17), так как его вторые производные, в случае линейной регрессии, – положительные величины, составляя для свободного члена
величину
и для факторных коэффициентов
– удвоенную величину положительных диагональных элементов в матрице С.
12.5.3. Линеаризация нелинейных функций
Наличие единственности решения (21) и относительная легкость его получения обусловливают использование линейного МНК для нелинейных функций. Поэтому до МНК нелинейную функцию стремятся по возможности привести к линейному виду относительно коэффициентов
. Для этого используются разные способы – условная замена переменных, тейлоровское разложение сложных функций в полиномный многочлен, логарифмирование и другие приемы линеаризации. Например, мультипликативная степенная функция линеаризируется относительно параметров
, путем своего логарифмирования:
а)
;
б)
. (23)
Далее в (19) образуется “скорректированная” СНУ, где все исходные данные х и у будут прологарифмированы. Аналогичные “скорректированные” СНУ свойственны некоторым другим функциям. Так, для гиперболической и параболической функций
, (24)
с помощью замены переменных из (19) получают скорректированные СНУ
а)
;
б)
. (25)
Все соотношения (19) – (25) основывались на исходных несгруппированных наблюдениях. При наличии аналитической группировки или корреляционной таблицы в случае линейной регрессии можно также скорректировать все ее СНУ путем умножения переменных х и у на частоты
и
. Образуется “частотная” СНУ. Так, при
для парной линейной регрессии
и гиперболической регрессии
их частотные СНУ имеют вид:
а)
;
б)
. (26)
Для многомерного случая наличия более
разных факторов частотная СНУ уже непригодна. Надо переходить от двумерной аналитической группировки и двумерной корреляционной таблицы к многомерным группировкам. Однако они себя практически не оправдывают, будучи громоздкими и трудоемкими. Поэтому лучше ограничиться несгруппированной СНУ (19) и действовать по общему алгоритму МНК.

12.5.4. Сравнительные показатели факторного воздействия
Основополагающей в регрессионном анализе является нестандартизованное (натуральное) уравнение регрессии с найденными по МНК коэффициентами
, т. е. гиперплоскость
. (27)
Коэффициент (свободный член)
– это расстояние гиперплоскости от начала координат. Для парной регрессии при
таким расстоянием является линия среднего уровня
, когда при
образуется
.
Коэффициенты
, при факторах
(факторные коэффициенты) – это первые производные уравнения регрессии по переменному фактору
. Они показывают, как в среднем изменится переменная y, если
изменится на одну единицу своего измерения при постоянстве других регрессионных факторов.
Свободный член
измеряется в одинаковых с результативной переменной y единицах. Факторные коэффициенты
, имеют смешанные единицы, измеряясь в относительных единицах переменной y к фактору
. Поэтому сравнивать их между собой нельзя, как и сопоставлять по ним воздействие на у разных факторов. Для этого надо перейти от различных коэффициентов
, к безразмерным “стандартизованным” коэффициентам
, путем построения “стандартизованного (нормированного)” уравнения регрессии, которое выражает связь между нормированными отклонениями
и
, переменных y и
,
. (28)
Это уравнение связано с переносом начала координат в точку пересечения средних величин
.
Безразмерные стандартизованные коэффициенты
показывают, на сколько своих нормированных отклонений
изменится в среднем переменная y, если фактор
изменится на одно свое нормированное отклонение
, при постоянстве других регрессионных факторов. Чем больше
, тем сильнее это воздействие, и наоборот.
Наряду с коэффициентами
для факторного сравнения рассчитываются другие показатели – коэффициенты эластичности
вариационные коэффициенты
, коэффициенты раздельной детерминации
, коэффициенты долевого вклада
и некоторые другие. В случае линейной регрессии эти коэффициенты равны
, (29)
где
– коэффициент вариации фактора
, выраженный в долях единицы (а не в процентах). Интерпретация коэффициентов (29) дана далее в 12.5.7 на условном примере.
12.5.5. Статистическая адекватность уравнения регрессии
Статистическая адекватность уравнения регрессии (его достоверность) проверяется по F-критерию Фишера-Снедекора путем расчета фактического значения этого критерия как соотношения факторной и остаточной вариаций
и
в расчете на одну степень их свободы
и
, или же, как соотношение теоретических коэффициентов множественной детерминации
и недетерминации
в расчете на те же степени свободы
и
:
;
, (30)
где
– общая, факторная и остаточная дисперсии.
Преобразования в (30) основаны на правиле сложения дисперсий, которое применительно к регрессионному анализу означает, что
,
и
при
.
Теоретический коэффициент детерминации
показывает долю факторной вариации
в общей вариации
. Его следует отличать от эмпирического коэффициента детерминации
, который применяется в дисперсионном анализе и показывает долю межгрупповой дисперсии
в общей дисперсии
, когда
;
, (31)
где:
– объем группы i и групповая средняя;
– внутригрупповая дисперсия.
Корни квадратные из эмпирического и теоретического коэффициентов детерминации дают их соответственно эмпирическое и теоретическое корреляционное отношения
. (32)
Все четыре коэффициента,
изменяются от 0 до 1. Показатель
служит в дисперсионном анализе мерой влияния на вариацию переменной у группировочного признака х, взятого за основание аналитической группировки, а показатель
является в регрессионном анализе мерой определенности (причинности) той части вариации переменной у, которая описывается уравнением регрессии. Чем адекватнее уравнение регрессии, тем
больше (ближе к единице), и наоборот: чем неадекватнее уравнение, тем
ближе к нулю.
Если уравнение регрессии – линейное, то теоретический коэффициент множественной детерминации
превращается в совокупный коэффициент линейной детерминации
. Тогда (30) принимает вид (7).
При
уравнение регрессии считается статистически значимым (адекватным), а при
– статистически незначимым (неадекватным).
В последнем случае вид уравнения регрессии должен быть заменен на другой с повторением всей процедуры нового МНК. Образуется “многошаговый” МНК. На этом основан “метод перебора функций “, продолжающийся до получения значимого критерия
и далее – до максимума
.
Вместе с тем анализ будет усилен, если вместо
и
использовать их корректирующие коэффициенты, применяемые в том случае, когда соотношение числа степеней свободы
и числа факторов т меньше своего порогового значения
. Тогда имеем
; (33.а)
. (33.6)
Подставив (33.а) в (30) и (33.6) в (7), получим
и
. Если теперь окажется, что
, то уже есть полное основание считать, что замена линейной регрессии на криволинейную была эффективной.
12.5.6. Статистическая значимость коэффициентов регрессии
Выяснив вопрос об адекватности уравнения регрессии, надо определить далее значимость (достоверность) его коэффициентов, которая проверяется по t-критерию Стьюдента путем расчета его фактических значений
как модульных отношений оцениваемых показателей
, к их несмещенным ошибкам
:
, (34)
где:
– скорректированная остаточная дисперсия (квадратическая ошибка регрессии);
– диагональный элемент обратной матрицы
в СНУ.
Если
, то коэффициент
считается статистически значимым с уровнем значимости
и степенями свободы
, а если
– то статистически незначимым.
Незначимость коэффициента
означает необходимость исключения из уравнения регрессии фактора
, или замены его на другой, ранее не рассматриваемый. Если незначимых коэффициентов несколько, то в первую очередь исключается тот, который имеет минимальный долевой вклад
или минимальный средний ранг
по разным показателям факторной эффективности. Исключение фактора сказывается на коэффициентах
и F. Если они от этого увеличились, то отсев факторов был эффективен, а если не увеличились, то неэффективен.
Процедура исключения-включения факторов продолжается в многошаговом МНК до тех пор, пока все
, не будут значимыми. Это не всегда возможно. Тогда надо менять исходные условия: снизить уровень значимости
; уменьшить число факторов т; увеличить число наблюдений п.
Если ни одно из этих условий или их комплекс не дает нужных результатов, то следует отказаться от данного вида регрессии и перейти к другому ее виду, который допускает значимость своих коэффициентов при существующих условиях.
12.5.7. Условный пример регрессионного анализа
По исходным данным табл. 12.2 об объеме розничного товарооборота у (условные денежные единицы), численности работников
(тыс. человек) и размере торговой площади
(100 кв. м) в пяти магазинах проведем регрессионный анализ с помощью линейного МНК. Необходимые для двухфакторной модели подготовительные расчеты проведены в табл. 12.9.
Таблица 12.9
§
| Магазины к | Исходные данные | Расчетные операции | ||||||
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | |
| 3,1 | 0,2 | 0,1 | 0,04 | 0,02 | 0,62 | 0,01 | 0,31 | |
| 3,1 | 0,1 | 0,1 | 0,01 | 0,01 | 0,31 | 0,01 | 0,31 | |
| 5,0 | 0,4 | 1,0 | 0,16 | 0,40 | 2,00 | 1,00 | 5,00 | |
| 4,4 | 0,2 | 0,2 | 0,04 | 0,04 | 0,88 | 0,04 | 0,88 | |
| 4,4 | 0,1 | 0,6 | 0,01 | 0,06 | 0,44 | 0,36 | 2,64 | |
| Итого | 20,0 | 1,0 | 2,0 | 0,26 | 0,53 | 4,25 | 1,42 | 9,14 |
По итоговой строке предварительно рассчитываем средние величины:
;
;
средние квадратические отклонения:
;
; 
и коэффициенты вариации:
.
Согласно (19), образуется СНУ:
.
Решение СНУ с помощью метода обратной матрицы по (21) дает коэффициенты уравнения регрессии:
.
Нестандартизованное (натуральное) уравнение линейной регрессии имеет вид:
.
Коэффициенты этого уравнения показывают, что при изменении фактора
на 1 тыс. человек или фактора
на 100 кв. м товарооборот у изменится в среднем соответственно на
и
условных денежных единиц, а при нулевых значениях
и
составит в среднем
условных денежных единиц.
Хотя
, нельзя говорить, что фактор
сильнее воздействует на у, чем
, так как оба они – разноизмеряемые. Для их сопоставления надо построить стандартизованное (нормированное) уравнение регрессии (28)
.
Если каждый фактор изменится на одно свое нормированное отклонение
и
при неизменности другого фактора, то товарооборот у изменится соответственно на
и
своего нормированного отклонения
. Так как все
– безразличные величины и
, то фактор
сильнее воздействует на у, чем
а именно в
раза.
Другие факторные показатели (29) рассчитаны в табл. 12.10. При этом используются парные коэффициенты корреляции
, полученные ранее в табл. 12.2 раздела 12.2.
Таблица 12. 10
§
| Фактор i | Исходные показатели | Расчетные показатели (при ; ) | ||||||||
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | |
![]() | 0,2 | 0,109 | 54,5 | 0,595 | 0,341 | 0,048 | 0,017 | 0,009 | 0,029 | 0,041 |
![]() | 0,4 | 0,352 | 0,844 | 1,763 | 0,809 | 0,176 | 0,155 | 0,683 | 0,959 | |
| Итого | – | – | – | – | – | – | – | – | 0,712 | 1,000 |
Коэффициенты эластичности показывают, что с изменением
или
на 1% при неизменности другого фактора товарооборот у изменится в среднем соответственно на
и
условных денежных единиц.
Если же фактор
или
изменится не на 1%, а на все
своей полной вариации при неизменности другого фактора, то товарооборот у изменится соответственно на
и
.
Коэффициенты раздельной детерминации d показывают, что вариация товарооборота у обусловлена линейной связью с каждым фактором
или
соответственно на
(на 2,9%) и на
(на 68,3%).
Долевой вклад первого фактора
в совокупное факторное воздействие на вариацию переменной у, т. е. в совокупный коэффициент линейной детерминации
, составляет величину
(4,1%), а вклад второго фактора
– величину
(95,9%). Дальнейший анализ продолжен в табл. 12.11.
Таблица 12.11
§
| № п/п | ![]() | ![]() | ![]() | ![]() | ![]() |
| 3,1 | 3,4705 | 0,8100 | 0,2804 | 0,1373 | |
| 3,1 | 3,4364 | 0,8100 | 0,3176 | 0,1132 | |
| 5,0 | 5,1254 | 1,0000 | 1,2665 | 0,0157 | |
| 4,4 | 3,6468 | 0,1600 | 0,1248 | 0,5673 | |
| 4,4 | 4,3179 | 0,1600 | 0,1011 | 0,0067 | |
| Итого | – | – | 2,9400 | 2,0904 | 0,8402 |
Расчетные значения
получены путем подстановки в уравнение регрессии факторных данных по наблюдению к. Например, для первого наблюдения при
и
имеем
.
Теоретические коэффициенты множественной детерминации и корреляции (31) равны:
.
Коэффициент
практически совпал по всем трем методам своего расчета – по методу коэффициентов корреляции (3), по методу коэффициентов раздельной детерминации (29) и по методу теоретического коэффициента детерминации (32), отличаясь численно по ним за счет округлений лишь третьей цифрой после запятой: соответственно 0,713, 0,712 и 0,711.
Полученный коэффициент
показывает, что 71,1% всей вариации товарооборота y объясняется ее линейной зависимостью от изменения факторов
и
, а оставшиеся 28,9 % приходятся на долю других (не рассматриваемых) факторов или же обусловлены криволинейной связью y со своими факторами.
Коэффициент множественной корреляции
свидетельствует о наличии прямолинейной зависимости вариации у с совокупной вариацией факторов
и
, которая оценивается по шкале Чеддока как “высокая”.
Для проверки значимости уравнения регрессии с помощью коэффициента
следует сначала установить, какое его значение надо использовать – исходное (теоретическое) или же скорректированное.
Так как
, то надо брать скорректированный коэффициент. Тогда по (33.6) и (7) получим:
.
При уровне значимости
и имеющихся степенях свободы
и
находим
. Так как
, то уравнение регрессии является статистически незначимым и связь между признаками подлежит замене на криволинейную.
Для проверки значимости коэффициентов уравнения регрессии находим
при
и
. Фактические значения этого критерия с учетом найденных диагональных элементов обратной матрицы и согласно (33) равны:

.
Так как
больше, a
и
меньше
, то коэффициент
– значим, а коэффициенты
и
– незначимы. Незначимые факторные коэффициенты указывают на возможность отсева из уравнения регрессии соответствующих факторов. Очередность отсева целесообразно установить по значению
, т.е. первым должен отсеиваться фактор
как имеющий минимальный вклад в совокупный коэффициент детерминации
. Отсевом факторов заниматься не будем. Критерием правильности отсевов должен служить рост критерия
.
Аналогичным образом проводится регрессионный анализ для криволинейных уравнений регрессий с той лишь разницей, что в таком случае в основе будет находиться не СНУ, а система дифференциальных уравнений, которая по учебной программе не предусмотрена.
Контрольные вопросы
(выберите правильный ответ)
1. Корреляционная связь – это:
а) качественно-содержательная взаимосвязь статистических показателей;
б) функциональная зависимость переменных величин;
в) строгое соответствие вариаций переменных величин;
г) изменение переменных y в среднем при изменениях переменной
в пределах своих законов распределения;
д) вероятностное изменение закона распределения переменной y с изменением законов распределения переменных
.
2. Главная целевая задача регрессионного анализа – это:
а) измерение тесноты связи между вариациями переменных;
б) установление направления вариаций переменных;
в) определение вида математической функции, описывающей зависимость средней величины переменной y от допустимых изменений факторных переменных
;
г) расчет коэффициентов уравнения регрессии по методу наименьших квадратов;
д) оценка статистической адекватности (достоверности) уравнения регрессии по исходным данным результативного (функционального) показателя y.
3. У двух из трех предприятий совпали знаки в отклонениях переменных величин х и у, а у третьего – не совпали. Рассчитать коэффициент знаков Фехнера и указать ответ для
:
а) -1; б) -0,5; в) -0,33; г) 0,33; д) 0,5; е) 1.
4. Имеются абстрактные данные по двум переменным в двух наблюдениях:
;
;
;
. Рассчитать парный коэффициент корреляции Пирсона и указать один ответ для
:
а) -1; б) -0,5; в) 0; г) 0,5; д) 1.
5. Указать допустимое значение для совокупного коэффициента линейной детерминации
:
а) -2; б) -1; в) -0,5; г) 0; д) 0,5; е) 1; ж) 2.
6. Приняв исходные данные в тесте 4 за ранги переменных
и
, рассчитать ранговый коэффициент Спирмена и указать один ответ для
:
а) -2; б) -1; в) -0,5; г) 0; д) 0,5; е) 1; ж) 2.
7. Приняв исходные данные в тесте 4 за значения четырехклеточной табл. 1. с распределением 6 единиц по двум альтернативным признакам x (строки) и y (столбцы), рассчитать коэффициент ассоциации Юла и указать один ответ для
:
а) -1; б) -0,5; в) -0,6; г) 0; д) 0,5; е) 0,6; ж) 1.
Таблица 1
8. Коэффициенты взаимной сопряженности Пирсона и Чупрова – это корреляции между:
а) двумя количественными признаками х и у;
б) двумя качественными признаками х и у, имеющими несколько своих состояний;
в) двумя альтернативными признаками х и y с двумя противоположными своими значениями (состояниями);
г) одним количественным и одним качественным (альтернативным) признаками;
д) безразлично какими по своему характеру признаками х и у.
9. Определить коэффициенты
и
в парной регрессии
, если известна система нормальных уравнений:

10. Коэффициент
в парной регрессии
– это:
а) эмпирическая мера тесноты связи переменных х и у;
б) эластичность переменной х;
в) вклад фактора x в парный коэффициент детерминации
;

г) показатель среднего изменения переменной y от изменения переменной х на одну свою единицу измерения;
д) соотношение темпов роста переменных y и х.
11. Если коэффициенты
,
,
в двухфакторной регрессии
определены по методу наименьших квадратов двумя путями – без группировки и с группировкой исходных данных, то:
а) их значения не зависят от метода расчета;
б) “без группировки” они больше, чем “с группировкой”;
в) “без группировки” они меньше, чем “с группировкой”;
г) не равны, и соотношения могут быть любыми.
12. Если в двухфакторной линейной регрессии
вариация переменной y определяется на 81% совокупным воздействием переменных
и
, то чему будет равен совокупный коэффициент линейной корреляции R:
а) ±0,19; б) ±0,14; в) ±0,9; г) -0,9; д) 0; е) ±1.
13. Статистическая значимость парных коэффициентов корреляции в случае малой выборки
при нормальности их распределения оценивается с помощью:
а) нормального закона распределения Гаусса;
б) t-распределения Стьюдента;
в) F-распределения Фишера-Снедекора;
г) Z-распределения Фишера;
д)
– распределения Пирсона.
14. Исходя из перечня критериев в тесте 13, определить, какой из них применяется для оценки статистической значимости коэффициентов уравнения регрессии.
15. Исходя из перечня критериев в тесте 13, определить, какой из них применяется для оценки статистической значимости совокупного коэффициента множественной детерминации.
16. Исходя из перечня критериев в тесте 13, определить, какой из них применяется для оценки значимости коэффициентов взаимной сопряженности Пирсона и Чупрова.
17. Исходя их перечня критериев в тесте 13, определить, какой из них применяется для оценки значимости парных и чистых (частных) коэффициентов корреляции Пирсона, если они распределены не по нормальному закону.
18. Исходя из перечня критериев в тесте 13, определить, какой из них применяется для оценки адекватности уравнения регрессии.
19. Для нестандартизованного уравнения регрессии
, где
– численность работников,
– банковская прибыль, определить, какой фактор сильнее влияет нa y, выбрав правильный ответ:
а) фактор
;
б) фактор
;
в) одинаково;
г) нельзя сравнивать.
20. Для стандартизованного уравнения регрессии
определить аналогичный тесту 19 правильный ответ.
21. В результате обработки
наблюдений получено криволинейное уравнение регрессии
и определено, что общая, факторная и остаточная дисперсии равны соответственно
. Рассчитать теоретический коэффициент детерминации, фактический
– критерий Фишера-Снедекора. Сравнить
с
при уровне значимости
и степенях свободы
и
и установить, что уравнение регрессии:
а) статистически значимо (адекватное);
б) статистически незначимо (неадекватное).
Список литературы
§
Основной
1. Гусаров В. М. Теория статистики: Учеб. пособие для вузов. М: Аудит, ЮНИТИ, 1998.
2. Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник, / Под ред. И. И. Елисеевой. М. :Финансы и статистика, 1995.
3. Ефимова М. Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики: Учебник. / М.: Инфра – М, 1998.
4. Ряузов Н. Н. Общая теория статистики: Учебник. М: Финансы и статистика, 1984.
5. Статистика: Курс лекций. Харченко Л. П. и др. / Под ред. В. Г. Ионина. Новосибирск: Изд-во НГАЭиУ; М.: Инфра – М, 1997.
6. Статистика: национальные счета, показатели и методы анализа: Справочное пособие / Под ред. И. Е. Теслюка. Минск: БГЭУ, 1995.
7. Теория статистики: Учебник / Под ред. Р. А. Шмойловой. 2-е изд., доп. и перераб. М.: Финансы и статистика, 1998.
8. Экономическая статистика: Учебник / Под ред. Ю. Н. Иванова. М.: Инфра – М, 1998.
9. Практикум по теории статистики: Учеб. пособие /Под ред. Р. А. Шмойловой. М.: Финансы и статистика, 1998.
10. Сборник задач по общей теории статистики: Учеб. пособие / Под ред. Л. И. Савченко. Рос. экон. акад. М., 1992.
11. Назарова М. Г. Учебник по социально-экономической статистике. М.: Финстатинформ, 1998.
12. Сиденко М. В., Матвеева В. М. Учебник по социально-экономической статистике. М.: Финстатинформ, 1998.
13. Симчера В. М. Практикум по теории статистики. М: Финстатинформ, 1999.
14. Боровиков В. П., Ивченко Г. И. Прогнозирование в системе statistica в среде Windows: Учеб. пособие М.: Финансы и статистика, 1998.
15. Макарова Н. В. Статистика в Excel: Учеб. пособие М.: Финансы и статистика, 1998.
16. Ляшенко В. И. Фондовые индексы и рейтинги: Учеб. пособие. М.: Сталкер, 1998.
17. Айвазян С. А., Енюк6в И. С, Мешалкин Л. Д. Прикладная статистика. М.: Финансы и статистика, 1983.
18. Алгоритмы и программы восстановления зависимостей / Вапник В. Н., Глазкова Т. Г., Кощеев В. А., Михальский А. И., Червоненкис А. Я. М.: Наука, 1984.
19. Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и формулы в экономическом анализе: Справочник. М.: Статистика, 1979.
20. Вентцель Е. С. Теория вероятностей. М.: Наука, 1969.
21. Глазкова Т. Г. Оценка информации в классификации и прогнозировании. Учеб. пособие. М.: ГКРФ ВО, Рос. экон. акад., 1997.
22. Глинский В. В., Ионин В. Г. Статистический анализ: Учеб. пособие. М.: Информационно-издательский дом “Филинъ”, 1998.
23. Громыко Г. Л. Статистика. М.: Изд-во МГУ, 1981.
24. Додж М., Кината К., Стинсон К., The Cobb Group. Эффективная работа с Excel 7.0 для Windows 95: Пер. с англ. – СПб.: Питер, 1997.
25. Дубов А. М., Мхитарян В. С, Трошин Л. И. Многомерные статистические методы. М.: Финансы и статистика, 1998.
26. Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учеб. для вузов. М.: Финансы и статистика, 1995.
27. Зайцев Г. Н. Математическая статистика. М.: Наука, 1984.
28. Кокрен У. Методы выборочного исследования. М.: Статистика, 1976.
29. Математическая статистика. / Иванова В. М., Калинина В. Н., Нешумова Л А. и др. М.: Высшая школа, 1975.
30. Методологические положения по статистике. Выпуск 1. М.: Госкомстат России, 1996.
31. Национальное счетоводство: Учебник / Под ред. Г. Д. Кулагиной. М.: Финансы и статистика, 1997.
32. Новиков М. М., Теслюк И. Е. Макроэкономическая статистика. Минск: БГЭУ, 1996.
33. Общая теория статистики / Кильдишев Г. С, Овсиенко В. Е., Рабинович Т. Е., Рябушкин Т. В. М.: Статистика, 1980.
34. Общая теория статистики: Статистическая методология в коммерческой деятельности: Учеб. для вузов / Под ред. Спирина А. С, Башиной О.Е. М.: Финансы и статистика, 1994.
35. Статистика. Статистический контроль качества. М.: Мир,
1970.
36. Тюрин Ю. Н.; Макаров А. А. Статистический анализ данных на компьютере. М.: Инфра – М, 1998.










и 
и 


















; 














