На полную мощность: Какая загрузка мощностей не ускоряет инфляцию?

Недавно стал свидетелем обсуждения уровня загрузки производственных мощностей, который можно считать соответствующим естественному уровню выпуска. Коллеги сошлись на оценке в 70-75, но предлагаю порассуждать здесь немного вслух.

Как оценивать?
В первом приближении, возможно предложить два подхода к оценке “естественного” уровня загрузки мощностей в производстве:
1) если есть в распоряжении ряд оценок естественного уровня выпуска или разрыва выпуска, то можно проверить, не является ли разрыв выпуска коинтегрированным с загрузкой мощностей. Если да, то мы сможем оценить уровень загрузки, соответствующий нулевому разрыву выпуска.
2) по аналогии с оценкой естественного уровня безработицы в [1] оценить зависимость между приростом базовой инфляции и загрузкой мощностей:

и тогда нормальный уровень загрузки соответствует нулевому приросту инфляции:

Насколько я понимаю, именно второй вариант предлагается в [2].

Данные и оценки
Дынникова и ее соавтор предлагают совершенно восхитительный обзор источников данных об индикаторах загрузки в промышленности. К сожалению, в данный момент у меня нет ни данных РЭБ, ни института Гайдара, только Росстата, который стал предоставлять их с 2006 года (в [2] используются данные до 2004 г.).

Все три ряда (РЭБ, института Гайдара и Росстата) в общем-то несравнимы, так что любая оценка нормального уровня загрузки должна квалифицироваться пояснением источника данных о загрузке мощностей. Так в [2] авторы получают оценки от 57% до 75% в зависимости от источника.

Итак, в качестве зависимой переменной используем очищенные от сезонности приросты (X12) базовой инфляции, независимой – уровень загрузки мощностей в обрабатывающей промышленности.

Синей линией показана оценка устойчивой к выбросам OLS, красной – OLS:

В обоих случаях оценки коэффициентов не значимы, как впрочем и в [2], но позволяют оценить уровень не ускоряющей инфляцию загрузки мощностей в 61.5-62%.

Так, чтобы добавить контекста нашей оценке, взглянем на исторический ряд загрузки производственных мощностей в обрабатывающей промышленности. Ниже красным показаны периоды, когда загрузка была ниже нашей оценки, синим – выше:

Источники:
1. Douglas Staiger, James H. Stock, Mark W. Watson, The NAIRU, Unemployment and Monetary Policy (pdf)
2. Nienke Oomes and Oksana Dynnikova, The Utilization-Adjusted Output Gap: Is the Russian Economy Overheating? (pdf)

На полную мощность: Какая загрузка мощностей не ускоряет инфляцию?

Регрессионная кулинария

Одна из распространенных проблем с регрессией в том, что данные обычно содержат выбросы – редкие наблюдения, которые делают оценки коэффициентов смещенными. Скажем, если мы пытаемся использовать характеристики отдельных людей, то неожиданым может считаться возраст 2000 лет, наличие  180 детей и пол “пенсионер”.
Обычно, такие выбросы нужно внимательно осмотреть и убедиться в том, что они результат ошибки заполения и не являются характерными для нашей целевой группы.
Как найти выбросы, если мы не полагаемся на собственную способность увидеть их? Можем найти отдельные наблюдения, которые сильно влияют на оценки коэффициентов модели, рассчитав расстояние Кука. Это расстояние рассчитывается для каждого наблюдения следующим образом:
Не буду здесь расписывать переменные – они есть в статье. Главное, что расстояние для наблюдения i – это сумма разниц между оценками всех наблюдений с помощью регрессии, построенной на всем наборе наблюдений, и регрессии, построенной без наблюдения i.
Для примера возьмем данные из [1] по весу людей, страдающих анорексией, до и после лечения:
Оценим линейную модель LinearModelFit[]:
Мы теперь хотели бы определить, какие из наблюдений имеют большое расстояние Кука и являются выбросами. Используем правило [2], согласно которому выбросами являются наблюдения с 
Здесь показаны расстояния для каждого наблюдения – mod[“CookDistances”], красная линия на уровне 4/n:
Найдем четыре наблюдения, которые, как кажется, выбиваются из общего ряда:
clean = Extract[anarox, 
   Position[mod[“CookDistances”], x_ /; x < 4/Length[anarox]]];
И построим новую модель на очищенных данных:
Здесь синей линией показана новая модель, красные точки – удаленные наблюдения.
Наконец мы можем собрать все вместе и получить функцию, которая самостоятельно  избавится от выбросов и вернет построенную на очищенных данных модель:

cookedReg[l_List] := Module[{x, vars, cooks, clean},
  vars = Table[Subscript[x, i], {i, Length[First[l]] – 1}];
  cooks = LinearModelFit[l, vars, vars][“CookDistances”];
  clean = Extract[l, Position[cooks, x_ /; x < 4/Length[l]]];
  LinearModelFit[clean, vars, vars]
  ]


1.   A. Agresti, B. Finlay, “STATISTICAL METHODS FOR THE SOCIAL SCIENCES”, Prentice Hall, 4th edition, 2008

2. Bollen, Kenneth A.; and Jackman, Robert W. (1990); Regression diagnostics: An expository treatment of outliers and influential cases, in Fox, John; and Long, J. Scott (eds.); Modern Methods of Data Analysis (pp. 257-91). Newbury Park, CA: Sage

Регрессионная кулинария