Пайсано (hroniki_paisano) wrote,
Пайсано
hroniki_paisano

Categories:

Econometrics

Наша школа в этом сезоне вновь строит планы по массированному найму, и я вновь прочитал массу пакетов и job market papers. Мои коллеги снова предложили мне поломать голову над статьями со сложной эконометрикой и решить, кто достоин, а кто нет. Я ломал и решал, и имею наконец заявить.
Прочитав за все эти годы не одну сотню эконометрических статей, я пришел к печальному выводу, что занятия эконометрикой идут их авторам в основном во вред. Люди, которых тянет на серьезную эконометрику, как правило склонны игнорировать то, что интересно экономистам, и уделять массу внимания тому, что неинтересно никому, кроме них самих.
Простые бесхитростные ребята, пытающиеся препарировать гигабайты данных сортировкой по одной-двум переменным и линейными регрессиями, в большинстве своем все же выполняют главную заповедь эмпирика: в их результатах можно ткнуть в любое число в любой таблице, попросить его экономическую интерпретацию и оную получить, если не из текста статьи, то хотя бы из уст автора на семинаре.
Но есть на свете люди, которых справедливо не устраивает линейная регрессия, и они желают прогнать нелинейную, а то и вовсе непараметрику. И где-то в этот момент в голове подавляющего большинства происходит тектонический сдвиг.
Сами по себе коэффициенты нелинейных и непараметрических регрессий ничего не говорят. Их невозможно интерпретировать экономически с первого взгляда, потому что производная нелинейной функции, в отличие от производной линейной функции, имеет свойство меняться, не всегда считается вот прямо так в уме и в нее в результате надо что-то подставлять, а хорошо бы знать, что.
Но людей, которые оценивают нелинейные регрессии, это, как правило, не интересует. Даже в статистических пакетах нет встроенной процедуры, которая превращает коэффициенты банального пробита в экономически осмысленные величины. А если бы она и была, вряд ли много кто догадался бы ей воспользоваться. Люди исписывают страницу за страницой рассказами про то, что их метод дает лучшую точность прогноза и больший эр-квадрат, что их оценки несмещенные и эффективные, и никому не приходит в голову, что эти оценки ничего ни для кого не значат, потому что по цифрам в таблицах завзятых эконометристов нельзя определить экономическую величину измеряемого эффекта даже с точностью до двух порядков.
Даже такая фундаментальная вещь, как сами данные, вызывают у эмпирика и эконометриста разные стремления. Эмпирик при виде новых интересных данных хочет понять, что в них происходит с точки зрения экономики. Эконометрист думает о том, какой бы новый и сложный метод к этим данным применить. В результате такого желания забить молотком все, что похоже на гвоздь, возникают статьи, в которых десятилетний интервал порезан на пятиминутные отрезки, к получившемуся огромному временному ряду применен какой-нибудь метод типа фильтра Кальмана или модели с переключением режимов, а в результате автор пытается ответить на вопрос, как рецессия влияет на что-то там. Тогда как на десятилетнем отрезке, как его ни порежь, рецессия обычно бывает только одна, и любая модель влияния рецессии на что угодно будет представлять собой в этом случае оценку по одной точке.
Модели с переключением режимов – это отдельная песня и отдельные слезы. Обычно из них и нетривиальная асимптотика выходит, милая эконометрическому сердцу, и коэффициенты легко интерпретируются экономически на радость эмпирикам, хоть и без помощи забившего на это автора. Но рано или поздно доходит до вопроса: а что же представляют собой эти два или три режима, при введении которых все получается не так, как с одним режимом. Представляют ли они собой экономический подъем и спад? Скачки в волатильности? Бычий и медвежий рынок?
И тут тот же человек, который мучался сам с нестандартной асипмтотикой и мучал ей других, достает два графика без стандартных ошибкок и один тест на равенство средних. Это, как правило, все, что он имеет заявить в ответ на центральный вопрос, зачем понадобились два режима и что они символизируют. И беда опять же в том, что человек не сознает это как основной вопрос. Он поиграл со сложным методом оценивания, у него выросла точность прогноза вне выборки, и ладушки.
Подобная картина, разумеется, характерна не только для моделей с переключением режимов. Масса статей атакует какой-нибудь простой эмпирический результат и заявляет примерно следующее: «поскольку переменная Х вот такая (следует математический термин, напоминающий непосвященному ругательство на экзотическом языке), в тестах с ее использованием надлежит делать то-то, и тогда изменятся результаты».
Если исходный результат интересен, аудитория или читатель замирают в ожидании, что далее будет дана адекватная экономическая интерпретация тому слову, которым обругали Х, и в результате мы узнаем кое-что новое об экономике и экономической сути результата, который изменился от применения нового метода оценивания.
Но этого почти никогда не происходит. Автор, как правило, удовлетворяется самим фактом того, что результат изменился, не отдавая себе отчета в том, что без экономической интерпретации произошедшего смысла в его упражнении не больше, чем в демонстрации неустойчивости этого самого результата к выкидыванию из выборки одного года. И ужас ситуации в том, что первое упражнение (оценка новым нестандартным методом) могут проделать какие-то сто человек во всем мире, порой затратив на это не одну неделю, а второе упражнение (выкидывание года из выборки) может за пару минут произвести любой бакалавр, оборудованный Экселем. А результат недельного труда умнейшего человека и минутного труда простого балбеса получается по сути один и тот же.
Tags: профессорское
Subscribe
  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 61 comments