⁉️ Где искать вопросы экономики?
ИИ удешевил код, написание текстов и даже рецензирование. Теперь узким местом становится не реализация, а выбор темы. Нам проще, чем раньше довести идею до статьи, но тяжелее придумать саму идею так, чтобы она была новой, осмысленной и вписанной в огромную литературу ( http://doi.org/10.1257/aer.20180338 https://doi.org/10.1111/j.1467-937X.2008.00531.x)
↔️ У меня есть рисунок карты!
Проект https://frontiergraph.com/ предлагает построить карту экономической литературы и искать в ней «дыры» – связи между понятиями, которые никто прямо не исследовал, хотя косвенные связи уже есть ( https://frontiergraph.com/paper/)
Прашант Гарг, о котором мы уже писали
https://t.me/causal_channel и
https://t.me/causal_channel собрал более 240 тыс. статей из ведущих экономических и смежных журналов за последние 50 лет. Для каждой статьи он извлек ключевые понятия (например, «госдолг», «инвестиции», «выбросы CO2») и отношения между ними: где авторы прямо говорят о влиянии одного на другое, а где просто ставят их рядом в одном аргументе. Так для каждой статьи получается маленький граф. Потом все эти графы «сшиваются» в один большой
На этом графе «вакантный вопрос» – это отсутствующая связь между двумя понятиями, которые уже соединены цепочкой других работ
🟤Например, есть связи госдолг → госинвестиции и госинвестиции → выбросы CO2, но нет прямой связи госдолга и выбросов
🟤Значит, естественный следующий вопрос – есть ли прямой эффект долга на выбросы, а не только через инвестиции
↔️ Как ранжировать вопросы?
Потенциальных связей очень много, поэтому их нужно сравнивать. Модель смотрит на пару понятий и оценивает:
🟤сколько уже есть коротких путей между ними
🟤насколько отсутствие прямой связи выглядит странно на этом фоне
🟤повторяется ли эта пара в разных исследованиях
🟤не являются ли оба понятия слишком общими хабами вроде «экономический рост»
Из этого получается балл: чем он выше, тем естественнее выглядит следующий вопрос по структуре литературы
Дальше автор фиксирует год и строит граф только по уже опубликованным статьям к этому году, ранжирует все пропущенные связи, а затем смотрит, какие из них действительно появляются в статьях через 3, 5, 10 и 15 лет. Это позволяет оценить, насколько хорошо модель угадывает то, чем литература реально займётся позже
Главная альтернатива подхода – просто смотреть на популярность. Если тема уже стала «звездой» и про неё много пишут, можно ожидать, что новые статьи тоже будут про неё и её связки с другими популярными темами
↔️ Что получилось?
🟤На коротком списке, если вы хотите выбрать несколько самых вероятных будущих связей, правило популярности выигрывает. Литература сильно тяготеет к уже раскрученным темам
🟤Но в реальной жизни исследователю нужен не один‑два вопроса, а длинный список направлений для обсуждения и раздела «будущие исследования». Как только список расширяется, преимущество популярности почти исчезает. На длинных списках модель, использующая структуру графа, даёт сопоставимое, а иногда и чуть лучшее попадание в будущие работы
Эффект зависит от области:
🟤в междисциплинарных исследованиях графовый подход особенно полезен
🟤в каузальных постановках граф помогает заметно больше, чем для панелей или оценок на временных рядах
🟤здравоохранение, качество жизни, рынок труда, неравенство, банки, жильё, макро – выигрывают от такого скрининга больше среднего
↔️ Механизм поиска механизмов
Литература чаще сначала находит прямую связь, а затем обрастает работами про механизмы и медиаторы. То есть мы, как сообщество, чаще сначала говорим «есть эффект», а потом уже детализируем, как именно он работает
↔️ Как этим пользоваться?
На https://frontiergraph.com/ можно ввести интересующую тему и
🟤увидеть, какие понятия с ней уже связаны и какие связи исследованы
🟤посмотреть «вакантные вопросы»
🟤раскрыть, какие статьи и цепочки аргументов стоят за каждой подсказкой
Конечно, это не панацея и не мера важности темы для общества. Это инструмент скрининга, который помогает не повторять уже сделанное, выбирать между «игрой в популярные темы» и походом в недоразработанные. Такой инструмент очень полезен: он облегчает работу исследователя и дает ориентиры, но не всесилен
#канал_обозревает
https://t.me/causal_channel