доказательный ⎵ пробел

Public

Просмотреть канал

Не можете присоединиться? @evidencespace

1.3k Участники

Обновлено: May 16, 2026 at 11:02 PM

доказательный ⎵ пробел

Про causal inference, данные для исследований и принятие решений на основе данных. Чат: @evidence_chat

Follow @evidencespace to stay updated with the latest inference and evidence_chat trends and news

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Сегодня)

Всего: 1.3K

Последние посты

доказательный ⎵ пробел

20 мая 2026 г., 18:36

https://perforum.io/jobs/4816

Хорошая вакансия для тех, кто интересуется современной макрой и количественными методами:

🟤 Разработка и поддержание эконометрических моделей временных рядов (ARIMA, VAR) и структурных моделей (DSGE, QPM)
🟤 Подготовка аналитических отчетов и презентаций для внутреннего использования руководством банка
🟤 Проведение глубокого анализа макроэкономических данных и формирование прогнозов
🟤 Постоянное изучение новых методов и подходов для повышения точности прогнозов и анализа

914

доказательный ⎵ пробел

20 мая 2026 г., 18:36

Помните, мы с вами https://t.me/causal_channel, куда движется причинно-следственный вывод?

📆 Save the date: 27.03.2026 в рамках семинара Chemberlain собирается очень крутая панельная дискуссия поразмышлять о будущем эконометрики - надеемся, что будущего causal inference участники тоже коснутся!

Лайнап и по людям, и по темам и правда исключительный! Это редкий случай, когда в одной дискуссии встречаются люди, формирующие сразу несколько направлений эконометрики:
📎 https://gsb-faculty.stanford.edu/susan-athey/?utm_source=athey.people.stanford.edu&utm_medium=cpanel-redirect&utm_campaign=legacy-drupal7 и https://eml.berkeley.edu/~pkline/ - одни из главных движков современного causal inference и структурных моделей
📎 https://dell-research-harvard.github.io/ занимается исследованиями на стыке глубокого обучения и причинного анализа
📎 https://users.ssc.wisc.edu/~behansen/ - живой классик эконометрики
📎 https://econ.columbia.edu/econpeople/serena-ng/ и https://web.sas.upenn.edu/schorf/ отвечают за макро- и байесовское направление
📎А модераторы - https://about.peterhull.net/, https://www.mikkelpm.com/ и https://sites.google.com/site/wuethricheconomics/ - сами активно занимаются методологией эконометрики

753

доказательный ⎵ пробел

20 мая 2026 г., 18:36

📷 Photo

Открытый https://paulgp.substack.com/p/getting-started-with-claude-code от https://paulgp.com/ по практической имплементации Claude Code для эконометристов и исследователей со всеми pros и cons.

К примеру, такие причины использовать AI Пол отмечает в своей лекции:

1. Делать больше и быстрее: расстояние от исследовательской идеи до результата значительно сокращается, но важно понимать, что сырые идеи AI не всегда убедительны; в то же время очистка данных, их парсинг и преобразование сильно ускоряются.

2. Важно в принципе понимать, что это возможно: даже если вы не используете эти инструменты, необходимо понимать их возможности; нужно различать, что AI действительно умеет делать, а что ему приписывают (например, в статье и комментариях к ней обсуждаются варианты деградации результатов AI при росте объема входящей информации).

1,000

доказательный ⎵ пробел

20 мая 2026 г., 18:36

📷 Photo

😱 Синтетический подгон?

Вокруг метода синтетического контроля (synthetic control, SC) бытует скепсис: его гибкость и чувствительность к спецификации создают у исследователя заметные степени свободы, которые могут превратить метод в инструмент подгонки под нужный результат

Опираясь на материалы Николаса Декера https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic, мы хотим развенчать эти мифы

SC строится на идее, что ненаблюдаемый потенциальный исход без воздействия можно аппроксимировать выпуклой комбинацией доноров, подобранной так, чтобы воспроизвести динамику исхода до интервенции ( http://doi.org/10.3386/w12831)

Для такой конструкции важны стандартные допущения: корректно заданный набор доноров, отсутствие взаимного влияния между юнитами и достаточная претритмент-панель ( http://doi.org/10.3386/w12831; http://doi.org/10.1257/aer.20190159)

🔠 Хорошая подгонка до воздействия необходима, но сама по себе не доказывает идентификацию эффекта; плохая подгонка, в свою очередь, делает причинную интерпретацию сомнительной

🔠 Свобода выбора пула доноров
🟤Уязвимость: при альтернативных разумных пулах можно получить разные оценки при схожем pre-fit; риск особенно высок, если часть доноров затронута spillovers ( https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic)
🟤Ответ: SC делает этот выбор явным и более прозрачным, чем неформальный подбор «похожего региона»; на практике нужны заранее обоснованный donor pool, проверка чувствительности к альтернативным пулам и leave-one-out, чтобы убедиться, что результат не определяется одним-двумя донорами ( http://doi.org/10.3386/w12831; https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic)

🔠 Неуникальность весов и вычислительная нестабильность
🟤Уязвимость: разные наборы весов могут давать почти одинаковый pre-fit, но разные посттритмент-исходы; также результат может зависеть от гиперпараметров и программной реализации ( https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic; https://as.nyu.edu/content/dam/nyu-as/cashtransferlab/documents/RPJHSC_SyntheticControl_041122.pdf)
🟤Ответ: Частичное решение – регуляризация: penalized SC стабилизирует веса, а Synthetic DID уменьшает чувствительность за счёт более устойчивой структуры ( https://doi.org/10.1080/01621459.2021.1971535; http://doi.org/10.1257/aer.20190159). В анализе следует фиксировать параметры оптимизации и сравнивать результаты с регуляризованными версиями метода

🔠 Cherry-picking предикторов и претритмент-окон
🟤Уязвимость: выбор ковариат и окон до интервенции может стать каналом спецификационного поиска и роста ошибок I рода ( https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic; https://mpra.ub.uni-muenchen.de/85138/1/MPRA_paper_85138.pdf)
🟤Ответ: это не аргумент против SC как такового, а аргумент против неформализованного применения любых методов ( https://mpra.ub.uni-muenchen.de/85138/1/MPRA_paper_85138.pdf). Нужен заранее заданный протокол, отчётность по нескольким разумным спецификациям и проверка устойчивости pre-fit по подокнам претритмента; длинный претритмент-период ограничивает, но не устраняет свободу подбора ( https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic)

🔠 Хороший pre-fit не тождественен идентификации
🟤Уязвимость: идеальная подгонка может отражать шум или временные шоки, а не эффект интервенции ( https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic; https://as.nyu.edu/content/dam/nyu-as/cashtransferlab/documents/RPJHSC_SyntheticControl_041122.pdf)
🟤Ответ: стандартные placebo-проверки (in-space, in-time и анализ post/pre MSPE) позволяют проверить, является ли наблюдаемое расхождение статистически нетипичным по сравнению с донорскими траекториями ( http://doi.org/10.3386/w12831)

🔠 Spillovers и нарушение SUTVA
🟤Уязвимость: если доноры затронуты spillovers, они перестают быть чистым контролем, и оценка смещается ( https://nicholasdecker.substack.com/p/how-much-should-we-trust-synthetic)
🟤Ответ: стоит исключать подозрительных доноров (например, соседних юнитов при сильных spillovers), и строить контроль из менее подверженных юнитов ( http://doi.org/10.3386/w12831). Кроме того, развивается литература, которая формально учитывает spillovers и расширяет область применимости метода ( https://doi.org/10.48550/arXiv.2411.01249)

В конечном счете претензии к методам нередко говорят не о самом инструменте, а о том, как им пользуются: у плохого мастера всегда инструмент виноват :)
А мы желаем вам внимательности к предпосылкам и устойчивых результатов! 👋

#канал_обозревает
https://t.me/causal_channel

доказательный ⎵ пробел

20 мая 2026 г., 18:36

⚪️⚪️⚪️Новый набор данных в нашем каталоге! Все населенные пункты России с численностью населения, национальным составом и географическими координатами

Мы опубликовали https://tochno.st/datasets/allsettlements — со всеми населенными пунктами России. Вот что внутри:

🔺155 тысяч населенных пунктов, а также муниципалитеты (первого и второго уровней) и регионы, к которым они относятся;
🔺Численность населения по итогам переписи 2021 года;
🔺Национальный состав в разбивке по 194 категориям с учетом того, что в переписи человек мог указать несколько этнических принадлежностей;
🔺Географические координаты населенных пунктов.

Хотя данные переписи о численности населения и национальной принадлежности https://tochno.st/materials/posledniaia-perepis-prosla-v-razgar-pandemii-desiatki-millionov-rossiian-mogli-ucest-po-drugim-istocnikam-obieiasniaem-na-grafikax-kak-eto-skazalos-na-kacestve-dannyx абсолютно точными, этот датасет остается важным источником для анализа. Он позволяет изучать, как население распределено в пространстве, выявлять демографические и этнокультурные особенности регионов, а также оценивать, насколько территории обеспечены социальной, транспортной и коммунальной инфраструктурой.

Если вы хотите задать вопрос про открытые данные и узнавать что-то новое о них, вступайте в наш чат открытых данных https://t.me/tochnochat.

◾️Если вам нравится, что мы делаем, — поддержите нас. Это можно сделать https://t.me/tribute и https://t.me/tribute.

доказательный ⎵ пробел

20 мая 2026 г., 18:36

📷 Photo

Чиновники обычно ругают Счетную палату, но сегодня у меня добрый пост

Чаще всего, изнутри органов власти Счетная палата воспринимается как надоедливый надзорщик, который закидывает тебя запросами, придирается к каждому термину из постановлений и законов. В последнее время мне не приходится отвечать на подобные запросы, но приходится разбираться в множестве разных сторон работы правительства. В этой части материалы Счетной палаты — кладезь полезной информации. Когда мне нужно в чем-то разобраться, я в первую очередь ищу отчеты и бюллетени. Любой вопрос, являющийся предметом контрольного мероприятия, разбирается по полочкам: кто отвечает, кто какие документы во исполнение чего принял, как и когда менял, как финансировал и так далее. В общем, советую.

Но сегодня я хотел написать даже не об этом. Помимо прочего, Счетная палата независимо и прозрачно оценивает эффективность реализации разных госполитик и открыто пишет о проблемах. Не всегда справедливо и аргументированно, но хорошие попытки есть. Сегодня я просмотрел свежий https://ach.gov.ru/statements/bulletin-sp-12-2025 о «новых инвестиционных проектах». На мой взгляд, по структуре это практически эталонный пример policy evaluation paper. В нем есть:
🔵описание механизма работы
🔵исследование осведомленности и использования мер
🔵оценка эффектов (DiD!!!)
🔵анализ кейсов применения
🔵поиск уязвимостей
🔵международный опыт и рекомендации
🔵рекомендации по изменениям

Больше всего меня, конечно, удивил количественный анализ эффектов на компании-участники проектов. Когда я сам работал с данными налоговых деклараций, меня удивляло, почему никто не применяет их для подобного анализа мер поддержки, и тут приятный сюрприз. Надеюсь коллеги будут радовать нас новыми исследованиями.

доказательный ⎵ пробел

20 мая 2026 г., 18:36

#методы #сausal #inference #учебники #публикации

⚠️ В новом выпуске журнала  «Социология: методология, методы, математическое моделирование» (Социология: 4М) опубликована статья ведущего научного сотрудника ЦенСИБ Бориса Соколова " https://www.soc4m.ru/index.php/soc4m/article/view/VCXNGL".

Эта работа посвящена моднейшей нынче теме статистического причинно-следственного вывода 😎 Точнее, одному из наиболее недооцененных, по мнению автора, её аспектов, а именно определению целевого эффекта (англ. estimand).

Если вы интересуетесь количественными методами, то наверняка слышали такие названия, как мэтчинг,  взвешивание по вероятности, инструментальные переменные, разность разностей или разрывный дизайн.

Но какие именно величины оцениваются с помощью этих методов? 🧐 И что эти величины означают содержательно? Как их можно объяснить читателям вашей статьи или заказчикам прикладного исследования - особенно в том случае, когда на основании полученных оценок будут приниматься практические решения с потенциально далеко идущими последствиями? Новая статья как раз и пытается ответить на указанные вопросы.

В частности, в ней предлагается обзор основных эстимандов, используемых в современных научных и прикладных исследованиях для операционализации каузальных запросов в терминах модели Рубина. Сначала рассматриваются наиболее популярные средние эффекты воздействия (АTE, АTT, АTC). Затем описываются их расширения, в том числе разнообразные локальные и условные эффекты воздействия; целевые величины, квантифицирующие каузальные взаимодействия и каузальную медиацию; эффекты воздействия многозначных и интервальных переменных; а также динамические причинно-следственные связи. Для каждого из этих эстимандов даëтся содержательное объяснение и приводятся примеры практических вопросов, на которые они позволяют ответить. Также обсуждаются допущения, необходимые для непараметрической идентификации ряда эффектов, и возможные методы их оценки.

👉 Соколов, Б. О. (2025). Целевые каузальные эффекты в социальных исследованиях. Социология: методология, методы, математическое моделирование (Социология:4М), (61), 7-76. https://doi.org/10.19181/4m.2025.34.2.1

доказательный ⎵ пробел

20 мая 2026 г., 18:36

🎯 Мэтчинг и обратное взвешивание по вероятности: немного теории и примеры в языке программирования R

❓Что такое мэтчинг и обратное взвешивание по вероятности? Из чего эти методы статистического причинно-следственного вывода состоят, с чем их едят и зачем они вообще нужны аналитикам данных?
Первая половина митапа будет посвящена теории, вторая - разбору практических примеров в R.

❗️В практической части мы будем использовать библиотеки https://kosukeimai.github.io/MatchIt/ и https://ngreifer.github.io/WeightIt/.

Когда? 26 декабря
Время: 18:00 по Мск
Место: Санкт-Петербург, наб. кан. Грибоедова, 123, ауд. 201 и онлайн
Спикер: Борис Соколов (ЦенСИБ НИУ ВШЭ)

Для понимания происходящего участникам желательно:

(а) нормально разбираться в азах статистики (безусловная и условная вероятность; статистическая проверка гипотез; обобщённое регрессионное моделирование; плюсом будет знание каузальной модели Рубина и направленных ациклических графов - НАГов);

(б) иметь опыт прикладного анализа данных, особенно с прицелом на каузальные вопросы;

(в) уметь работать в R (подключение библиотек; загрузка данных; построение обобщенных регрессионных моделей с помощью lm-подобного синтаксиса; понимание логики конвейеров; плюсом будет уверенное владение инструментами пакета {ggplot2} и его расширений)

https://forms.yandex.ru/u/69481ffc902902c33d8c164f

👀 В следующих постах мы подробнее расскажем о материалах, которые помогут подготовиться к встрече с мэтчингом и взвешиванием

1,090

доказательный ⎵ пробел

20 мая 2026 г., 18:36

Если вы вдруг искали https://t.me/poradata

1,530

доказательный ⎵ пробел

20 мая 2026 г., 18:36

Латентный классовый анализ

Аналитик Центра доказательной политики, один из авторов нашего канала Олег Адамович поделился своим опытом поиска скрытых классов при проведении аналитических исследований Крайнего Севера. Слово нашему коллеге.

...Когда мы спрашиваем у людей "Хотите ли вы уехать?", за простым "да" или "нет" часто скрывается сложная картина. И средние статистические показатели эту картину раскрыть не могут.

Для решения этой задачи — "разложить аудиторию по полочкам" — и был создан латентный классовый анализ (LCA). Это метод, который находит скрытые, но устойчивые группы респондентов с похожими паттернами ответов.

❓Где используют LCA?

Метод отлично зарекомендовал себя в самых разных областях, в том числе таких как:

💉 Медицина и здравоохранение. LCA выявляет подтипы течения болезни на основе набора симптомов. Например, выделяют разные типы депрессии или астмы, что позволяет назначать более персонализированное лечение.

👨‍⚕️ Психология. Исследователи идентифицируют профили психологического благополучия или устойчивости к стрессу, объединяя данные о сне, настроении и социальной активности.

💳 Потребительское поведение. Маркетологи сегментируют аудиторию не по возрасту и доходу, а по стилю потребления: "экономные семьи", "импульсивные шопперы", "клиенты, лояльные бренду".

👩‍🏫 Образование. LCA помогает обнаружить группы учеников со схожими паттернами успеваемости по разным предметам, чтобы разработать для них адресные учебные программы.

Команда Центра доказательной политики применила LCA, чтобы понять, кто и почему хочет уехать из арктических регионов. Проанализировав ответы более 10 тысяч северян, мы выделили три четких латентных класса:

➡️ "Мобильные" (74,8% хотят уехать). Это почти 3400 человек, внутренне готовых к переезду.

➡️ "Оседлые" (95,3% хотят остаться). Около 1400 респондентов, которые довольны жизнью на Севере.

➡️ "Неопределившиеся" (50/50). Самая интересная группа — примерно 2000 человек, чьи мнения разделились поровну. Их окончательный выбор может зависеть от изменений в инфраструктуре или экономике.

Такой анализ помогает двигаться от усредненных цифр к реальным человеческим портретам, а значит — и точечным мерам поддержки.

Подробный разбор метода и всех этапов исследования — в нашем материале https://habr.com/ru/articles/960088/.

https://t.me/poradata

доказательный ⎵ пробел

16 мая 2026 г., 23:02

📷 Photo

Первый хакатон по социальным данным от «Если быть точным»! Наш партнер — Европейский университет

13–15 февраля в Европейском университете в Санкт-Петербурге пройдет хакатон. Участники будут решать реальные кейсы, связанные с важными социальными вызовами: инвалидностью, онкологией, бездомностью и не только.

Заявки на участие принимаются с 1 декабря по 22 января. Мы ждем студентов и недавних выпускников, обладающих базовыми навыками анализа данных и готовых три дня погрузиться в интенсивную командную работу.

Вся информация о хакатоне находится https://scss.eusp.org/pandan/hack, а зарегистрироваться можно https://forms.yandex.ru/u/6911f5131f1eb50ea923327d/.

859

доказательный ⎵ пробел

16 мая 2026 г., 23:02

📷 Photo

🗺 По грани ходишь! Новая работа по пространственной разрывной регрессии

Boundary Discontinuity Designs (BВD) – это обобщение классической разрывной регресии (RDD), где правило назначения воздействия базируется на нескольких переменных, а порогом выступает сложная граница — кривая или линия в многомерном пространстве. Вместо разрыва в одной точке мы рассматриваем разрыв вдоль всего контура – это актуально, например, для географических границ или сложных критериев отбора

В чём ключевая проблема?
Стандартная разрывная регрессия ориентирована на одномерный порог, и это нельзя просто перенести на сложные многомерные случаи. Граница имеет сложную форму, и необходимо учитывать геометрию и локальные особенности, иначе оценки будут искажены

Летом https://t.me/causal_channel вам о работе, где Маттиас Каттанео, Росио Титиуник и Руйци Ю показали, что оценка на основе одномерного расстояния является смещенной ( https://doi.org/10.48550/arXiv.2505.05670)

Свежая ноябрьская работа ( https://doi.org/10.48550/arXiv.2511.06474) от тех же авторов стала хорошим обобщением и практическим подспорьем в идентификации эффектов при подобном дизайне. Авторы в целом славятся отличными практическими гайдами и софтом – и эта работа не исключение

Что есть в работе?
🟤Введение в BDD дизайн – объяснение, что такое многомерная разрывная регрессия с границей в виде кривой, и почему это расширение классического RDD важно
🟤Обзор эмпирической практики – анализ более 80 исследований, которые применяли BDD дизайн, с разбором типичных стратегий оценки эффектов
🟤Методология оценки и идентификация – подробное описание современных локальных полиномиальных методов для получения оценок эффектов вдоль границы, включая выбор оптимальной ширины окна (bandwidth)
🟤Анализ гетерогенности – подходы к обнаружению и учёту вариаций эффекта воздействия по разным точкам границы
🟤Агрегация эффектов – методы получения средних (Weighted Boundary Average Treatment Effect, WBATE) и максимальных (Largest Boundary Average Treatment Effect, LBATE) эффектов по всей границе
🟤Практические рекомендации – советы по спецификациям моделей, включению взаимодействий (interactions) и работе с ковариатами
🟤Программные инструменты – ссылки на R-пакеты для реализации методов
🟤Расширения и будущие направления – обсуждение fuzzy BDD-дизайнов и включение ковариат в анализ

А как считать?
Основные R-пакеты для Boundary Discontinuity Designs:
🟤 https://rdpackages.github.io/rdrobust/ – классический пакет для RDD, поддерживает методы выбора оптимальной ширины окна и построения доверительных интервалов
🟤 https://rdpackages.github.io/rdhte/ – специализирован для анализа гетерогенных эффектов в RDD, помогает выявлять вариации эффекта вдоль границ
🟤 https://rdpackages.github.io/rdmulti/ и https://rdpackages.github.io/rd2d/ – пакеты, ориентированные на BDD-дизайны с двумя переменными, реализуют локальные полиномы с учетом положения наблюдений, обеспечивают современные методы оценки, поддерживают сложные границы

#канал_обозревает
https://t.me/causal_channel

Showing 12 of 12 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

доказательный ⎵ пробел

доказательный ⎵ пробел

Рейтинг

Рост участников (Сегодня)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Albinasummer

PM работа. Проектные менеджеры

Русский Модный Код

Литературный коД

Компьютерная математика Weekly

AI Projects

ReLab Family

Книги по программированию

Похожие каналы Telegram

Albinasummer

PM работа. Проектные менеджеры

Русский Модный Код

Литературный коД

Компьютерная математика Weekly

AI Projects

ReLab Family

Книги по программированию

Отзывы пользователей (0)

Последние посты