Запрети мне псевдолейблить

Public

Не можете присоединиться? @pseudolabeling

3.4k Участники

Обновлено: May 26, 2026 at 8:27 AM

Запрети мне псевдолейблить

Канал о пути к Kaggle competitions (теперь уже) GrandMaster и поте, которым обливаешься в процессе Последний авторский канал про мл, претендующий на искренность и позволяющий ставить клоунов

@pseudolabeling is a growing community focused on grandmaster and kaggle and related topics

Рейтинг

Глобальный рейтинг

#11267

-93

Рейтинг по языку

#7802

-69

Рейтинг по категории

#756

-11

Рост участников (Последние 23 дней)

Всего: 3.4K

Рост за 24ч: +0 0%

Последние посты

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

Следующий год будет последним, когда меня можно будет номинировать в номинацию «киберспортсмены» в форбс 30 до 30

2,190

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

Как , только лучше

https://www.kaggle.com/competitions/orbit-wars

Полный газ

2,260

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

📷 Photo

Первая проблема, конечно, решается парсингом. Ходим на условную страницу <здесь могла бы быть реклама вашего букмейкера> и парсим данные раз в час. К сожалению не очень многие букмейкеры дают открытый API, но с помощью кодекса это легко исправить. А вообще мотивация не давать API не очень ясна, ведь сейчас самое время покорять рынок MCP агентов-лудиков.

Вторая проблема решается очень красиво и математично- https://en.wikipedia.org/wiki/Kelly_criterion. Это https://sci-hub.hlgczx.com/10.1002/j.1538-7305.1956.tb03809.xа, которую нужно ставить, основываясь на истинной вероятностной модели исходов. Такой истинной вероятностной моделью считаем раддар-ноутбук. Для критерия доказана асимптотическая математическая оптимальность скорости роста портфеля. Проще говоря, если играть бесконечное число матчей по этой стратегии и у тебя хороший алгоритм предсказания матчей, то в долгосрочной перспективе будешь обгонять все прочие стратегии. Более того, банк будет расти экспоненциально.

К сожалению, в баскетболе не бесконечное число матчей, так что алгоритм для бота следующий:
1. Подтягиваем коэффициенты и матчи, на которые можно ставить. Мапим к ним оценки вероятностей.
2. Для матчей расcчитываем матожидание профита. Если матожидание меньше 10% ставки- отметаем такой матч. Этот костыль нужен потому, что я хоть и верю в несмещенность раддар-ноутбука, но не верю в его абсолютную непогрешимость. Так что нам нужен тот самый, талебовский, запас надежности.
3. Для матчей, которые остались- ищем новости о командах-участниках. Codex гуглит все последние обновления составов/травмы/трансферы и решает, достаточное ли это основание для изменения шансов на победу. Если достаточное- отметаем.
4. Подтягиваем текущий объем банка и на его основе расчитываем оптимальный объем ставки:
(c * p - 1)
—————— = bet_coef.
(c - 1)
Тут с- коэф бука, p- вероятность из нашей модели и bet_coef- доля банка для ставки
5. Ставим. Если мы на этот матч уже ставили и коэффициенты стали еще более выгодными, то расчитываем сколько еще нужно добавить.
Общий банк был ~40к рублей, так что риск хоть и не слишком большой, но эмоциональную вовлеченность генерящий.

Из интересных происшествий и наблюдений:
1. В какой-то момент бот сам себе сломал метчинг имен и поставил на матч, в котором должен был проиграть. На вопрос 'Ты что, просто решил проиграть?' он честно признался, что ошибся и 'уже ничего не исправить'. Пришлось пересчитывать матожидание и учить бота продавать ставки букмейкеру назад, когда математически выгоднее продать, чем гемблить. Считаем по той же формуле, что в пункте 4 и сравниваем с комиссией за продажу. Она обычно фикс в ~10%, так что можем ограничить ненужный риск.
2. Есть наблюдение, что на 'открытии торгов' коэфы наиболее неэффективны и потом постепенно ползут к оптимальному соотношению. Надо будет в следующем году вам количественное исследование сделать.
3. Иногда выгодно ставить на андердога, потому что именно на него появляется наибольший Edge. Это создает небывалое чувство спокойствия- выиграешь либо в рейтинге на каггле, либо получишь денежную компенсацию.
4. Одновременно может быть несколько матчей, на которые можно эффективно заключить пари. Поэтому важно каждый раз подтягивать размер банка, чтобы добавлять денег в зависимости от исходов матчей. Я решил, что убавлять не нужно, потому что исходы параллельных матчей можно считать независимыми, а значит и вероятность резкого банкротства сильно мала.
5. В постанализе я оценил вероятности того, что бот мог потерять деньги и закончить с банком ниже изначального. Вышло довольно неплохо: тотальный шанс закончить в минус был 15%, а внутридневной порог потери денег опустился ниже 20% всего один раз. И именно потому, что было две большие недооценки андердога со стороны 'рынка'.

Опыт интересный, обожаю истории https://en.wikipedia.org/wiki/Richard_Jarecki. Кажется за попытками дистанцироваться от ставок на спорт, я попал в сети ставок на алгоритмы.

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

Еще один https://www.kaggle.com/competitions/neurogolf-2026 вышел
Видимо ускорять/облегчать модели для бенчей мы будем весь этот год

2,210

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

📷 Photo

Бот лудоман, часть 1

March Mania на то и мания, что вскрывает все человеческие пороки. Вместо того, чтобы надеяться стать лучше всех в этом соревновании, я решил сделать еще большую ставку на правильность своей модели и заставил codex выигрывать и заключать пари.

Несмотря на все апсеты, получилось заработать +15% к депозиту за неделю с помощью Codex и данных об исторических играх университетских команд NCAA.

Беттинг-платформы зарабатывают на спреде вероятностей, занижая выигрышные коэффициенты:
Если команды абсолютно равны и побеждают с вероятностью 50%, то букмейкер никогда не даст коэффициент x2 на победу, скорее всего этот коэффициент для обеих команд будет 1.9-1.95 в зависимости от жадности букмейкера.
Тогда комиссия букмейкера за организацию игры будет (1 - (1.9 * 0.5)) = 0.1 = 10%.

Выставляемые коэффициенты зависят от нескольких факторов, кроме маржи:
1. Предсказания внутренней модели букмейкера. Обычно используется как инициализация для изначальных коэффициентов
2. Объем ставок на каждую из команд. Это условная 'уверенность толпы'. Он считается околоэффективной и лучше отражающей соотношение шансов, в том числе изменения новостей. Для совсем разгромных матчей пари часто просто не заключаются.

Из этого можно сделать вывод: букмейкер не соревнуется с нами в точности предсказаний, он в любом случае остается в плюсе и зарабатывает на объемах ставок.

Базовая идея:
Предсказания турнира NCAA крайне близки к эффективным. За столько лет проведения убито множество датасаентисто-часов в попытки построить оптимальные модели предсказания исхода матчей. Из этого делаем вывод, что условный Raddar notebook можно использовать как 'честный источник вероятностей исходов'. В нем даже калибровка из коробки есть. Если каждый матч- это подбрасывание монетки, то Raddar Notebook выдает честное отношение шансов на исходы.
Тогда можно использовать коэффициенты букмейкера и считать матожидание прибыли от ставки, опираясь на 'честные вероятности исходов'.

Остается еще несколько проблем:
1. Как автоматически подтянуть коэффициенты от букмейкера?
2. Как менеджерить портфолио, чтобы не разориться? Банк имеет конечный размер и у букмейкера есть минимальный размер ставки, так что надо контролировать риск и выстраивать стратегию.

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

📷 Photo

Несколько дней назад закончилось Kaggle-соревнование March Machine Learning Mania, в котором мы с https://t.me/makarbaderko https://www.linkedin.com/feed/update/urn:li:activity:7448080366122385408/?utm_source=share&utm_medium=member_desktop&rcm=ACoAAESF1fQB_aUvc3CA74NtN0lmXXim5T3_pls.

По результатам этого соревнования Макар получил статус Kaggle Competitions Expert, а я – Kaggle Competitions Master.

В решении мы опирались на https://kaggle.com/code/asimandia/not-this-year-s-raddar-notebook от и https://www.kaggle.com/raddar. Мы использовали продвинутый feature engineering вместе с градиентным бустингом, что дало нам хорошее итоговое решение.

Более подробно ознакомиться с решением можно в https://www.kaggle.com/competitions/march-machine-learning-mania-2026/writeups/7th-place-solution.

Благодарим всех тех, кто поддерживал нас!

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

📷 Photo

На Kaggle новая драма — соревнование по разметке данных для боевых дронов https://www.kaggle.com/competitions/leonardo-airborne-object-recognition-challenge Официально задача звучит так: нужно построить модель, которая будет находить и классифицировать объекты…

3,390

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

Добрым словом и кодексом можно добиться большего, чем просто кодексом

2,080

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

📷 Photo

Профессиональные кагглеры делятся опытом о том, как радостно избили детей с помощью нейронок в соревновании для новичков.

Буквально чел с бесконечными ресурсами, чья работа- побеждать на каггле рассказывает как изи побеждать в соревновании, созданном чтобы новички соревновались с равными. Фото с награждения на третьей картинке

https://www.kaggle.com/competitions/playground-series-s6e3/writeups/1st-place-gpt5-4-gemini3-1-claudeopus4-6-kgm

3,970

101

Запрети мне псевдолейблить

17 мая 2026 г., 00:27

📷 Photo

Баскетбол кончился, делитесь страданием в комментах

Я вот улетел на 726 место

upd: Зато на основе ноутбука, который я шарил есть 28 место:
https://www.kaggle.com/competitions/march-machine-learning-mania-2026/discussion/688948

2,300

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

Я все еще не оставляю надежд на () https://www.kaggle.com/competitions/lux-ai-season-3

2,060

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

📷 Photo

На Kaggle новая драма — соревнование по разметке данных для боевых дронов

https://www.kaggle.com/competitions/leonardo-airborne-object-recognition-challenge

Официально задача звучит так: нужно построить модель, которая будет находить и классифицировать объекты на съемке с летательных аппаратов. В списке классов:

1. люди
2. летательные аппараты
3. дроны
4. машины
5. корабли
6. препятствия для самого носителя камеры — башни, скалы и т.д.

Проблема в том, что все и так прекрасно понимают, для чего сегодня особенно востребованы такие платформы с видео- и фотосъемкой и опцией подсветки снизу.

В датасете почти сразу https://www.kaggle.com/competitions/leonardo-airborne-object-recognition-challenge/discussion/683460 — они как раз приложены к посту. После того как началось публичное возмущение, Kaggle на время притормозил соревнование. Сейчас к нему уже нельзя подключиться заново, но те, кто успел зайти и что-то засабмитить, по-прежнему могут продолжать.

Отдельно стоит посмотреть на заказчика — Leonardo Helicopters, итальянскую многоцелевую компанию.
Во-первых, 30% компании принадлежит правительству Италии.
Во-вторых, Leonardo участвует в сотрудничестве с Baykar: у них совместное предприятие 50/50, а сама Baykar — производитель Bayraktar.

Из этого для россиян вытекают и вполне конкретные правовые риски. В действующей редакции статьи 275 УК РФ государственная измена — это не только шпионаж или передача гостайны, но и оказание иностранному государству, международной или иностранной организации финансовой, материально-технической, консультационной либо иной помощи в деятельности, направленной против безопасности РФ. Отдельно статья 275.1 УК РФ наказывает за конфиденциальное сотрудничество с иностранной организацией в целях такого содействия. А статья 189 УК РФ отдельно криминализует незаконную передачу иностранному лицу технологий, работ или услуг, если на них распространяется экспортный контроль.

Ну и в целом все это выглядит как жалкая пародия: несравненный оригинал на эту тему уже когда-то https://news.rambler.ru/weapon/49933847-chvk-vagner-tsentr-prizval-vseh-uchastnikov-hakatona-ne-ostanavlivatsya-na-dostignutom/

Мое мнение кстати простенькое:
Кагл хорошая платформа для поиска новых идей, но детекция/классификация объектов тема изъезженная. Думаю тут сорева нужен для хаеринга, а не топ решений/идей. Были бы нужны топ решения/идеи- на инференс давали бы больше ограничений, чем 9 GPU/Hours. Правда, есть и приз за быстродействие, но он считается среди топ участников отдельно.

Это первое соревнование на моей памяти, которое остановили по этическим соображениям.

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

📷 Photo

March mania началась! 🏀🏀🏀

Мой сабмишн вот такой, лудка пошла.

Со своим сабмишном можно поиграть вот здесь:

https://marksmath.org/visualization/data/NCAABrackets/KaggleBrackets/

Сайт обновляется с лагом примерно в 10 часов, но прогресс трекать позволяет зачастую лучше, чем кагл

В комментах призываю поделиться своими сетками и поспорить, кто самый большой лудоман. Ну и поныть/радоваться после первых сетов матчей

2,490

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

https://t.me/Kaggle_monitor_bot
Сделал подписчикам бота со статистикой по баскетболу и March Mania. Приходите и получайте

Бот работает быстрее кагла и шлет апдейты по тому, как сыграли команды

Send your Kaggle submission CSV as a document. The newest upload becomes your active submission.

Кнопки:
📌 Status - Текущий саб и его бриер скор
🏆 Rank - ваш ранг среди псевдолейблеров
🏁 Results - как вы предсказали уже прошедшие игры
🏀 Today - Игры на сегодня
🌙 Yesterday - Игры за вчера

2,370

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

📷 Photo

Как взять золото в March Mania? 🏀 В прошлом году анализировал то, как выигрывается March Mania и самая надежная стратегия- это модифицировать Raddar notebook. Я долго ждал, пока Raddar его выложит, но сколько можно? Я сам сделал вам Raddar Notebook. Raddar…

2,460

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

Перевыложил многострадальный лоторейный билетик Никому его не показывайте плз. Такие сильные ноутбуки нельзя выкладывать, когда до конца соревы так мало времени. Осталось 2 дня

2,220

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

📷 Photo

На днях будет мердж дедлайн в еще одной лоторее: https://www.kaggle.com/competitions/stanford-rna-3d-folding-2/leaderboard

Соревнование казалось каким-то неформатным для кагла и так и выходит: засабмитив https://www.kaggle.com/code/asimandia/stanford-rna-3d-folding дважды можно влететь в высочайший лб. Но этот лб уже на готовы последовательностях и плохо воспроизводится. Приватный тест будет на вновь собранных к концу соревнования данных и организаторы особо даже и не пишут ответа на вопрос «а сколько будет данных в привате?»

Для меня звучит как еще одна рандомная лотерея, в которой можно взять сологолд, а можно улететь в ад.
Я оценил распределение скоров нормальным и шанс выбить скор больше, чем у меня (а значит оказаться в момент написания поста в топ 15) сейчас примерно 10%.

Автор оригинального топ паблика кстати у нас уже в комментах.

Собственно инструкция для всех ленивых:
1. Присоединяемся у сореве
2. Копируем мой паблик
3. Сабмитим его пять раз в день
4. Смотрим на красивое место на лб
5. В ночь на 30 марта молимся богу сологолда
6. https://www.kaggle.com/code/sigmaborov/stanford-rna-3d-folding-top-1-solutionавтору оригинального паблика https://t.me/xbebra
7. Подписываемся на

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

Мой 🏀 баскетбольный 🏀 ноутбук кстати пока не вернули в паблик. Если в пн вечером не вернут- во вторник перевыложу сюда код для всех подписчиков

2,620

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

📷 Photo

Амнистия от гражданина начальника

Но ноутбук все равно выложить не могу, потому что последняя неделя соревнования. Написал поддержке с просьбой о помощи. Если не помогут- выложу за три дня до дедлайна свежую версию без привязки к сореве

2,200

Запрети мне псевдолейблить

2 апр. 2026 г., 08:09

📷 Photo

Вдвойне смешнее А можно как-то с калом связаться? Там вроде раддар не против UPD: Создал тему чтобы поныть https://www.kaggle.com/competitions/march-machine-learning-mania-2026/discussion/680789

2,460

197

Запрети мне псевдолейблить

27 мар. 2026 г., 21:10

Птицы все же вышли в этом году 🦅

Мы любим это соревнование, потому что оно решается псевдолейблингом

https://www.kaggle.com/competitions/birdclef-2026

Призовые как обычно первые 5 мест + приз жюри за лучший work note на CLEF 2026.

Тот случай, когда можно зафармить и медалек и статей на A-level конфе. Чтобы засабмитить work note даже не надо попадать в топ, приз выбирают из всех сабмишнов.

2,310

Запрети мне псевдолейблить

27 мар. 2026 г., 21:10

сегодня https://www.imageclef.org/BirdCLEF2026 птичек (планируют запустить) ... если кто-то ждет. Мое предположение было близко, но не Колумбия, а Бразилия и рядом лежащие области

1,910

Запрети мне псевдолейблить

27 мар. 2026 г., 21:10

Подписчики уверяют, что птицам быть

March 11, 2026 - Start Date.
- May 27, 2026 - Entry Deadline. You must accept the competition rules before this date to compete.
- May 27, 2026 - Team Merger Deadline. This is the last day participants may join or merge teams.
- June 3, 2026 - Final Submission Deadline.

1,920

Запрети мне псевдолейблить

25 мар. 2026 г., 16:29

📷 Photo

Получил респект от старшего

1,690

Запрети мне псевдолейблить

25 мар. 2026 г., 16:29

📷 Photo

Рубрика 'доменные мертики'

Люди давным давно занимаются того залетит ли ставочка, какая команда сильнее и в профессиональные аналитики (тм) даже придумали специальные рейтинги, чтобы определять это более честно.

Вместо того, чтобы смотреть на чистую разницу очков, подметили, что команды играют с разной скоростью. Давление таймера на баскетбольные команды только глобальное, хотя за 40 минут чистого времени можно разыграть совершенно разное количество 'владений'. Но если мяч забит, то обычно мяч переходит команде, в чьи ворота забили (за исключением штрафных).

Вот тут и кроется подвох: команда может хорошо или плохо обороняться, но скорость игры ей навязывает еще и команда соперника. В силу того, что это все спорт и элемент случайности все еще присутствует, андердогу выгодно 'играть медленно', чтобы иметь чуть больше шансов на удачу. Так же скорость игры регулируется тем, насколько команда физически подготовлена. Условно ветераны могут играть медленно, но очень технично и из каждой своей медленной атаки выходить победителем. Мы в школе например всегда быстро играли, потому что набивать опыт так легче, потому что играете больше владений + выносливость и скорость тренируется офлайн, без противников.

Перейдем к цифрам. Для начала оценим сырое число владений по бокс-скору:
(Число владений) = (все броски основного времени игры)−(подборы в нападении) + (потеря мяча) + 0.475× (число штрафных бросков)

Подборы в нападении вычитаем, потому что они 'продлевают владение' и мы не хотим два раза их считать.
Потеря мяча без броска тоже завершает владение досрочно.
Коэф 0.475 подобран эмпирически- примерно конверсия штрафных бросков в потерю мяча.

Посчитав такой коэффициент, мы можем получить 'нормализованную' эффективность нападений/обороны. Это будет оценка матожидания количества очков от владения мячом для конкретной команды в идеальных условиях.

Эффективность нападения:
(Количество забитых командой очков) / (Число владений) * 100

Эффективность защиты:
(Количество забитых команде очков) / (Число владений) * 100

Чтобы это все дело привести еще и к 'идеальному скору', надо это нормализовать на средние эффективности по лиге:
(Скорректированная эффективность нападаения) = (Эффективность нападаения) * (Средняя эффективность нападаения в лиге) / (Эффектиность защиты соперника)
(Скорректированная эффективность защиты) = (Эффективность защиты) * (Средняя эффективность защиты в лиге) / (Эффективность нападаения соперника)

Собственно эти две цифры и показывают честную силу команды, нормированную на скорость игры.

Свести их к одной позволяет еще одна волшебная формула:
(Вероятность победы против усредненного соперника)= (Скорректированная эффективность нападаения)^k/((Скорректированная эффективность нападаения)^k
+ (Скорректированная эффективность защиты)^k)

Вы спросите меня, а что за k? А это тоже поправочный коэффициент в 10.25.

Как это использовать в соревновании? Как фичи конечно. Можно спарсить https://torvik.dev/articles/introduction.php чем я сейчас и занимаюсь.

Вообще у меня от этих формул эффект как от нейрослоп: вроде и узнаю похожие очертания, а как всмотришься- творится какая-то чертовщина

Запрети мне псевдолейблить

25 мар. 2026 г., 16:29

📷 Photo

Как взять золото в March Mania? 🏀 В прошлом году анализировал то, как выигрывается March Mania и самая надежная стратегия- это модифицировать Raddar notebook. Я долго ждал, пока Raddar его выложит, но сколько можно? Я сам сделал вам Raddar Notebook. Raddar…

2,140

Запрети мне псевдолейблить

23 мар. 2026 г., 23:23

📷 Photo

Фармим академические ачивки

Прямо сейчас проходят соревнования, хорошее место в которых позволит опубликовать свой work-note и выступить с воркшопом на конфах CVPR26 (тир A+ США) / CLEF (тир A в Германии). У этих челленджей сравнительно маленькая конкуренция и взять хорошее место на них даже проще, чем в https://www.kaggle.com/competitions/playground-series-s6e3 каггла. Придется повозиться с данными, но зато можно увеличить свои шансы на поступление на пхд/магистратуру/стипендию/грант. Применимо это для любой страны, включая северную корею. Я бы лично решал, чтобы получить повышенную стипу.

1. https://www.kaggle.com/competitions/animal-clef-2026Классифкационный трек, где нужно подумать как хендлить класс 'другое'. https://www.kaggle.com/competitions/animal-clef-2026В этом году надо отличить друг от друга: Евразийскую рысь, чашскую саламандру, греческих черепах и техасских рогатых ящериц. Причем последних в трейне нет, только в тесте. В прошлом году было 174 участника из которых только один кагл мастер. Не сильно ожидаю, что в этом году конкуренция будет больше, так что попасть в топ довольно изи.

2. https://www.kaggle.com/competitions/plantclef-2026/overview/cvpr-26-and-clef-26-contextЗадача по мультиклассификации на 1000+ классов: в трейне даны снимки индивидуальных растений, а в тесте- один большой снимок, растения с которого надо распознать и перечислить. В прошлом году участвовало 38 участников, из которых только один кагл мастер. Причем тот же самый, что и в AnimalClef сореве

3. https://www.kaggle.com/competitions/fathomnet-2026Соревнование по детекции на подводных снимках: надо по фото найти bbox-ы чего-то живого под водой. В прошлом году участвовало 79 человек и ноль кагл мастеров. Тут скорее задача в том, как файнтюниться под целевые класс на опенсорсном датасете.
https://www.kaggle.com/competitions/fathomnet-2026По сравнению с прошлым годом случились потери:
Мало того, что BirdClef, за который традиционно дают очки рейтинга, так и не появился, так еще мы потеряли классификацию грибов (FungiClef) по фото и оценку разнообразия лесов (LifeClef) по спутниковым снимкам.

Зато появились еще одно академическое соревнование не из Clef трека:
https://www.kaggle.com/competitions/accident
По видео надо найти где и когда в кадре случилась авария, а так же ее тип. Можно попасть на воркшоп CVPR и даже можно успеть сделать визу

Запрети мне псевдолейблить

23 мар. 2026 г., 23:23

📷 Photo

Дополнительный пост к второму месту на #santa2025. Это решил вынести в отдельный пост, потому что в одно тг сообщение просто не лезет.

Как трясти задачу упаковки? Авторы решения это называют 'Large neighborhood'
Как создать какое-то глобальное изменение для хорошего решения, но при этом контролируемо его испортить и не слишком сильно потерять глобальную структуру?

Все 4 шага есть картинками по порядку (картинки соответствуют этапам)
1. Удалим N случайных смежных деревьев
2. Выберем точку в получившемся пустом пространстве и растолкаем деревья в разны стороны от нее. При этом решение может испортиться и стать чуть-чуть больше
3. Рядом с точкой расталкивания вернем N деревьев случайным образом, лишь бы без коллизий
4. 'Ужмем' деревья назад

Теперь про каждый пункт по порядку.
Чтобы решить, какие деревья выбирать надо решить две вещи: целевую точку и количество деревьев.
Количество выбираем из равномерного распределения от 1 до 4.
Чтобы решить, какую точку 'ломать' все еще сложнее:
С вероятностью 0.1 выбираем один из углов
Чаще семплируем те места, где больше дисперсия направляющих углов елок

Чтобы 'растолкать деревья':
1. Увеличиваем квадрат немного с ближайшей стороны
2. Запускаем SA, который пытается сдвинуть каждое дерево от точки

Ну и конечно решение написано на rust + python. Причем на python по большей части графики.
🦀😡🦀

Прошлыt куски тут:

Запрети мне псевдолейблить

18 мар. 2026 г., 14:26

Не прошло и дня, а баскетбол на месте 🏀

https://www.kaggle.com/competitions/march-machine-learning-mania-2026

Всем зарегаться, всем взять билетик в сологолд и ждать розыгрыш

Предыдущие посты по теме баскета, чтобы примерно проникнуться духом

Вайбчек победителей соревы прошлых лет:

Финальные ставки:

Вот тут я позерствую на кажущемся успехе:

Вот здесь я узнал про специфичные для домена метрики не на уровне команд, а на уровне игроков:

А здесь подводим ботомлайн и пытаемся понять, почему не удалось всех победить в лоторее:

2,620

Запрети мне псевдолейблить

18 мар. 2026 г., 14:26

📷 Photo

Как взять золото в https://www.kaggle.com/competitions/march-machine-learning-mania-2026/overview? 🏀

В прошлом году анализировал то, как выигрывается March Mania и самая надежная стратегия- это модифицировать https://www.kaggle.com/code/asimandia/this-year-s-raddar-notebook/edit. Я долго ждал, пока Raddar его выложит, но сколько можно? Я сам сделал вам https://www.kaggle.com/code/asimandia/this-year-s-raddar-notebookk.

https://www.kaggle.com/raddar- это такой кагл грандмастер, который был 10 лет назад топ 4 каглла, но сейчас подзабил на соревы и в основном лудит в March Mania. Прямо как мы с вами! Форки его ноутбука стабильно появлятеся в топ 10 уже 5 лет, но не он. Ему не везет настолько, что приходится жаловаться на форуме, что его жена стибильно выше него в ладдере March Mania.

База отработана почти с самого начала сорев по NCAA:
1. Берем фичи повторяющиеся из года в год
2. Берем XGBoost
3. Завышаем вероятности в 'неравных схватках'
4. Руками фиксим вероятности для самых первых матчей, чтобы хакнуть Brier Score.

Этот подход как автомат Калашникова, попадал в топ 10 каждый год. Весь секрет в том, чтобы изменить базовый ноутбук и тем самым стать чуть-чуть лучше или хуже, чем все остальные. Ну и молиться, конечно!

А вот если не модифицировать и ничего не крутить, то получишь скор как все те люди, что скопировали/сабмитнули и уж точно не выиграешь. Я об этом за вас подумал, и добавил к сабмитам чуть-чуть шума, чтобы скоры отличались. Вы можете сами это отключить, можете сами оверрайднуть матчи, можете выкинуть/добавить какие-то фичи. Рекомендую посмотреть новости о том, как изменятся составы прямо перед матчами и оверрайдить на их основе.

Самое главное в этом соревновании- это не упарываться. Рынок баскетбольных ставок настолько эффективен, соревнование так долго проводится и на него виляет так много факторов, что нет смысла пытаться придумать что-то новое. Надо тянуть билетик в лоторее и ждать результаты. И помните, можно взять аж два билета и эти билеты должны быть разными, потому что матожидание максимума от двух случайных величин больше или равно их матожиданиям.

Так что форкайте https://www.kaggle.com/code/asimandia/this-year-s-raddar-notebook?scriptVersionId=300874279, запускайте и делайте самбит, репостите другим людям. Чем больше будет команд- тем больше будет золотых медалек

🏀🏀🏀
https://www.kaggle.com/code/asimandia/this-year-s-raddar-notebook?scriptVersionId=300874279

Showing 30 of 34 posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Запрети мне псевдолейблить

Запрети мне псевдолейблить

Рейтинг

Рост участников (Последние 23 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

СаМИ

ДВ Главное

Котики Нейросеть

Абхазия будущего

саня ты в порядке

Благотворительный фонд Закят

Жуковец

ВД «АКТИВ»

Похожие каналы Telegram

СаМИ

ДВ Главное

Котики Нейросеть

Абхазия будущего

саня ты в порядке

Благотворительный фонд Закят

Жуковец

ВД «АКТИВ»

Отзывы пользователей (0)

Последние посты