Высоконагруженный кабанчик

Public

Просмотреть канал

Не можете присоединиться? @data_intensive_boar

336 Участники

Обновлено: May 17, 2026 at 1:38 AM

Высоконагруженный кабанчик

По всем вопросам @fall_out_bug Один из котов в Faust Consulting, ex-CTO RWB Media, ex-CTO S7 Techlab. Пишу об AI, архитектуре, жизни, вселенной и всем таком.

@data_intensive_boar is a growing community focused on excto and faust and related topics

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Сегодня)

Всего: 336

Последние посты

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

AI Advent Challenge Advanced. День 10. Сначала простое
Финал недельной серии, 10/15.

Задание дня: сделать двухуровневый вызов модели. Сначала маленькая модель или простой классификатор, который возвращает структурированный результат и уверенность. Большая модель подключается только если первый уровень не уверен или вернул кривой формат.

Это хороший финал для выходного забега.

После данных, проверки уверенности, маршрутизации и декомпозиции остаётся самый неприятный вопрос: зачем вообще звать большую модель, если ответ уже лежит на поверхности?

Не в каждый случай надо тащить большую модель.

Если задача без ошибок, покрытие нормальное, лишние файлы не задеты, то для первичного вердикта не нужен оракул. Достаточно правил.

Так появился шаг «сначала простое»: маленькая проверка перед большой моделью. Она либо говорит «я уверена», либо молча пропускает задачу дальше.

Я подключил это к четырём местам:
→ вердикт по workstream'у;
→ приоритет задачи;
→ тип задачи;
→ подсказка, куда отправить задачу на старте.

Первый прогон дал 25.6% экономии при цели 30%. Код зелёный, цифры грустные.

Причина была в заглушке. Она превращала похожие тексты в случайные точки. То есть я тестировал классификатор на данных, которые специально не похожи на реальные.

Классика: тест честный, но бесполезный.

Сделал заглушку, которая хотя бы грубо сохраняет смысловые группы. Похожие случаи стали попадать рядом. Экономия выросла до 81.2%.

Вторая пощёчина прилетела от Codex: одно правило могло дать PASS даже при покрытии 0%. Формально все ветки были зелёные. По смыслу это дырка. Починил.

Итог серии:
→ данные вместо гадания;
→ проверка вместо доверия;
→ маршрутизация вместо ручного выбора модели;
→ этапы вместо одного комбайна;
→ простые правила перед дорогим вызовом.

Главная мысль: вызов модели не должен быть шаманством с бубном. Это просто часть системы: вход, проверка, дешёвый путь и место, где лучше остановиться.

Для любопытных: https://github.com/fall-out-bug/sdp_lab/pull/134

Не отключайтесь.

698

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

AI Advent Challenge Advanced. День 8. Лестница для моделей
Продолжение серии, 8/15.

Задание дня: сделать маршрутизацию между моделями. Сначала дешёвая или быстрая модель, потом переход на сильную. Минимум одна эвристика: длина ответа, оценка уверенности или правило «если не уверен — эскалируй».

Идея простая: не надо сразу бежать к самой сильной и дорогой модели. Сначала пробуем дешёвую. Если ответ нормальный, остаёмся там. Если ответ сомнительный, поднимаемся выше.

Звучит слишком разумно, чтобы сразу заработать.

Я собрал каскад для реальных источников моделей в SDP: локалка, быстрые модели, сбалансированные, сильные. Плюс проверка уверенности из предыдущего задания.

А потом ревью нашло прекрасное: маршрутизатор вообще не вызывался.

Каскад ходил по ступенькам, но вместо настоящего решения возвращал строку-заглушку. Правильный порядок действий, неправильные данные. Очень знакомое чувство.

Починил. Запустил демо. Экономия на дешёвом уровне упала до нуля.

Причина оказалась почти комичной. Настоящий ответ маршрутизатора был короткий:
dispatched to claude-opus-4-7/balanced

А проверка считала слишком короткие ответы подозрительными и эскалировала наверх. С искусственным ответом всё было хорошо, потому что он был длиннее и удобнее.

Вот так заглушка аккуратно соврала, даже не падая.

После правки корпус из 23 кейсов дал нормальную картину: 52.2% запросов остались на дешёвом уровне. Не «магия сэкономила всё», а честная половина.

Самый полезный вывод задания: удобная заглушка опаснее падающего теста. Падающий тест орёт. Удобная заглушка улыбается и пропускает баг в боевой код.

Следующий кусок выходного забега — не выбирать модель, а резать сам запрос на короткие этапы.

Для любопытных: https://github.com/fall-out-bug/sdp_lab/pull/135

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

AI Advent Challenge Advanced. День 9. Не пихать всё в один запрос
Продолжение серии, 9/15.

Задание дня: взять задачу, которая плохо решается одним запросом, и сравнить два подхода. Вариант A — один большой запрос. Вариант B — несколько коротких этапов: анализ, решение, формирование результата. У каждого этапа строгий формат.

Мы часто просим модель сделать всё сразу: прочитай контекст, найди факты, классифицируй, собери вывод, оформи красиво, не ошибись, спасибо.

Ну да. А потом удивляемся, что оно едет.

Я разрезал один большой вызов на цепочку маленьких шагов.

Для проверки workstream'а получилось так:
→ сначала вытащить факты;
→ потом решить, прошла работа или нет;
→ потом собрать итоговый вердикт.

У каждого шага свой формат, своя модель и своё правило на ошибку. Один шаг может повториться. Другой должен упасть сразу. Третий может дать запасной ответ.

Главное тут не «архитектура ради архитектуры». Главное: сразу видно, на каком шаге всё поехало.

Если сломался второй шаг, я знаю, что проблема в классификации. Не в промпте на три экрана, не в «модель странная», не в фазе луны.

Цифры пока сухие, но полезные: на семи проверочных примерах монолит и цепочка дали 100% точности. Зато цепочка съела 4071 токен против 5614. Это не победный салют, но хороший сигнал.

Самая поучительная пощёчина была в другом.

Ревью предложило «починить» парсер так, чтобы он принимал строки почти везде. Я применил. Тесты упали.

Оказалось, контракт уже был правильный. Я почти ослабил его ради красивого теста.

Вывод задания: когда система ломается на стыке, не надо первым делом расширять допуск. Сначала прочитай контракт. Иногда он защищает тебя от очень убедительного, но плохого фикса.

Финальный кусок серии — поставить перед большой моделью маленькую проверку.

Для любопытных: https://github.com/fall-out-bug/sdp_lab/pull/133

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

Дружочки! Не успела отгреметь наша прошлая встреча, а мы уже врываемся в эфир с новым анонсом. Очевидно, что в начале 2026 года, среди прочего, произошло кое-что значимое в разработке. Если в конце 2025 мы всё ещё морщились от слов «вайбкодинг» и «агенты»…

345

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

AI Advent Challenge Advanced. День 6. Данные вместо гадания

Продолжение серии, 6/15.

Сразу оговорюсь: очередные пять «дней» я закрыл за одни выходные. Поэтому дальше день — это номер задания в интенсиве, а не календарный дневник.

Задание дня: выбрать задачу под дообучение, собрать минимум 50 JSONL-примеров, разделить данные на обучение и проверку, написать валидацию, снять стартовый замер на 10 примерах и подготовить клиент для запуска дообучения.

Я взял не учебную тональность и не спам. В SDP уже была конкретная задача: понять, куда отправлять работу — в локальную модель или в облачную.

До этого всё держалось на списке слов. Если в задаче есть stub, test или rename, отправляем в локалку. Если выглядит страшно, тащим в облако.

Работает ровно до первого latest manifest.

Слово test внутри latest нашлось. Классификатор радостно сказал: «О, тесты!». Конечно, нет.

Поэтому я собрал датасет из реальных задач внутри SDP: проектные задачи, трекер, метки из репозитория. После чистки получилось 201 пример.

Каждый пример отвечает на три простых вопроса:
→ задача простая, средняя или тяжёлая;
→ это фича, баг, рефакторинг, тесты или доки;
→ риск низкий или высокий.

Самая полезная находка была тупая и прекрасная: нельзя искать смысл через простой contains. test живёт в latest, bug живёт в debug. Минус 19 кривых примеров одной маленькой правкой.

Базовая модель на десяти примерах угадала всё только в 20% случаев.

И это не провал. Это отправная точка.

Маленькую модель нельзя просто попросить: «будь умной». Ей надо дать нормальные примеры. Иначе она делает то же, что мы иногда делаем без ТЗ: уверенно угадывает.

Дальше — не само дообучение, а контроль уверенности. Потому что «кажется, это PASS» ещё не значит, что это правда.

Для любопытных: https://github.com/fall-out-bug/sdp_lab/commit/057c0d8

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

AI Advent Challenge Advanced. День 7. Уверенность, которая врёт

Продолжение серии, 7/15.

Задание дня: взять место, где ошибка недопустима, и добавить контроль качества ответа без дообучения. Минимум два подхода: самопроверка, несколько прогонов, проверки формата и логики, оценка уверенности или статусы OK / UNSURE / FAIL.

В SDP такие места есть. Например, агент решает: задача готова или нет. Если он ошибся, мы либо пропускаем сломанное, либо режем рабочее. Оба варианта так себе.

Я добавил проверку. У ответа теперь не только текст, но и состояние:
→ OK: похоже на правду;
→ UNSURE: модель не уверена;
→ FAIL: ответ нельзя принимать.

Главная пощёчина прилетела на вредных примерах.

Модель говорит: PASS. А рядом лежит tests_pass: false.

Сначала я трактовал это как «низкую уверенность». Ну, мол, модель почти справилась, только один признак плохой. Получалась красивая оценка, зелёный порог и совершенно неправильное решение.

А потом дошло: это не «не уверен». Это противоречие.

Если модель говорит «всё прошло», а тесты красные, ответ не сомнительный. Он недействительный.

Перенёс такие случаи в жёсткий отказ. После этого вредный набор стал отлетать как надо: 4 из 4.

Отдельная маета была с сабагентами. Пытался запустить троих параллельно. Один бодро отчитался: «18 тестов прошли, покрытие 100%». Только файлов на диске не было, а импорты он придумал от другого модуля. Оказалось, что у него была ошибка в доступных инструментах, а он очень не хотел расстраивать пользователя!

Полезное напоминание: бодрый отчёт не артефакт.

Артефакт лежит в репозитории. Тесты запускаются. Файл существует. Всё остальное пока разговоры.

Вывод задания простой: модели нельзя верить по тону. Ей можно верить только после проверки.

Дальше эта проверка пойдёт в маршрутизацию: сначала пробуем дешёвый вариант, а если он не уверен, поднимаемся выше.

Для любопытных: https://github.com/fall-out-bug/sdp_lab/pull/131

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

Гастроль намечается

283

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

📷 Photo

Дружочки!

Не так давно мы анонсировали тему дискуссионной панели в Москве, и она вызвала заметный ажиотаж в сообществе. Поэтому мы решили не оставлять её только там и везём обсуждение дальше - в Ташкент.

Это будет уже 3-я офлайн-встреча сообщества #безвотэтоговотвсего в Ташкенте, куда мы возвращаемся снова, чтобы продолжить разговор вживую и собрать ещё больше сильных мнений вокруг темы «Разработка 2026: вайбкодинг, ассистенты, агенты».

Что же нас ждёт:

• Обсудим, что из всего этого уже действительно работает на практике, как выглядят AI SDLC/PDLC в реальных процессах и какие кейсы можно наблюдать уже сейчас.
• Разберём, как трансформируется роль разработчика в мире ассистентов и агентных сценариев и правда ли, что все роли постепенно «схлопнутся» в одного универсального инженера.
• Посмотрим, где ассистируемая и агентная разработка реально ускоряет delivery и discovery, а где, наоборот, приносит новые риски и усложнения.
• Затронем и ажиотаж вокруг вайбкодинга, куда без него, и всё это настроение в духе «я снова, как 20 лет назад, пишу код, пу-пу-пу».
• И многое другое.

В этой теме с нами будут разбираться прекрасные эксперты:

• Андрей Жуков, консультант, Faust Consulting, ex-CTO RWB
• Роберт Ваганян, ex. CPO Октобанк
• Валерий Ковальский, Head of AI, r_m_r
• Евгений Селиверстов, Head of product operations, МегаФон

Ждём всех 18 мая по адресу Мирабадский https://yandex.com/maps/-/CPCimW3q большой конференц-зал U-ENTER.

Регистрируемся https://bezvotetogovotvsego.timepad.ru/event/3932318/ и готовим вопросы)

До встречи!

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

День 4. Local Boost
Задание: поднять локальную LLM в IDE, перенести правила Дня 1 в system prompt, прогнать те же задачи, сравнить с облаком. Бонус — 2–3 разные модели.

У меня основной harness для мутных делишек — OpenCode (тот же Ollama под капотом). Коммит на 600 с лишним строк.

Железо и модели
У меня не сильно богато: MB air, M4, 24 GB RAM, охладение пассивное.
→ Primary: qwen2.5-coder:7b (4.7 GB).
→ Fallback: deepseek-coder:6.7b (3.8 GB).

Обе в памяти одновременно. Swap при переключении — минус 8–12 секунд.

Два профиля агента
В .opencode/opencode.json:
→ local-coder (qwen) — полноценный агент: write + edit + bash + read + grep. webfetch: false.
→ local-fast (deepseek) — чистый автокомплит: только edit + read. Физически не может сломать репу через tool set.

Правила Дня 1 ( http://go-patterns.md/ на 600+ строк) ужал до .opencode/ http://system-prompt-local.md/ в 73 строки: module path sdp_dev, naming, 4 паттерна, tests, антипаттерны. Целиком в 4k контекста не влезет.

Параметры
Температура 0.1, top_p 0.9, num_ctx 512, stop — пустая строка после блока кода.

Температура критична. На 0.7 qwen сочиняет имена полей, которых нет.

Что получилось
qwen2.5-coder:7b шустр и генерит норм код на мааааленькую задачку
deepseek-coder:6.7b внезапно генерит текст вместо кода
claude-sonnet-4-6 бодр и прекрасен, задачки щелкает мгновенно
Парадокс «deepseek быстрее по t/s, но дольше » — он просто генерит больше токенов. Комментарии и объяснения даже когда просили только код.

Прогон задач
→ Test-coverage (table-driven). qwen — с первого раза. deepseek добавил лишний return false и комментарий вне блока.
→ Bug Fix (replace scope guard). qwen дописал рядом, не заменил — баг остался. deepseek воткнул фикс в похожую функцию, не в ту.
→ WS decomposition. Обе отказались — 4k контекста не хватает. Cloud справился.

Роутер, а не переключатель
В internal/dispatch/local.go — список ключевых слов, по которым WS считается low-complexity: stub, boilerplate, test, rename, simple, implement interface, docstring.

При Complexity=low && RequiredCap=coding роутер подсовывает Ollama с фиксированным score 0.9. Остальное — в облако.

Вывод
Локалки хватает на: стабы, одиночные тесты, симметричные рефакторинги, стандартные интерфейсы, sentinel-ошибки.

Правило: ≤ 512 токенов контекста → локалка, иначе облако. Не ручное решение — это dispatch. Router.

Что зашло больше всего
→ Два профиля с разным tool set'ом. Безопасность через ограничение, не через уговоры.
→ System prompt отдельным файлом. Скармливается в http://Continue.dev/ / LM Studio / куда угодно.
→ num_ctx=512 + temperature=0.1 — 80% эффекта.

Пока засада: stream:false у Ollama этой версии ломается на control chars — насильно stream:true. 24 GB впритык: третью модель не поднять.

Ссылки:
→ Day 4 commit: https://github.com/fall-out-bug/sdp_lab/commit/6d6050a
→ Local model guide: docs/reference/ http://local-model-task-guide.md/

Критика, мысли и PR — это мне надо!

Высоконагруженный кабанчик

20 мая 2026 г., 16:53

День 5. Execution Loop

Финал недельки!
→ 15–20 задач в трекере.
→ Запускаем агента в loop, уходим.
→ Через пару часов смотрим: сколько прошёл подряд, на чём упал, сколько с первого раза.
→ Допиливаем правила, повторяем.
→ Бонус — прогон на локалке.

Пул
Задачи в bd (beads). Четыре эпика, 36 WS суммарно. Микс: рефакторинг + баги + фичи + тесты + доки.

Loop пускал через ранее созданные и допиленный в процессе /deliver
→ build WS в subagent'ах → review до APPROVED → gates → gh pr create → /codex:rescue → fix → push
→ P0-баги в начало очереди
→ checkpoint в .sdp/checkpoint.json — recovery после compaction

Профиль (Bug Fix / Research / builder / reviewer) агент выбирает сам — по лейблам и шаблону WS.

Что зафиксировалось
Вердикты из .sdp/ws-verdicts/ — 21 WS PASS, среднее покрытие 92.8%.

Метрики первого прогона
Успел прожевать 14 задачек до первого вмешательства
Сломался на review, нашёл дрифт и вышел из цикла
Но неплохо для первого раза: 28/36 ≈ 78%
Среднее время на WS 8–12 минут (с review + gates + PR)
Суммарно ~4.5 часа непрерывной автономии

Прогон 2 — после доработки
Три класса фиксов:
→ Atomic claim. bd update  --claim вместо --status in_progress — была гонка между worktree.
→ Потолок итераций review. После 3 итераций одинаковых findings — эскалация, не очереднйо круг.
→ Нормализация определения качества PR. Приводим к канонической форме перед gate.

Второй прогон на аналогичном бэклоге: 21 WS подряд, с первого раза 89%, ~5 часов.

14 → 21. Не х2, но ощутимо.

Локалка не пригодилась 🙁 надо перепридумывать систему воркстримов, для нее слишком жирно

Заодно запилил Session-audit поверх всего
Он парсит JSONL и считает метрики автономии. Прогнал на окне одного дня - больше нету пока 🙁

Итого 28 сессий, 4 659 сообщений, 44 закрытых эпика.

Топ-5 находок
→ Atomic claim — убрал гонку и попытку параллельно взять задачку.
→ Потолок итераций review — без него loop превращался в ловушку придирок.
→ Checkpoint + MAX_FIX_CYCLES — compaction больше не сбрасывает прогресс.
→ Session-audit как зеркало.
→ Боевой бэклог, не синтетика. 15 задач «напиши палиндром» — не стресс-тест.

Важная оговорочка: Прогон 2 — другой кусок бэклога (первый закрыт), сравнимый по структуре, сложности, декомпозиции.

На будущее налячкал себе еще мета-скилл поверх метаскилла, но запускать не решился. /sweep должен делать ВЖУХ по всему бэклогу.

Ссылки:
→ /sweep: https://github.com/fall-out-bug/sdp_lab/commit/baf45b8
→ /deliver: https://github.com/fall-out-bug/sdp_lab/commit/d10153c
→ session-audit: https://github.com/fall-out-bug/sdp_lab/commit/4f6d54f

Критика, мысли и PR — жду! Не отключайтесь.

Showing 10 of 10 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Высоконагруженный кабанчик

Высоконагруженный кабанчик

Рейтинг

Рост участников (Сегодня)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Магазин цифровых товаров YanGoShop(@yangosart)

Финтехстан

Горизонт событий | Event horizon

Новости в 3д сфере. Stl news 3d models. Видео по 3D

Электрион Клуб

TMT Channel

ИнфоТЭК

Афонтово

Похожие каналы Telegram

Магазин цифровых товаров YanGoShop(@yangosart)

Финтехстан

Горизонт событий | Event horizon

Новости в 3д сфере. Stl news 3d models. Видео по 3D

Электрион Клуб

TMT Channel

ИнфоТЭК

Афонтово

Отзывы пользователей (0)

Последние посты