Валера Ковальский

Public

Просмотреть канал

Не можете присоединиться? @neuraldeep

15k Участники

Обновлено: May 11, 2026 at 2:59 AM

Валера Ковальский

Head of AI Engineer | DevOps | Hardware From IT Admin to Head of AI in 6 years Автор https://neuraldeep.ru/ github.com/vakovalskii | chat @neuraldeepchat

@neuraldeep is a dedicated channel for head and hardware with regular updates in Кодинг и программирование

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Последние 13 дней)

Всего: 15.0K

Рост за 24ч: +0 0%

Последние посты

Валера Ковальский

13 мая 2026 г., 08:56

🎥 Video

Запись вчерашнего стрима "Как создавать AI-агентов на on-prem-моделях?".

YouTube: https://www.youtube.com/live/wjA9aPg7pjQ

Telegram: в медиа этого поста

Участники:
1.
2. https://t.me/kdoronin_blog

Паша. На стриме его несколько раз вспоминали:
https://t.me/evilfreelancer

Платформа, с помощью которой тестировали on-prem-модели:
https://hub.neuraldeep.ru/

Презентация – https://t.me/c.

4,110

Валера Ковальский

13 мая 2026 г., 08:56

Мы начинаем нашу трансляцию "Как создавать AI-агентов на on-prem-моделях?"

https://youtube.com/live/wjA9aPg7pjQ?feature=share – подключайтесь!

5,280

Валера Ковальский

13 мая 2026 г., 08:56

📷 Photo

Сброшены недельные лимиты для всех!

Добавлены еще инстансы qwen3.6-35b-a3b (латенси должен упасть)

Обновлены лимиты на free тире

Пол ярда токенов на квен за 2 дня КАРЛ! 🦾

Проработана дока для подключения моделей к агентам https://hub.neuraldeep.ru/docs#agents (теперь там есть огромная кнопка скопировать доку в md, сделаны базовые фиксы responses api

5,560

Валера Ковальский

13 мая 2026 г., 08:56

📷 Photo

После и еще одной встречи с https://t.me/data_intensive_boar пришли к точному выводу что я где-то справа, часть людей еще по середине

UPDATE:

Нашли правильную картинку https://t.me/neuraldeepchat

5,240

Валера Ковальский

13 мая 2026 г., 08:56

С большой GPU большая ответственность

Разберем стек
https://github.com/vllm-project/vllm + https://github.com/BerriAI/litellm + https://github.com/openai/codex

Часть первая, когда у вас много GPU серверов под LLM инференс, а у меня часть в одном офисе, часть в колокейшене (когда арендуешь стойку в датацентре под свое железо, не AWS) и нужно все же понять как сделать одно API окно сверху всего этого, привет https://hub.neuraldeep.ru/ и все наши эксперименты выше =)

В целом это проблема любой связки vLLM + LiteLLM даже если вы заводите это внутри компании, не на продажу

У меня заняло неделю по вечерам найти, и решить проблемы, пройдусь по пунктам чтобы вам было быстрее

Вы так же найдете те же проблема на GitHub vLLM висят открытые issues с января-апреля 2026
# https://github.com/vllm-project/vllm/issues/33089 (multi-turn Responses API),
# https://github.com/vllm-project/vllm/issues/39426 (tool-aggregation protocol drift) десятки людей жалуются на одно и то же, апстрим месяцами не закрывает

Боль набер ван роутинг

LiteLLM по дефолту simple-shuffle или следующий кандидат latency-based routing
Звучит умно выбирает самый быстрый сервер или рандомим
По факту на двух одинаковых инстансах LLM с GPU он залипает на winner-сервер навсегда, второй простаивает в ноль, курит за деньги вашей компании

Включить https://ru.wikipedia.org/wiki/Round-robin_(алгоритм)?
Нельзя
Round-robin для multi-turn агент loop убивает кеш на каждом turn'е попадаешь на другой сервер история пере-prefillится с нуля +5-10s к ответу, песня да?

Нужен sticky session (один user всегда на одном сервере) + балансировка между разными user'ами
Из коробки в LiteLLM такого нет, оно как бы есть но его как бы нет 💀

Решение простое как две копейки главное на него выйти сразу, "custom routing strategy"
180 строк кода
Внутри consistent-hash md5 от api_key_alias, один user всегда на одном сервере
Разные user'ы, разные сервера через равномерное распределение хеша, что делать когда будет требоваться масштабирование дальше? Расскажу в следующих сериях
Сервер в колокейшене ожил (ура) и по логам есть кеш!

Боль набер два кеш умирает без sticky решается первым пунктом и сильно связан с роутингом, но дальше сложнее

Боль 3 Codex CLI шлет нестандартные tool types

Я хочу использовать Codex CLI как агентный харнес в своих экспериментах, с qwen3.6 все просто фиксим протокол и поехали, с gpt oss 120b чуть сложнее так как там что? Правильно harmony =)

Codex CLI отправляет в запрос tools которые vLLM не понимает custom, image_generation, namespace
vLLM на это шлет вам 400 tool type custom not supported, вы оптекаете и думаете что с этим делать
Codex падает на старте, до первой генерации

Лезу в исходники vLLM есть файл harmony_utils.py (harmony это внутренний формат сообщений для gpt-oss моделей, как ChatML для других)
Там whitelist tool types web_search_preview, code_interpreter, container, function
Все
Никаких custom или image_generation 😳

Решение в лоб, bind-mount (монтируете файл с хоста поверх файла в контейнере, апстрим не трогаете) с пропатченным harmony_utils.py
Расширил whitelist на custom, web_search, file_search, image_generation, local_shell, apply_patch, mcp_*
После этого Codex реально начинает работать делает git rev-parse, читает файлы, пишет код

Боль набер 4 Responses API строгая валидация

Responses API это новый OpenAI endpoint /v1/responses (на смену /v1/chat/completions)
С server-side state через previous_response_id
Codex с ним и работает (completions дипрекейтнули еще 2-3 месяца назад)

На каждом turn'е шлет previous_response_id + полный input[] с историей
В истории assistant-айтемы которые vLLM ранее сам сгенерировал
У них нет полей id, status="completed", annotations=[]

По OpenAI-схеме это required-поля
vLLM строгая Pydantic-валидация запрос делает что?
Правильно отлетает
Codex в ступоре
Вы тоже

Решение тот же подход bind-mount пропатченных Pydantic-моделей делаем поля optional с дефолтами

Итого
Кодинг агенты помогли собрать все это в кучу, и локализовать проблемы, да не так элегантно но работает!
Базовый вывод это легко находится через Codex/Claude Code главное тесты и что бы вы понимали что делаете
Все это решилось так же через подробные логи на всех сторонах систем

Затестить все это можно тут https://hub.neuraldeep.ru/docs#agents

Валера Ковальский

13 мая 2026 г., 08:56

📷 Photo

NeuralDeep LLM Hub

Добавлено:

qwen3.6-35b-a3b
Второй инстанс под gpt oss 120b
whisper large-v3-turbo
Возможность в ЛК отключить логирование (тут конечно надо поверить мне на слово)

Обе LLM протестированы с codex/opencode/hermes-agent/kiro/cursor

Осталось 70 регистраций на free тир (добиваем 1к регистраций)

Из-за активного юзеджа зарезал фритир и протир по лимитам
За это время вы закинули 140 000 запросов и затестили все модели из https://hub.neuraldeep.ru/#models
И как-то дали 4 рпс на обе gpt oss 120b

Спасибо, что используете, я продолжаю эксперименты и скоро расскажу про них! Расскажите в комментариях, какие эксперименты провели вы с этой платформой

https://hub.neuraldeep.ru/

6,680

Валера Ковальский

13 мая 2026 г., 08:56

📷 Photo

Расширение каталога на https://hub.neuraldeep.ru/

Сегодня вместе с Валерием () добавили новых моделей в публичной API проекта NeuralDeep. Базовый URL для запросов http://api.neuraldeep.ru/ (OpenAI-совместимо, Bearer с ключом). Ключ можно полчить после регистрации на http://hub.neuraldeep.ru/.

Итого:
- LLM'ки - из коробки через апишку доступны две флагманские модельки gpt-oss-120b и qwen3.6-35b-a3b, их можно крутить в кодовых агентах и чатботах.
- Эмбеддинги - в дополнение к bge-m3 и e5-large добавили русскоязычную https://huggingface.co/ai-forever/FRIDA, мультимодальную https://huggingface.co/jinaai/jina-embeddings-v4 и толстушку https://huggingface.co/Qwen/Qwen3-Embedding-4B.
- Реранкеры - уже была bge-reranker для ранжирования чанков, пригодится для вашего RAGу.
- Голос в текст (ASR) - помимо whisper-1 добавили ещё и https://huggingface.co/evilfreelancer/whisper-podlodka-turbo-GGUF.

Полный список моделей можно посмотреть так:
curl -sS "https://api.neuraldeep.ru/v1/models" \
-H "Authorization: Bearer <ваш-ключ-с-хаба>"

Регистрируйтесь, пользуйтесь, предлагайте свои модельки, поддерживайте рублём, рассказывайте друзьям - нам пригодится любая ваша помощь.

Валера Ковальский

13 мая 2026 г., 08:56

🎥 Video

Расширение каталога на Hub NeuralDeep Сегодня вместе с Валерием (@neuraldeep) добавили новых моделей в публичной API проекта NeuralDeep. Базовый URL для запросов api.neuraldeep.ru (OpenAI-совместимо, Bearer с ключом). Ключ можно полчить после регистрации…

6,290

Валера Ковальский

13 мая 2026 г., 08:56

📷 Photo

Что мешает масштабировать генеративный ИИ

В red_mad_robot мы регулярно проводим https://learn.redmadrobot.com/ai-ready-tech для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе.

Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.

О том, как проходить этот этап, узнали у Head of AI red_mad_robot и CTO AI red_mad_robot https://t.me/silent_ai_cto. Они как раз и ведут программу AI-Ready 🔗

#AI_moment #роботайм

↗️ https://t.me/Redmadnews

6,800

Валера Ковальский

13 мая 2026 г., 08:56

📷 Photo

Как создавать AI-агентов на on-prem-моделях?

Как меняется создание пайплайна, когда мы переходим на локальные модели?

Что вообще может этот ваш Qwen на 4B по сравнению с GPT-5.5?

Чтобы ответить на эти (и многие другие) вопросы максимально-качественно, основываясь на большом практическом опыте, я попросил присоединиться к стриму .

Все, кому были неудобны стримы по субботам, возрадуйтесь!

Стрим будет во вторник, 5 мая в 16:00 мск.

Проведём его на моём https://www.youtube.com/@kdoronin_blog_ru.

Чтобы добавить событие в календарь, https://calendar.app.google/qL5SjTPS6qXTeYmb7.

Задавайте вопросы в комментариях. Обязательно ответим на них на стриме!

6,300

Валера Ковальский

3 апр. 2026 г., 10:09

Channel name was changed to «Валейро Ковальский»

Валера Ковальский

3 апр. 2026 г., 10:09

📷 Photo

Кто угадает что за карта приехала(надо полные спеки угадать), тому в подарок отправлю 2080ti (11gb, по РФ)

А так теперь у нас в контуре с Пашей пополнение =)

Победитель найден это была 4090 (48гб)

UPDATE: В след раз будем решать задачки, и разыграем пару новых 5070, следите за апдейтами, лучше включить уведомления (там уже будет задача по интереснее)

5,160

Валера Ковальский

3 апр. 2026 г., 10:09

Не курс. Не тул. Флоу.

Валера где твой курс по AI кодингу?
Или: Валера почему мы до сих пор не увидели крутой AI coding инструмент от тебя? (с 1 млн звезд на гите =)
Отвечаю

Я в первую очередь DevOps/Hardware инженер
Во вторую руководитель R&D команд
Так начиналась моя карьера и дальше я оброс разными инструментами которые вы так же используете сейчас
Но у меня есть плотная основа, я выдели только небольшую часть моих хард скиллов которые я качал до эры AI

Базы данных
Linux
Docker
Kubernetes
Транспорт: TCP/IP.
Сети, шлюзы, протоколы, маршрутизаторы.
Кодинг с 0 с учителем, ООП и всё что с ним связано.
Считаю что умею задавать вопросы, критически мыслить и быстро анализировать и запоминать поступающую информацию

Так вот

Я не хочу и не буду продавать вам тут курсы где вы поменяете деньги на возможность в момент уменьшить FOMO

Не хочу и не вижу смысла пилить свои универсальные тулы для кодинга или обозревать очередной тул который как-то там "круто" собрал вам спеку, потому что вы не понимаете как работает какая-то часть вашего пирога и надеетесь покрыть это тестами или доками

Я показываю как делегирую рутину и творю, именно по этому вы видите очень много open source от меня https://github.com/vakovalskii это моя цель!

Вот что я собрал за последние пару месяцев:

https://vamplabai.com/ — 1 терминал, создание архитектуры 1ч, создание документации 2дня (руками)
https://github.com/vakovalskii/topsha — 2 терминала, создание архитектуры 0.3ч, создание документации 40 минут (руками)
https://github.com/vakovalskii/ValeDesk — 2 терминала, создание архитектуры 0.1ч, создание документации 10 минут (руками)
https://github.com/vakovalskii/copyosity — 1 терминал, создание архитектуры 0.2ч, создание документации 20 минут (руками)
https://github.com/vakovalskii/LocalTaskClaw — 1 терминал,создание архитектуры 0.15ч, создание документации 1час (руками)

Все эти проекты объединяет один и тот же подход:

1. Генерируем план руками
1.1 Рисуем архитектуру хоть на бумажке
2. Создаем директорию проекта
3. Выбираем таргет сервер или если десктоп апп, билд через GitHub Actions
4. HITL генерация и поэтапные тесты, документация в /docs
5. Документирование после завершения цикла разработки (фича/пр/вы решили что сервис готов)

Один или два терминала
Единый пайплайн на всё
Минимальный набор плагинов только то что ускоряет или автоматизирует работу в CC или Codex

Не работает фича?
Я точно знаю где
Помните мой бэкграунд?
Не знаю? LLM помогает найти проблему потому что я знаю куда направить =)

Если разложить слоёный пирог решений который почти все мы делаем, это фреймворки над базой данных

Слой данных
Слой транспорта и модификации, API
Слой UI

Вайбкодинг это инструмент ускорения меня и моих команд в поиске оптимальных решений, как технических так и бизнесовых

Никуда не пропала и не пропадет валидация через людей на проде
Всё ещё нужно на проде отсматривать каждый PR
Всё ещё в критичной инфраструктуре нужно проверять код руками.
И это 2026 год
И да все еще нужно думать и качать мозг!

Но то что мы имеем сегодня, это инструмент ускорения до определённых стадий
А дальше ты, твой бэкграунд, и понимание всех слоёв пирога

Хорошо об этом написал https://t.me/nobilix буквально пока я писал этот пост по пути в такси: "узкое горлышко не в скорости, а во внимании и осознанности
Автоматизируй рутину, не мышление."

Цена делегирования мышления это когнитивный долг: ты потом переделываешь потому что не можешь развивать то чего не понимаешь

Я делегирую рутину. Всю когнитивную часть, архитектуру, решения, декомпозицию я делаю сам
Я не говорю агенту "сделай круто документацию и придумай за меня реализацию"
Я создаю через ИИ то что придумал, и агент ускоряет исполнение


Самое важное что за этим флоу мы можете проследить в моих репозиторих или скормить их LLM ке, пускай вам подскажет
Кстати для прокачки базы все еще советую очень полезный сайт https://roadmap.sh/devops

И самый короткий курс от меня все же будет он https://www.google.com/search?q=claude+code+download&oq=claude+code+&gs_lcrp=EgZjaHJvbWUqDAgAECMYJxiABBiKBTIMCAAQIxgnGIAEGIoFMhQIARBFGDsYQxiDARixAxiABBiKBTIMCAIQIxgnGIAEGIoFMhIIAxAAGEMYgwEYsQMYgAQYigUyDQgEEAAYgwEYsQMYgAQyBggFEEUYPTIGCAYQRRg9MgYIBxBFGDzSAQg5Njk4ajBqN6gCALACAA&sourceid=chrome&ie=UTF-8

Валера Ковальский

3 апр. 2026 г., 10:09

pinned «Не курс. Не тул. Флоу. Валера где твой курс по AI кодингу? Или: Валера почему мы до сих пор не увидели крутой AI coding инструмент от тебя? (с 1 млн звезд на гите =) Отвечаю Я в первую очередь DevOps/Hardware инженер Во вторую руководитель R&D команд Так…»

Валера Ковальский

3 апр. 2026 г., 10:09

📷 Photo

Я же не отъехавший?)

UPDATE: Фотку починили спасибо https://t.me/andrewkiryushkin

Оригинал: https://t.me/neuraldeepchat

6,260

194

Валера Ковальский

3 апр. 2026 г., 10:09

NeuralDeep добавлен раздел tools

Теперь есть список cli тулов для ваших задач, база будет пополнятся

Так же добавлю раздел mcp серверов куда попадут публичные и рабочие сервера для ру сегмента

https://skillsbd.ru/tools
https://skillsbd.ru/mcp

5,700

Валера Ковальский

3 апр. 2026 г., 10:09

NeuralDeep

База знаний для AI разработчиков

+ Случился ребрендинг

Буду стаскивать сюда все проверенные и рабочие вещи
Скиллы
МСП
CLI

Наши проекты с Пашей (open source) весь
Фокус на РУ сегменте


https://neuraldeep.ru/

И кстати проект open source все тоже самое можно повторить у себя в компании!

6,360

Валера Ковальский

3 апр. 2026 г., 10:09

📷 Photo

NeuralDeep 😂

В нашем AI чатике друзей ребята накинули а чего нет такого https://skillsbd.ru/ в РФ как http://skills.sh/?

Где будут собранны скиллы вокруг наших РФ сервисов для любых агентов в знакомом формате установки для кодинг агентов

Представляю вашему вниманию https://neuraldeep.ru/

Навыки для работы с Яндекс, Битрикс, 1С и другими российскими сервисами. Устанавливайте одной командой, делитесь с RU-комьюнити

Есть простые проверки безопасноти (буду развивать сканнеры)

Есть скиллл find-skills который упаковывает всю бд в мощный поисковик

Модерация новых навыков ручная (будем так же автоматизировать)

На сегодня залил топ 3 скилла
https://skillsbd.ru/skill/4f21f21f-8ff6-456f-be9c-92fe2c4ba56e
https://skillsbd.ru/skill/e35d5e86-c562-4d21-b506-5801408d3095
https://skillsbd.ru/skill/6554bec3-a646-4106-8bfa-648b4114283b сервисов

Любой может зарегистрироваться через гитхаб и тут же залить свой скилл через гитхаб и формат claude-skill

Чем отличается и будет отличаться

С этого канала стартует комьюинити вокруг данной БД + я сам лично буду продолжать поддерживать ряд навыков + уже залил навыки от части блогеров кто специализируется на работе с ними эври дей!

Навайбкожено от части из за задержки рейса Сочи>СПБ на 6 часов

Stay Tuned!

Валера Ковальский

3 апр. 2026 г., 10:09

NeuralDeep 😂 В нашем AI чатике друзей ребята накинули а чего нет такого аналога в РФ как skills.sh? Где будут собранны скиллы вокруг наших РФ сервисов для любых агентов в знакомом формате установки для кодинг агентов Представляю вашему вниманию https…

7,050

101

Валера Ковальский

3 апр. 2026 г., 10:09

pinned «NeuralDeep каждому в дом Я тут подумал, и решил выложить в open-source проект что бы каждый в свой дом мог занести такое решение локально и использовать во благо стандартизации =) Так же приглашаю всех желающих развить проект через форк + pr (добавить mcp…»

Showing 20 of 20 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Валера Ковальский

Валера Ковальский

Рейтинг

Рост участников (Последние 13 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Albinasummer

PM работа. Проектные менеджеры

Русский Модный Код

Литературный коД

Компьютерная математика Weekly

AI Projects

ReLab Family

Книги по программированию

Похожие каналы Telegram

Albinasummer

PM работа. Проектные менеджеры

Русский Модный Код

Литературный коД

Компьютерная математика Weekly

AI Projects

ReLab Family

Книги по программированию

Отзывы пользователей (0)

Последние посты