Manvel's Channel

Public

Просмотреть канал

Не можете присоединиться? @manvel_ch

791 Участники

Обновлено: May 11, 2026 at 2:39 AM

Manvel's Channel

Все мнения мои собственные. Написать автору: @andthenagain. http://manvel-robotics.com

@manvel_ch is a growing community focused on httpmanvelroboticscom and andthenagain and related topics

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Последние 12 дней)

Всего: 791

Рост за 24ч: +0 0%

Последние посты

Manvel's Channel

13 мая 2026 г., 09:55

📷 Photo

Отличный доклад Antonin Raffin (автор SB3/SBX) про последние результаты в обучении с подкреплением для непрерывного управления:

Recent Advances in RL for Continuous Control (SOTA) - Early 2026 Update
https://araffin.github.io/talk/rl-sota-2026-mannheim/

Также классные обзорные/исторические статьи:

RL102: From Tabular Q-Learning to Deep Q-Learning (DQN)
https://araffin.github.io/post/rl102/

RL103: From Deep Q-Learning (DQN) to Soft Actor-Critic (SAC) and Beyond
https://araffin.github.io/post/rl103/

Последняя особенно хорошо рассказывает про логику развития DQN -> SAC, объясняет на первый взгляд странные особенности SAC (почему несколько Q-networks, зачем target networks, почему энтропия в Q-values и т.д.)

P. S. На рис. — вся суть RL )

766

Manvel's Channel

13 мая 2026 г., 09:55

📷 Photo

Это уже:
1) reinforcement learning — обучение политики в симуляторе,
2) imitation learning — окружающий мир отличается от симулятора и я продолжаю обучение политики на реальных данных,
3) 2d lidar + vision — более шумные и менее полные данные на входе.

Например, на одной из улиц есть велодорожка, которая является частью тротуара. Между велодорожкой и самим тротуаром есть тонкий поребрик. Робота это сбивают с толку, ему кажется, что он едет на очень узком тротуаре, а рядом — дорога.

Пока открытый вопрос — сколько мне нужно будет данных для imitation learning и как оптимального его построить.

Прогресс большой, но работы еще много.

P. S. Операторское мастерство оттачиваю )

472

Manvel's Channel

13 мая 2026 г., 09:55

Исходники Claude Code утекли!
https://github.com/instructkr/claw-code (оригинальный репо, здесь уже порт на Python, см. ниже)
https://github.com/nirholas/claude-code

~1900 файлов, 512k+ строк TypeScript.

Среди интересного: вся оркестрация вызовов LLM, стриминг, кэширование, мультиагентная система с разветвлёнными подагентами, скрытые пока фичи и проч. и проч.

Я всегда был сторонником точки зрения, что код бесполезен без людей, опыта, инфраструктуры, знаний. Но теперь мы живем в другом мире:
1) берем исходники Claude Code
2) берем сам Claude Code
3) ...
4) PROFIT!

Студент, который обнаружил утечку уже решил "переписать все на Python/Rust" (защита на случай легальных проблем). С момента утечки прошло меньше суток.

Наверняка попробует на этом хайпе продать кому-нибудь свою поделку (название репо уже намекает).

744

Manvel's Channel

13 мая 2026 г., 09:55

🎥 Video

Чему научился ИИ, когда я сделал робота невидимым для пешеходов в симуляторе, и переезд на JAX

Уже рассказывал выше о своей борьбе с PyTorch + SB3. Решил в какой-то момент переписать всё на JAX + RLax — ведь у JAX есть vibrant RL ecosystem и это будет очень легко, так ведь? Совсем нет.

Оказалось, что ни одна из библиотек мне не подходит полностью: у меня очень дорогое окружение и мне надо собирать наблюдения асинхронно. В конечном итоге, реализация SAC на основе CleanRL занимает всего пару сотен строчек. Сказано — сделано. JAX оказался приятнее и клевее (трудно это описать), чем PyTorch, почему-то им приятнее пользоваться. Единственное — пришлось немного побороться за разделение VRAM между симулятором (самописный, на Vulkan), CV (который на PyTorch всё ещё) и RL (это уже на JAX). В целом JAX крутой, буду переходить на него.

На видео — робот научился лучшим техникам defensive driving: держится подальше от этих пакостных пешеходов, тормозит и ждёт, пока они пройдут. Всё это выученное поведение, ну красота!

1,160

Manvel's Channel

13 мая 2026 г., 09:55

После годового саббатикала (честно говоря, больше возился с роботами) — открыт для работы на 1 день в неделю.

У меня необычно широкий профиль: от производительности и железа до AI и research — понимаю системы от кремния до моделей.

За плечами 20 лет в IT — Google, Yandex, Sber, AMD. Руководил командами до 100+ человек.

Открыт и для других предложений, включая игру на электрогитаре, довольно среднюю)

Пишите в личку ( https://t.me/andthenagain) если что-то придет в голову.

1,220

Manvel's Channel

13 мая 2026 г., 09:55

📷 Photo

У меня только что было серьёзное обсуждение нетривиальной проблемы в коде с Codex, мы рассмотрели несколько решений и исправили код. Я просто в восторге — если это не AGI, то что?

Мы обучаем RL-политику с SAC для управления роботом. В какой-то момент обучение очень сильно тормозится: один шаг занимает минуты. Инструментируем код — ничего, просто эпизод внезапно заканчивается. В логах нет сообщений об ошибках. Проверяем, что у нас никуда не девается stderr, вроде живой. Вспоминаю, что с одним симулятором все работало. Вспоминаю, что когда у нас был более легкий симулятор, то все работало.

Я догадываюсь, в чём дело: у меня есть набор симуляторов, из которых я сэмплю выборку. Когда эпизод заканчивается, перезапуск симулятора требует 20 секунд. Из-за этого шаг симуляции становится большим: если робот в другом симуляторе делает что-то нетривиальное, то теперь заканчивается его эпизод, и мы каскадно перезапускаем симуляторы вместо обучения.

Codex подозрительно фыркает.

Я предлагаю решение — просто не сэмплить из симулятора, пока он грузится. Codex читает код и говорит, что SB3 так не умеет. Говорит: давай просто робот в симуляторе подождёт — «зависнет» если нет новых команд 200 мс.

Объясняю ему, что так нельзя: у нас много потоков и процессов, и они все смотрят на часы. Что у физических объектов есть инерция.

Обсуждаем суррогатные часы, решаем, что так нельзя. Рассматриваем разные варианты.

Он ещё раз читает код и находит, что в симулируемых датчиках (в отличии от настоящих!) время измеряется один раз за шаг в одном месте. Я совсем забыл про это, но я же молодец, что сделал именно так! И это большая удача сейчас!

Он говорит: «Так давай заклампаем dt — и всё». Вспоминаю, что у нас dt в двух разных местах. Долго клампать и можно ошибиться.

Говорю: «Давай, дорогой, будем сами сэмплить dt из распределения и отправлять в нужные места». (И сможем быстрее риалтайма симуляцию делать!)

Все заработало!

Manvel's Channel

13 мая 2026 г., 09:55

🎥 Video

Поговорил с несколькими командами, которые занимаются роботами-доставщиками. Железо у меня довольно простое, но я делаю ИИ мирового уровня.

Очень вдохновился. Впереди много интересного.

Если не грузится видео: https://demo.manvel-robotics.com/

963

Manvel's Channel

13 мая 2026 г., 09:55

📷 Photo

Чудо технологии: 4d-лидар Unitree L2.

Минимальное расстояние измерения -- 5 см, свет пролетает его меньше чем за наноскунду. Устройство может измерить даже такой временной промежуток и посчитать из него расстояние.

Лидар генерирует карту расстояний до препятствий в полусфере, выдавая 64 тыс. точек в секунду.

Есть лидары, которые умеют еще больше -- измерять скорость (проекцию, если быть точнее) используя Доплеровский эффект, для этого лидара хватает пост-обработки из-за большого количества измерений.

И это все за несколько сотен долларов.

P. S. Перегревался, пристроил кулер)

795

Manvel's Channel

13 мая 2026 г., 09:55

📷 Photo

Firebird AI собираются построить в Армении кластер из 50 тыс. GPU, включая 41 тыс. флагманских NVIDIA GB300 [1][2].

Это будет один из пяти крупнейших кластеров в мире. Такое количество сравнимо с кластерами OpenAI и Anthropic.

США выдали компании лицензию на экспорт (похожие лицензии были у ОАЭ, например).

Общий объем инвестиций составит $4 млрд., это при годовом ВВП страны в $30 млрд.

[1] https://www.firebird.ai/firebird-us-government-announce-phase-2-armenia-ai-megaproject-scaling-to-4-billion-50000-gpus-2026
[2] https://www.bloomberg.com/news/articles/2025-11-19/ai-startup-firebird-gets-us-approval-to-use-nvidia-chips-in-armenian-data-center?embedded-checkout=true

828

Manvel's Channel

13 мая 2026 г., 09:55

📷 Photo

Хотел бы раскрыть карты: последние месяцы я занимался прикладными исследованиями в автономной навигации для доставочных роботов. Основной вопрос: можно ли с помощью AI компенсировать дешёвое оборудование и сделать функционального робота дешевле $500?

У меня есть несколько прототипов, обсуждаю пилот с локальными партнёрами (продуктовые сети и рестораны). Хочу проверить юнит-экономику, предположения и операционные процессы в реальных условиях — московская зима, тротуары, препятствия.

Технически это — невероятно интересный челлендж: автономная навигация в сложных условиях и высокой долей неопределенности, баланс между автономностью и контролем.

Буду делиться техническими находками и процессом здесь. Буду рад обсудить и вообще пообщаться.

P. S. На фото — один из прототипов на начало зимы.

1,300

Manvel's Channel

3 апр. 2026 г., 10:57

🎥 Video

Слежу за open-source гуманоидным роботом Asimov [1].

Пока, правда, сделали только ноги, но они уже ходят.

Запчасти стоят меньше $10k, а весь робот будет стоить $25k.
Основные цели проекта — модулярность, распределенное производство и биореализм, очень интересно [2][3].

Как это все здорово! Какие молодцы!
Гуманоидный робот — это не что-то заоблачно дорогое и еле работающее.

Еще open-source проекты в робототехнике в [4].

[1] https://asimov.inc/
[2] https://news.asimov.inc/p/how-we-built-humanoid-legs-from-the
[3] https://github.com/asimovinc/asimov-v0
[4] https://robotics.growbotics.ai/

798

Manvel's Channel

3 апр. 2026 г., 10:57

📷 Photo

Решил отреставрировать кое-что из раннего творчества с Claude, очень впечатлен.

Например, дисковая хеш-таблица https://github.com/mnvl/diskhash (персистентное хранилище ключ-значение).

Claude:
1) нагенерил биндинги и документацию для Python,
2) добавил функционал итерации, хотя вся структура данных и алгоритмы придуманы мной,
3) написал многопоточный HTTP-сервер с шардированием (теперь это — NoSQL СУБД, пусть кто-то попробует меня переубедить),
4) написал тесты и сделал небольшой рефакторинг.

Из минусов — Claude посадил пару некритических багов и приходилось его подгонять, чтобы не ленился).

В целом — очень продуктивно, качество кода выросло значительно за последние месяцы.

P. S. Кстати, представьте, что у вас есть хеш-таблица, например std::unordered_map<> или dict(). Как из нее сделать многопоточную, чтобы несколько потоков могли одновременно менять ее, почти не мешая друг другу?

853

Manvel's Channel

3 апр. 2026 г., 10:57

📷 Photo

103 тыс. случаев рака будет будет вызвано 93 млн. компьютерными томографиями сделанными 63 млн. пациентам в 2023 году в США — вывод новой статьи в JAMA [1].

Метод такой:
1) ученые экстраполировали данные по КТ-исследованиям из нескольких сотен госпиталей;
2) оценили полученные дозы радиации;
3) использовали рисковые модели для определения вероятности возникновения рака в течении жизни.

Больше всего случаев рака возникнет из-за КТ-исследований груди, живота и таза (см. рис.)
Сколько таких диагнозов — это уже много? 10 тыс. или миллион? Когда польза перевешивает вред?

Также удивительно как много случаев благодаря КТ-исследованиям всего тела — насколько я понимаю, бесполезной процедуре, особенно для здоровых людей [2].

Здесь мне вспоминается "эпидемия рака щитовидной железы в Корее", когда из-за сверхдиагностики рака множество пациентов проходили травматизирующее лечение, при этом смертность оставалась на том же уровне (см. рис.) [3].

[1] https://jamanetwork.com/journals/jamainternalmedicine/fullarticle/2832778
[2] https://www.fda.gov/radiation-emitting-products/medical-x-ray-imaging/full-body-ct-scans-what-you-need-know
[3] https://www.nejm.org/doi/full/10.1056/NEJMp1409841

Manvel's Channel

3 апр. 2026 г., 10:57

Python, самый популярный язык программирования в мире, обзаводится just-in-time компиляцией и избавляется от global interpreter lock на 34 году жизни! Довольно большие новости.

Global interpreter lock позволяет только одному потоку кода работать в каждый момент времени. У вашего процессора скорее всего от 4 до 64 ядер, Python может использовать только одно. Есть, правда, довольно неудобные и ограниченные способы обойти эту проблему — использовать процессы вместо потоков (процессы не видят внутреннего состояния друг друга и их довольно неудобно синхронизировать), либо использовать библиотеки типа Numpy, которые могут одну операцию над большими объектами выполнять с использованием нескольких ядер.

Теперь у нас появляется возможность в экспериментальном режиме запускать код параллельно. Я вообще не уверен какая часть кодовой базы Python сможет с этим работать... ведь до этого можно было писать так, как будто race condition не существует (какая приятная версия мультивселенной!)

Just-in-time компиляция генерирует машинный код (который и исполняет процессор) прямо во время работы программы. На данный момент, интерпретатор Python генерирует псевдокод, который потом выполняет другая программа — и это накладывает кучу дополнительных расходов и значительно замедляет код. Здесь тоже есть неудобные и ограниченные способы обойти эту проблему — Numba (JIT для подмножества Python) или Cython (писать часть функций на языке, который потом транслируется в C и компилируется). Есть еще PyPy с работающим уже JIT-компилятором, но его поддерживает ограниченное подмножество библиотек.

Когда переход закончится, огромное количество программного обеспечения мира начнет работать быстрее, требовать меньше ресурсов и, буквально, электричества. Забавно будет прикинуть сколько тераватт сэкономит этот переход.

Еще одно напоминание того факта, что есть по-настоящему сложные и очень важные инженерные задачи, с которыми не удается справится буквально десятилетиями. Где же Cursor и GitHub Copilot, может они нам помогут их решить?

[1] https://docs.python.org/3.14/whatsnew/3.14.html
[2] https://docs.python.org/3/whatsnew/3.13.html

Manvel's Channel

3 апр. 2026 г., 10:57

📎 File

А еще у меня теперь есть статья с самой Черниговской!

Изучали как мозг реагирует на обратную связь в зависимости от канала: онлайн или лично. Если коротко, то в онлайн реакция более шумная)

657

Manvel's Channel

3 апр. 2026 г., 10:57

Стал практиковать дофаминовое голодание [1] с максимально положительными результатами.

С пробуждения до 16:00 работаю, читаю, делаю сложные-неприятные-тяжелые дела.
После 16:00 проявляется мистер Хайд и смотрит ютуб, играет в компьютерные игры, занимается думскорллингом и даже может выпить бокал вина.
У меня в календаре прям события есть, чтобы структурировать время.

Забавно, что есть куча критики этого метода, которая completely misses the point and addresses the wrong things [2][3].

[1] https://en.wikipedia.org/wiki/Dopamine_fasting
[2] https://www.health.harvard.edu/blog/dopamine-fasting-misunderstanding-science-spawns-a-maladaptive-fad-2020022618917
[3] https://www.hse.ru/expertise/news/1063288859.html

932

Manvel's Channel

31 мар. 2026 г., 06:52

Achievement unlocked: мы с партнерами сделали технологию для определению симптомов варикоза по фото и продали большой корпорации.

P. S. Пошел на ДомКлик присматривать остров в Тихом океане ))

[1] https://www.linkedin.com/feed/update/urn:li:activity:7302303717641351169/

[2] https://servier.ru/dlya-pacientov-s-varikozom-i-gemorroem-stali-dostupny-online-servisy-kotorye-delayut-pervyj-shag-k-lecheniyu-legche-i-udobnee

586

Showing 17 of 17 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Manvel's Channel

Manvel's Channel

Рейтинг

Рост участников (Последние 12 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Монолит

Бесконечное Лето 🔰410🔰

Сибирский Гештальт

My Car

Канал Алексея Чепы

Bosfor pictures

Ахербия - все про iHerb 💚

Крупнов

Похожие каналы Telegram

Монолит

Бесконечное Лето 🔰410🔰

Сибирский Гештальт

My Car

Канал Алексея Чепы

Bosfor pictures

Ахербия - все про iHerb 💚

Крупнов

Отзывы пользователей (0)

Последние посты