ElKornacio

Public

Просмотреть канал

Не можете присоединиться? @elkornacio

14.9k Участники

Обновлено: May 27, 2026 at 4:52 AM

ElKornacio

Авторский канал про технологии и бизнес. Тут матерятся (и дают качественную аналитику). @sewald

@elkornacio is a dedicated channel for sewald with regular updates in Веб-сериалы

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Последние 12 дней)

Всего: 14.9K

Рост за 24ч: +75 1%

Последние посты

ElKornacio

15 мая 2026 г., 08:59

⚡️ GPT 5.5 вышел как всегда всё подросло на бенчах, новая сота, бла-бла-бла из интересного: модель описывают как хорошего архитектора, с очень высокой четкостью восприятия системы в целом, и способностью планировать. почти все комментарии относительно роста…

10,800

ElKornacio

15 мая 2026 г., 08:59

блин, жутко сложно совмещать перелёты чуть ли не еженедельно, подготовку к свадьбе и жуткий загруз на остальных фронтах, сорри что снова чутка выпал.
но про это я давно хотел запостить, и, наконец, руки дошли.

я уже , что сейчас ИИ-разработка в стадии лютейшего внедрения, черта "это новая реальность" давно пройдена, аксели теперь https://t.me/llm_under_hood в стартапах про встраивание агентов в организационные процессы, а не в новых агентах как таковых.
и компетентностный водораздел в разработке теперь проходит не между "юзает ИИ" и "не юзает ИИ" (такие ещё есть?), а между "глубоко понимает как настраивать и использовать кодинговых агентов, тюнить контекст, настраивать скиллы" и "ну я в Курсоре пишу, таб-таб-таб, мне нраицца, модель Авто топ))" 🙂

и в канале, и на конфах https://t.me/the_ai_architect (надеюсь вы на него давно подписаны) давно и много рассказывает про то как и разрабам освоить использование кодинг-агентов на профессиональном уровне.

так вот! 12 мая у него стартует оч кайфовый 7-недельный курс https://ai.khakhalev.com/r/course-may/: вот прям от азов с базовой подготовкой репы к агентам и до создания полноценных workflow с сабагентами, скиллами, управлением контекстом, и прочим. где-то по 4-5 часов в неделю - видеоуроки, созвоны, практика, все дела, плотненько, но без перебора; решение всяких классических проблем с галлюцинациям, игнором инструкций, ИИ-техдолгом, и прочая мякотка, о которой трудно узнать без большой практики.

зачем я вам про это пишу? там осталось не очень много мест (никаких ссаных "кураторов", Тимур сам ведёт созвоны, поэтому ограничение по кол-ву), и мне кажется, что это ппц релевантная тема для тех, кто хочет глубоко вкатиться в тему кодинга с ИИ.

так что вот! если что - ссылка вот https://ai.khakhalev.com/r/course-may/

P. S. обязательно загляните в комменты к посту 🙂🙂

ElKornacio

15 мая 2026 г., 08:59

📷 Photo

⚡️ https://openai.com/index/introducing-gpt-5-5/

как всегда всё подросло на бенчах, новая сота, бла-бла-бла

из интересного: модель описывают как хорошего архитектора, с очень высокой четкостью восприятия системы в целом, и способностью планировать.

почти все комментарии относительно роста способностей модели в кодинге именно про это - что четкость в архитектуре и проектировании сильно выросли.

чтож, буду тестить, во всех аппах доступ уже получен 🙂

8,800

ElKornacio

15 мая 2026 г., 08:59

📷 Photo

Вышли превью DeepSeek v4:
🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.

Статья https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Архитектурные фичи:
— новые виды аттеншена для поддержки длинных контекстов: CSA и HCA (третья картинка)
— mHC из недавней статьи
— Engram нет
— претрейн на 32Т токенов с Muon, FP4

Играться можно на сайте http://deepseek.ai/
В API тоже есть, $0.14/$0.28 за Flash и $1.74/$3.48 за Pro

8,830

ElKornacio

15 мая 2026 г., 08:59

📷 Photo

у OpenAI стрим, говорят, будет в 22 по Мск, но, кажется, все уже знают, что там будет 🙂

вроде бы GPT Image 2 раскатили уже на всех - слышу отзывы, что даже на бесплатных акках уже доступно.

по отзывам - заметно обгоняет Nano Banana 2 в качестве и точности генераций.

9,990

ElKornacio

15 мая 2026 г., 08:59

📷 Photo

вот шутки шутками, а я такую же историю недавно про стажера слышал.
что взяли, потому что студент-стажер дешевле макс-подписки клода, а работает больше 🙂

8,930

171

ElKornacio

15 мая 2026 г., 08:59

📷 Photo

⚡️ https://openai.com/index/codex-for-almost-everything/

ну и OpenAI естественно не смогли стоять в стороне, и не подрезать немного инфоповод собственной новостью.

универсальную аппку со всеми возможностями одновременно обещали давно, и вот, кажется мы дождались 🙂

тоже будем тестить, жду апдейта, до меня пока не долетело.

10,200

ElKornacio

15 мая 2026 г., 08:59

⚡️Вышел https://www.anthropic.com/news/claude-design-anthropic-labs

кажется, когда фигма просела на 9% - это была реакция рынка не на Opus 4.7, а на инсайды о Claude Design.

надеюсь, на выходных все хорошенько потыкаю и поделюсь фидбеком. агентный дизайн для меня и по сей день большая боль 🧐

12,300

ElKornacio

15 мая 2026 г., 08:59

сам флоу мерджа разбит на следующие шаги:
1. сначала агент принимает решение о сложности мерджа, их три: бесконфликтный (изменения не касаются уникальных фич в этой ветке), легкие конфликты (изменения задевают фичи, но очевидным образом, и легко интегрируются), сложный (изменения сильно связаны с уникальными фичами и требуют заметной модификации).
2. если флоу первый или второй - сразу запускается workflow имплементации.
3. если флоу третий (сложный) то агент обязан сначала разработать план. он заливает его в коммент к пулл-реквесту в GH, и шлёт пуш в телегу. смотрим план, и либо пишем к плану коммент (в большинстве случаев), тогда агент должен переделать план и снова залить в GH как новый пост, или ставим на пост с планом одобрительную реакцию, что триггерит флоу имплементации.
флоу имплементации предполагает довольно потное и детальное тестирование в конце работы, которое в том числе требует, чтобы агент залил скрины всех модифицированных и релевантных экранов/состояний в комменты к пулл-реквесту, написал текстовое саммари проделанной работы, после чего стукнул пуш в телегу.
финальный шаг - отсматриваем скрины/результаты в пуллреквестах в гитхабе, мерджим. если что-то не нравится, прям к пуллу можно написать коммент (коммент летит в ту же сессию агента как требование о доработке).

• какие главные минусы я обнаружил за это время?

сейчас полная отработка всех head-веток занимает почти 3 часа. я оснознанно шёл по пути последовательных агентов вместо параллельных, потому что не хотел париться с настройкой окружения. даже если оно будет занимать 8 часов - меня будет устраивать, это всё равно полностью фоновая работа. если прям сильно упрусь - запараллелить несложно.
иногда очень сильно не хватает возможности дать агенту из одной head-ветки контекст из соседней. на этапе ревью плана я, бывает, уже предыдущему агенту проговорил все косяки, переключаюсь на следующего - и там похожие проблемы. так и хочется сказать "блин, глянь в соседний PR, и учти мои комменты оттуда". в целом, это легко доделать, но руки всё не доходят, приходится копипастить.
флоу заведения новых head-веток пока что полностью ручной (ну разве что первичная имплементация кода от агента). пока их <10 - это норм, но мне бы хотелось чтобы их было 50+, и там без автоматизации можно умереть.

• какие главные плюсы?

да это просто охуенно! 90% мерджей проходит совершенно бесшовно и без моего участия. у меня буквально существует 9 версий продукта, с довольно заметными адаптациями, и при этом скорость разработки не изменилась совершенно, а клиенты счастливы.
кажется, это и есть та самая "гипер-кастомизация", которая ярко выделяет тебя на фоне остальных и впечатляет клиентов. буквально слайд добавили в деку с Джимом Керри из "всегда говори да" 🙂

если этот флоу будет обновляться, буду время от времени делиться апдейтами.

ElKornacio

15 мая 2026 г., 08:59

⚡️ https://x.com/claudeai/status/2044785261393977612?s=20

ох, ну не знаю ребята, сможете ли вы потягаться с instruction following у OpenAI... 🙂

будем тестить!

View on X (Twitter)

16,100

ElKornacio

5 апр. 2026 г., 10:08

заметил, что даже в около-ИИ тусах не все шарят за разницу между UI/harness/model. мне кажется, ситуация ещё усугубляется дегенеративным неймингом (Composer в Composer, Codex в Codex в Codex, вот этот вот весь адок).

оч коротко, и с упрощением (опустим мультимодальности, и прочие ньюансы):
модель - это буквально LLM, "провайдер интеллекта", вы ей на вход даёте текст, она вам в ответ тоже даёт какой-то текст (вызов инструмента - это тоже текст, просто оформленный по особым правилам)
harness - это "среда" вокруг модели: набор инструментов, который модели предоставляется (чтение/редактирование файлов/веб-поиск/etc), управление окном контекста (компактизация, сжатие) и вся низкоуровневая работа с моделью - прокидывание вспомогательной информации и правил в контекст модели, парсинг её текстовых ответов, etc.
UI - это UI. ну то есть то, что вы видите на экране: интерфейс чата, кнопочки, diff views, и прочее.

скажем, у Cursor - своё harness и UI, но чужие модели (есть пара своих - Composer 1 / 1.5, но 90% трафика на модели Anthropic/OpenAI)
а вот у Anthropic всё - модели (Sonnet/Opus), нативный harness ( https://platform.claude.com/docs/en/agent-sdk/overview), несколько UI (extensions для VSCode-like редакторов, Claude Code, Claude Desktop, etc)
и у OpenAI тоже есть всё своё: Codex, Codex, Codex и Codex. ну ладно, если серьёзно: модели (gpt-5.2/gpt-5.2-codex/gpt-5.3-codex/etc), harness ( https://developers.openai.com/codex/app-server/), UI (extensions и Codex App под мак).
OpenCode - нет своих моделей, но зато свой harness и UI (OpenCode CLI / OpenCode Desktop app).

при этом, есть примеры UI-only: скажем, Conductor (чистый UI, использует нативный harness codex app server/claude agent sdk), или JetBrains умеют в UI-only (тоже юзают нативные harness codex app server/claude agent sdk, но при этом умеют ещё и с собственным harness Junie работать).

почему это всё должно быть вам важно?
rule of thumb: нативный harness (то есть когда вы используете модель компании X в harness компании X) в 99% случаев лучше любого не-нативного (то есть модель компании X, а harness компании Y). говорят, что OpenAI буквально до-тренировывает свои модели под их server-side compact-алгоритм, который использует codex-harness (app server).
Anthropic затачивает тулы в Claude Code под то, на что они тренировали свои модели (то как происходит редактирование файлов), ну и так далее.

ну и хорошая иллюстрация по этой теме - уже https://cursor.com/blog/codex-model-harness, где Cursor оправдываются за то, почему в их harness модели OpenAI плохо работали, и как они стараются это исправить.

в общем, старайтесь использовать модели конкретного провайдера в harness от этого же провайдера, а UI выбирайте по вкусу и фичам. и будет вам счастье.

ElKornacio

5 апр. 2026 г., 10:08

оч зашла концепция compound startup из https://www.youtube.com/watch?v=rWUWfj_PqmM
вообще, compound effects это то, на что YC/около-YC тусовка надрачивает регулярно, тот же sama https://blog.samaltman.com/how-to-be-successful

но конкретно в концепте compound startup идея простая - если вы делаете x1.5-2 раза эффективнее участки автономных процессов, вы получаете экспоненту в конце воронки.
ну то есть, буквально: в два раза больше трафика на сайте, в два раза выше конверсия в юзера, в два раза выше конверсия из юзера в продажу = в 8 раз больше профита.
почему про это говорят в контексте агентов и автономных процессов? потому что без них compound effect не сработает - если вы увеличили трафик в 2 раза, а на следующем участке воронки у вас отдел продаж с людьми, то вы быстро создаёте в этой точке боттлнек, и вся система разваливается. в общем, as usual - пропускная способность системы равна худшей пропускной способности среди её частей.
компании в видео говорят как раз об этом: automate as much as possible, keep headcount as small as possible - единственный способ для команды в 2-3 человека конкурировать с корпорациями с 2000-3000 человек.

философствуя на эту тему с товарищем, подумалось: а насколько можно пожертвовать качеством на отдельном шаге в угоду автоматизации?
условно: человек SDR - 100% качества продажи, AI-SDR: к примеру, 20%. но зато исключение human bottleneck из пайплайна, расшивает все остальные участки, и окупается за счёт масштаба. или не окупается? интуитивно кажется, что если на старте автоматизация идёт с максимальной потерей качества, то на выходе можно получить compound типа "1.01 в 10 степени - это 1.1", ато и вообще уйти в <1. с другой стороны - даже с такой неприятной точкой старта, минимальные усиления каждого шага будут давать кратный прирост - 1.02^10=1.2, 1.07^10=2, 1.2^10=6, и так далее

как мне кажется, это очень интересный ракурс на ai-first процессы в компаниях: очень часто говорят под эффектиность и экономию, дескать, ИИ-агент стоит дешевле человека. но динамическая масштабируемость чуть ли не более важное свойство: возможность ad-hoc расширять/сжимать участки процессов, адаптируясь под нагрузку - это та штука, которую почти невозможно делать с сотрудниками из мяса.

ElKornacio

5 апр. 2026 г., 10:08

📷 Photo

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

ну что, поверим что в этот раз у Google получилось что-то, что не стыдно будет юзать для реальных задач?

6,970

ElKornacio

5 апр. 2026 г., 10:08

📷 Photo

я с начала года планировал не участвовать в конфах, но узнав, что ребята из Стратоплана (где я выступал) сколлабились с ребятами из Entropy Talk (где я тоже выступал), отказаться было нереально - я 25 февраля (среда через неделю) залечу на панельку в https://entropy-x-stratoplan.com/?utm_source=elcor.

в целом, скриншот со спикерами выше - лучше любых объяснений. но для формальности:

«AI Hard Fork» — практическая онлайн-конфа о том, как AI меняет процессы разработки, и как управлять этими изменениями. для senior engineers, тех- и тим-лидов, СТО и VP of engineering, фаундеров

старые подходы в IT ломаются, но отделить пользу от шума, когда о нейронках вещает каждый утюг, а инструменты дропаются каждый день – все сложнее.
но если гайды по тулам можно хотя бы загуглить, то вот послушать про реальный опыт внедрения на уровне команд и бизнеса - можно только от практиков.

в программе:
- реальные кейсы успехов и провалов внедрения AI в существующих проектах
- как и где AI меняет управление (в разработке) и что отличает команды, которые успешно внедряют ИИ
- что мешает построению ИИ-центричных организаций, и почему AI-adoption будет только расти

Head of AI и СТО крупных банков, ex-CTO Booking и EM из Mapbox, Степан Гершуни и Глеб Кудрявцев, Артем – ex-Meta и автор «эйай ньюз», со-основатели Школы Стратоплан и идейный вдохновитель Entropy Talk.

24-26 февраля, онлайн или в записи, можно бесплатно, можно платно (для тех кто хочет сертификат)

⚡️ https://entropy-x-stratoplan.com/?utm_source=elcor ⚡️

буду вас ждать!

ElKornacio

5 апр. 2026 г., 10:08

решил пошерить пачку небольших лайфхаков в работе с агентами, в основном про скрипты. думаю, опытным чувакам 90% из этого покажется прописными истинами, но, возможно, кто-то почерпнёт что-то полезное для себя.
сохраняйте, шерьте, кайфуйте 🙂

1. не юзайте TUI в VSCode/Cursor для Claude Code / Codex / etc. мерцания интерфейса и проблемы со вставкой текста (в том числе из голосового ввода) - это не баги самих приложений, а баги tty-среды в VSCode. юзайте нативный терминал.

2. если вы хотите, чтобы агент выполнял одну и ту же цепочку действий - вместо описания цепочки в глобальных правилах лучше просто упакуйте её в bash-скрипт. чем писать "ты всегда должен сделать тайп-чек, билд, прогнать тесты, и потом деплойнуть скрипт", просто попросите агента создать ./check-build-test-deploy.sh, и пропишите этот скрипт в правилах. да, современные агенты неплохо следуют инструкциям, но рандома оч много. иногда агент воспринимает "прогони тесты" как pnpm run test, а иногда он по хардкору начинает писать конструкции типа npx ./node_modules/.bin/jest ... --runInBand ..., и спотыкается. скрипты - гарантия повторяемости (это супер-очевидная штука для вещей, которые приходится делать руками самому, но при этом я часто вижу, что люди не заботятся о том, чтобы обеспечить удобство работы агентам).

3. если вы хотите, чтобы агент после какой-то операции анализировал её результат - прокиньте логи/данные сразу в stdout этой операции. это рифмуется и дополняет предыдущий пункт, если вы юзаете конструкции типа "выполни этот скрипт, после чего прочитай логи в ./abc.log", то поставьте tail -n 50 ... прям в конец скрипта. когда я дебажил ESP-плату, у меня билд-деплой кода были на одном скрипте, а чтение serial monitor - на другом. объединение этого в один скрипт аля "залей новый код, сними логи в течение 15 секунд и верни в stdout" улучшило мою жизнь кратно.

4. правило "агент должен иметь возможность самостоятельно проверить результаты своей работы" известно, наверное, уже всем, но как же часто я вижу нарушения этого принципа с отмазками "ну, у нас такая среда, что не автоматизируешь". классические примеры:
- tauri/electron-приложение: "мы не можем запустить фронт в playwright/встроенном-браузере, надо руками"
- react-native / flutter: "ну, оно в эмуляторе / на телефоне гоняется, надо руками"
- любительский embedded, etc

давайте честно: вам просто влом. за 20 минут работы агента () собирается элементарный runtime-eval-debug сервер, который для веб-приложений позволяет агенту кидать команды напрямую в любую среду (и можно ещё и ключевые части приложения прям в window прокинуть, для удобства). логи из фронта в tauri / electron / react-native / flutter тоже прокидываются минут за 5 (можно связкой "фронт шлёт логи на бек, бек пишет в файл"), без особых проблем. embedded прекрасно умеет слать данные датчиков и дебаг-инфу в serial, а оттуда агент умеет читать.
в общем, не убеждайте себя, чтобы ваша среда уникальная: если действие происходит на вашем компе, и не связано с физическим миром, то автоматизировать можно всё.

5. "ой, я же сказал агенту, что после билда надо перезагрузить страницу, а он забыл, и тестировал старую версию, вот дурашка" - дурашка не он. если надо рестартить что-то после билда - (снова пункт 2) - добавьте это прям в скрипт билда. убирайте все места, где агент может выстрелить себе в ногу: если что-то не может работать без какого-нибудь сервера - вновь же, добавьте проверку на "запущенность сервера" прямо в скрипт. это 1 строчка, и сэкономленные часы.

6. пишите советы агенту прямо в stdout ваших скриптов. скрипт обнаружил, что отсутствует важный файл, необходимый для работы? выведите в stdout не только ошибку, но и информацию о том, что нужно сделать, чтобы этот файл появился. исключайте ситуации, когда агент не понимает, что делать дальше, и должен рисерчить кодовую базу в поисках ответа.

—

кидайте ваши лайфаки в комментах, буду рад что-то для себя почерпнуть 🙂

ElKornacio

5 апр. 2026 г., 10:08

если что - Spark уже доступен в Pro, наслаждаюсь всё утро. скорость и правда имбовая + multiple tool calls тоже завезли (на видео хорошо видно, как он по 3 файла за раз вычитывает)

6,800

ElKornacio

5 апр. 2026 г., 10:08

ой, ребята, я чёт с этим Spark чуть не забыл про реальную важную новость!

конфа ROИИ 2026: вопросы про ИИ, которые интересуют бизнес, от стратегии до ньюансов внедрения.
состав спискеров просто шикарный: от чуваков, с которыми я на днях пил кофе, и радовался, что знаком, до ребят, которые для меня вообще являются эталоном того, как надо исследовать технологии.

на конфе они расскажут инсайты по следующим темам:
- когда "сеньор + AI" действительно дешевле и эффективнее команды, а когда вы тратите меньше на ФОТ, но больше на техдолг и инциденты
• что ломается в процессах при внедрении AI и почему одни и те же инструменты ускоряют одних и тормозят других
- найм: как быть с теми, кто против AI, что делать джунам и каких людей искать в 2026

с практическими примерами и ориентирами, которые можно применить.

всего 11 докладов за два дня (19–20 февраля): от фаундеров, тех-лидов, CPO и Head of AI. цифры, P&L, архитектура и реальные боли внедрения - без воды.

по классике: участие бесплатное при подписке на каналы спикеров (и господи боже, даже если вы не планируете идти на конфу, не быть подписанным на этих ребят - просто странно). но есть и платный вариант (с парой доп. плюшек).

👉 в общем, полная программа конфы на сайте: http://ai-pnl.com/
💌 зарегаться можно через бота, https://t.me/conference_access_bot

7,590

ElKornacio

5 апр. 2026 г., 10:08

⚡️ https://openai.com/index/introducing-gpt-5-3-codex-spark/

ну и ещё одна сочная новость как результат коллабы OpenAI и Cerebras: новая модель на базе 5.3-Codex, > 1000 токенов в секунду (примерно в 5 раз быстрее классической).

контекст - 128k, пока только текст.

на SWE-Bench Pro и Terminal-Bench 2.0 показывает сильные результаты (заметно слабее флагманских моделей, заметно сильнее мини-моделей), но при этом ппц быстрее: улучшена вся latency-цепочка: −80% roundtrip overhead, −30% per-token overhead, −50% time-to-first-token (для WebSocket).

пока превью только для ChatGPT Pro (та, которая 200 баксов).

P. S. у меня пока доступа в Pro нет(

7,200

ElKornacio

5 апр. 2026 г., 10:08

🎥 Video

если что - Spark уже доступен в Pro, наслаждаюсь всё утро.
скорость и правда имбовая + multiple tool calls тоже завезли (на видео хорошо видно, как он по 3 файла за раз вычитывает)

6,600

ElKornacio

5 апр. 2026 г., 10:08

📷 Photo

между тем, Gemini https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/ новый Deep Think

интереснее всего было бы глянуть на hallucination rate - предыдущий Gemini Pro ооооочень сильно тащил по знанию фактов, но ужасно справлялся с реальными агентными задачами.

помимо этого, рассказали про "Aletheia" - свою агентную систему для решения математических задач исследовательского уровня, которая итеративно генерирует идеи решений, сама их проверяет и переделывает (последние два скрина как раз про неё).

не менее интересно описание того, как они решают различные задачки из computer science / экономики / физики. в целом, они даже https://arxiv.org/abs/2602.03837, детально описывающий все их результаты.

P. S. за наводку спасибо подписчику в https://t.me/elkornacio_chat!
P. P. S. интересно, завезут в Antigravity? 🙂

6,830

Showing 20 of 20 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

ElKornacio

ElKornacio

Рейтинг

Рост участников (Последние 12 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Монолит

Бесконечное Лето 🔰410🔰

Сибирский Гештальт

My Car

Канал Алексея Чепы

Bosfor pictures

Ахербия - все про iHerb 💚

Крупнов

Похожие каналы Telegram

Монолит

Бесконечное Лето 🔰410🔰

Сибирский Гештальт

My Car

Канал Алексея Чепы

Bosfor pictures

Ахербия - все про iHerb 💚

Крупнов

Отзывы пользователей (0)

Последние посты