Нейроканал

Public

Не можете присоединиться? @neuro_channel

10.5k Участники

Обновлено: May 26, 2026 at 3:55 AM

Нейроканал

Искусственный интеллект, нейросети, машинное обучение Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels Сайт: https://tprg.ru/site Идентификатор РКН № 6939002493

Follow @neuro_channel to stay updated with the latest httpstprgrusite and httpstprgrurules trends and news

Рейтинг

Глобальный рейтинг

#11303

-95

Рейтинг по языку

#7836

-72

Рейтинг по категории

#244

Рост участников (Последние 19 дней)

Всего: 10.5K

Рост за 24ч: +150 1%

Последние посты

Нейроканал

17 мая 2026 г., 14:12

📷 Photo

Anthropic продолжает себя закапывать ужесточать правила. С 15 июня у всех платных планов Claude появятся отдельный баланс в долларах для программного использования. Он будет тратиться на Agent SDK, claude -p, GitHub Actions и сторонние приложения на базе SDK.

Размер этого баланса зависит от плана: $20 на Pro, $100 на Max 5x, $200 на Max 20x, $100–$200 на Team и Enterprise. Баланс не переносится на следующий месяц, и при исчерпании нельзя перейти на общие лимиты подписки. Нужно покупать extra usage по стандартным API-тарифам.

Раньше SDK и неинтерактивные инструменты работали через общие лимиты подписки. Пользователи оценивали реальную стоимость такого доступа на сотни и тысячи долларов в месяц. Теперь это жёсткий лимит, привязанный к цене плана.

Реакция сообщества, конечно же, https://www.reddit.com/r/Anthropic/comments/1tcccar/its_official_anthropic_pulled_the_plug_on_all/. Причём особенно раздражает, что Anthropic подаёт изменение как упрощение и расширение возможностей, тогда как фактически речь идёт об урезании.

Ещё один повод перейти на codex. Очень, конечно, странно, как это всё меняется. Никогда бы не подумал, что буду агитировать за OpenAI. Впрочем, они скорее всего тоже будут резать лимиты, просто у них запасы инвестиций больше.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

1,500

Нейроканал

17 мая 2026 г., 14:12

[poll]

1,560

Нейроканал

17 мая 2026 г., 14:12

📷 Photo

12,400

Нейроканал

17 мая 2026 г., 14:12

Недавно про способ экономии токенов за счёт делегирования части задач более дешёвым и доступным моделям, например Kimi-K2.6.

Последнюю неделю тестировал этот подход. Внедрил в Claude и Codex. И это сработало просто магически! Всем могу рекомендовать.

Лимитов хватает на неделю, качество решений на субъективный взгляд не пострадало, а может даже стало лучше, потому что у агентов появилось больше инструментов для условно-бесплатной валидации решений и более частых ревью. Подписка на Kimi даёт много токенов, основные траты лимитов идут туда. Потратить там их практически нереально. Плюс Kimi хорошо делает исследовательские задачи, гуглит и собирает инфу, проводит обзоры репо. А это тоже кучу токенов кушает.

Конкретные скилы не выкладываю, верю что каждый может сам с текущими агентами это сделать, просто описав подход. Скажу только, что у меня получилось много скилов т.е. я не только I/O задачи на кими свалил, а в целом перевёл Claude и Codex в режим супервайзера по умолчанию. Основной агент держит цель, ведёт список задач, но руками редко вмешивается, просто отправляет подходящего агента. Иногда это дорогой Opus, но в 90% случаев кими справляется.

В общем, рекомендую, мне кажется все эти новомодные /goal как косвенное подтверждение подхода считаются. Один агент управляет другими, это тренд, который реально себя оправдывает.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

1,500

Нейроканал

17 мая 2026 г., 14:12

Топ трендов HuggingFace за неделю — разбираем, что нового

TL;DR

Новое: ZAYA1-8B — 8,4B/760M MoE от Zyphra, бьёт модели в 10 раз больше. MiniCPM-V-4.6 — 1B мультимодалка для телефона. HiDream-O1-Image — #8 в Arena, open-source T2I лидер. Gemma 4 MTP assistants — ускоряют Gemma в 3 раза. OmniVoice — TTS на 600+ языков, 2,2M загрузок. Supertonic-3 — TTS на 31 язык, на CPU. LTX2.3-10Eros — I2V merge.

Держится: DeepSeek V4, Qwen 3.6, Gemma 4, Sulphur-2, Privacy Filter, SenseNova-U1.

LLM

http://huggingface.co/Zyphra/ZAYA1-8B — 8,4B/760M активных, MoE от Zyphra, обучена end-to-end. GPQA 71, MMLU Pro 74,2, AIME ’25 93,1. Конкурентоспособна с моделями в несколько раз больше себя, включая frontier-scale reasoning models. Лезет на устройство, работает в test-time compute harnesses. 66K загрузок, 10 квантизаций уже на HF. Apache 2.0.

Мультимодал и edge

http://huggingface.co/openbmb/MiniCPM-V-4.6 — 1B, мультимодальная модель для edge и телефонов. SigLIP2-400M + Qwen3.5-0.8B LLM. Использует в 19 раз меньше токенов, чем Qwen3.5-0.8B, при лучшем скоре на Artificial Analysis Intelligence Index (13 vs 10). LLaVA-UHD v4 сокращает FLOPs визуального энкодинга на 50%. iOS, Android, HarmonyOS, все адаптации открыты. vLLM, SGLang, llama.cpp, Ollama. Apache 2.0.

Изображения

http://huggingface.co/HiDream-ai/HiDream-O1-Image — 9B, unified image generative model. Pixel-level Unified Transformer (UiT) без внешних VAE и text encoders. Кодирование сырых пикселей, текста и условий в одном token space. Text-to-image, image editing, subject-driven personalization до 2048х2048. #8 в Artificial Analysis Text to Image Arena, лидер среди open weights T2I. Есть http://huggingface.co/HiDream-ai/HiDream-O1-Image-Dev и Reasoning-Driven Prompt Agent. MIT.

Ускорители для Gemma 4

Gemma 4 MTP assistants — Multi-Token Prediction drafters для speculative decoding. Маленькие модели предсказывают несколько токенов вперёд, большая Gemma 4 верифицирует параллельно. Ускорение до 3х без потери качества. Для 31B: http://huggingface.co/google/gemma-4-31B-it-assistant, 66,6K загрузок. Для 26B A4B: http://huggingface.co/google/gemma-4-26B-A4B-it-assistant, 47,7K. Apache 2.0.

Аудио

http://huggingface.co/k2-fsa/OmniVoice — zero-shot TTS на 600+ языков. Diffusion language model архитектура, voice cloning из короткого референса, voice design через атрибуты (gender, age, pitch, accent, whisper). Невербальные символы [laughter], коррекция произношения через pinyin/phonemes. RTF 0,025, в 40 раз быстрее реального времени. 2,22M загрузок, 100 Spaces, 19 файнтюнов, 12 адаптеров. Apache 2.0.

http://huggingface.co/Supertone/supertonic-3 — лёгкий TTS для локального инференса через ONNX Runtime. 5 языков расширили до 31, улучшили стабильность чтения, сократили повторы и пропуски. Работает на CPU без GPU. OpenRAIL.

Видео

http://huggingface.co/TenStrip/LTX2.3-10Eros — image-to-video merge на базе Sulphur-2/LTX 2.3. Layer-scaled merges вместо прямого weight merge, лучше уважает промпт. 64K загрузок. ComfyUI nodes, GGUF квантизации.

Разное

http://huggingface.co/Jackrong/Qwopus3.6-35B-A3B-v1-GGUF — GGUF квантизация Qwopus 3.6, community merge Qwen + Octopus. 67,2K загрузок.

Держится в топе

http://huggingface.co/deepseek-ai/DeepSeek-V4-Pro — 2,02M загрузок. http://huggingface.co/deepseek-ai/DeepSeek-V4-Flash — 1,16M. http://huggingface.co/Qwen/Qwen3.6-27B — 2,45M. http://huggingface.co/Qwen/Qwen3.6-35B-A3B — 3,86M. http://huggingface.co/google/gemma-4-31B-it — 9,12M. http://huggingface.co/openai/privacy-filter — 191K. http://huggingface.co/SulphurAI/Sulphur-2-base — 158K. http://huggingface.co/sensenova/SenseNova-U1-8B-MoT — 4,53K.

Хорошей недели! 👾

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

Нейроканал

17 мая 2026 г., 14:12

📷 Photo

Одна синяя иностранная компания предлагает новый бенчмарк ProgramBench, где агенту дают бинарную программу, README и man-страницу, но не исходный код. Задача воспроизвести поведение оригинала с нуля. Проверка через скрытые тесты: не просто «код скомпилировался», а «программа ведёт себя как оригинал при всех входах». До недавнего времени ни одна модель не решила ни одной задачи полностью.

И вот теперь GPT 5.5 https://programbench.com/blog/gpt-5-5-first-solve/.

Агент на GPT 5.5 (high) написал cmatrix на чистом C с ANSI escape sequences. 10 шагов разведки, 40+ комбинаций флагов, потом одним проходом весь код и 5 целевых патчей. 0 фейлов, $3,17, 34 API-вызова.

GPT 5.5 (xhigh) ту же задачу решил на Python 3. 27 шагов разведки, затем одним файлом вся реализация. 0 фейлов, $4,84, 40 вызовов.

В обоих случаях агенты обнаружили, что ncurses headers отсутствуют, и сразу переключились на raw ANSI вместо того, чтобы тратить время на костыли.

Claude Opus 4.7 (xhigh) — контрастный пример. 178 API-вызовов, $10,74, 19 фейлов. Агент долго исследовал runtime-библиотеки, вручную написал 106 строк forward declarations для ncurses, скомпилировал, а потом упёрся в два глупых бага: case-sensitive парсинг цветов (вместо strcasecmp) и неверный exit code при невалидном цвете. Причём оригинальный бинарник агент тестировал, exit=0 видел, но в своём коде поставил exit(1) и не заметил расхождения.

Общий вывод по таблице: GPT 5.5 (xhigh) лидер по всем метрикам. 0,5% полностью решённых задач и 13,5% «почти решённых» (≥95% тестов). Claude Opus 4.7 (xhigh) 0% и 4,5% соответственно. Разница в подходе: GPT тратит меньше вызовов, но качественнее разведывает, Claude раздувает контекст сложными, но нерелевантными решениями.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

Нейроканал

17 мая 2026 г., 14:12

Everything Claude Code — проект, который начался с хакатона Anthropic. Один разработчик за 8 часов собрал систему, выиграл $15 000 и выложил в open source. Сейчас у репозитория 179к звёзд.

Что внутри: 38 специализированных агентов, 156 навыков, 72 команды и сканер безопасности на 1282 теста. Поддерживается куча разных языков программирования и обвязок т.е. не только для Claude Code.

Ставить этого монстра страшновато, но вот просто почитать советы и то, как автор организовал работу прям ценно, рекомендую: https://github.com/affaan-m/everything-claude-code

AgentShield — отдельная история. Три Claude Opus 4.6 агента в red-team pipeline: Attacker ищет exploit-цепочки, Defender оценивает защиту, Auditor собирает приоритизированный отчёт. Сканирует CLAUDE.md, MCP-конфиги, хуки, агентов, навыки на предмет prompt injection, privilege escalation, supply chain. Встраивается в CI: любой PR с изменением агента проходит аудит автоматически.

Continuous learning модуль интересный, который наблюдает за сессиями и строит паттерны. После двух-трёх недель Claude пишет уже в вашем стиле, без доп. обучения.

Ну и ещё куча всего. Простые советы про изменение дефолтного конфига Claude Code мне понравились, чтобы токены экономить.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

1,770

Нейроканал

17 мая 2026 г., 14:12

Стандартный ИИ-агент помнит только текущий разговор. Закрыл терминал и всё: твои предпочтения, прошлые решения, контекст проекта испарились. Следующий запуск начинается с нуля. Это как если бы программист каждое утро забывал, в какой он команде и на каком языке пишет.

Есть, конечно, системы запоминаний, по сути просто записывание в файл, когда модель считает, что эту инфу важно не потерять. Но это всё полумеры, тем более что есть прям целые отдельные системы памяти. Расскажу про основные.

https://github.com/CodeAbra/iai-mcp — локальный сервер памяти для Claude Code. Работает на локальной машине, шифрует данные, не лезет в облако. Память устроена как граф. Свежий проект, буквально пару дней от релиза, но автор заявляет, что по бенчмаркам обгоняет топовый mempalace.

https://github.com/mempalace/mempalace — память по принципу античной техники локусов. Иерархия: крылья (проекты), комнаты (темы), залы (типы связей), ящики (дословные записи). Сохраняет текст целиком, не перефразирует. Гибридный поиск: BM25 + косинус + граф знаний. 96,6% на LongMemEval.

https://github.com/mem0ai/mem0— проект, который показался мне самым зрелым, куча звёзд и разработчиков и даже $24M инвестиций. Векторный поиск + граф знаний + key-value. Dual-deployment: open-source (Apache 2.0, Docker) или облако. Но графовая память за paywall. Эксклюзивный провайдер памяти для AWS Agent SDK.

https://github.com/supermemoryai/supermemory— лидер по бенчмаркам. Впрочем, каждый проект про себя так заявляет, а единой методики нет, все чуть под себя подстривают. 81,6–85,2% на LongMemEval. Гибридный RAG: память + документы в одном запросе. Есть коннекторы к Google Drive, Gmail, Notion, GitHub. Но ядро закрытое, self-hosting только по enterprise-контракту.

https://github.com/getzep — временные графы знаний. Каждый факт хранит 4 временные метки: когда узнали, когда стало актуально, когда перестало. Можно спросить «а где Алиса работала в марте 2025?» и получить правильный ответ, даже если она уже уволилась. Ядро Graphiti open-source.

https://github.com/vectorize-io/hindsight — память, построенная как человеческая. Четыре сети: факты о мире, собственный опыт, синтезированные наблюдения, развивающиеся убеждения. Четыре параллельные стратегии поиска + reranking. Рекорд на LongMemEval — 91,4%. MIT, нет paywall, всё открыто.

https://github.com/mastra-ai/mastra — фреймворк для агентов, где память встроена изначально. Для тех, кто строит агентов с нуля и не хочет склеивать десяток библиотек. Open-source.

Что-то одно посоветовать не могу, сам не планирую сравнивать, но думаю начать с iai-mcp, по описанию понравился.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

Нейроканал

17 мая 2026 г., 14:12

📷 Photo

inclusionAI https://huggingface.co/inclusionAI/Ling-2.6-1T веса Ling-2.6-1T, и это очень любопытная модель.

Обычные «размышляющие» модели (DeepSeek-R1, o3) перед ответом пишут многострочную цепочку рассуждений: «давайте посмотрим... а что если... не подходит... попробуем так...» Это external reasoning — мышление на виду. Точность высокая, цена тоже: в 3–5 раз больше токенов, чем сам ответ.

Ling-2.6-1T прошёл через Evolutionary Chain-of-Thought при обучении, по сути эволюционную прокачку reasoning-навыков. Итоговая модель сохранила всё это внутри. Она думает, просто не выводит процесс наружу, выдаёт ответ сразу. Internal reasoning, или «fast thinking» в их терминологии.

Практический эффект: AIME26 — 70,42%, выше DeepSeek-V3.1 (55,21%) и GPT-5-main (59,43%). LiveCodeBench — 61,68%, что на 13 процентных пунктов выше DeepSeek-V3.1 (48,02%) и Kimi-K2-0905 (48,95%). При этом стоимость в 4 раза ниже размышляющих моделей, платишь только за ответ, без доплаты за раздумья.

Архитектура: MLA + Hybrid Linear Attention, ~50 миллиардов активных параметров, контекст 262K. MIT-лицензия.

Цена: $0,30 за миллион входных, $2,50 за миллион выходных токенов через Novita/OpenRouter.

На картинки бенчи, но сравнивают они себя с топовыми моделями в не-думающем режиме. Спорная методика, конечно. Интересно что будет если добавить в эту модель слой внешнего ризонинга.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

Нейроканал

17 мая 2026 г., 14:12

Про первое место в трендах тоже не могу не написать. Там сейчас порно модель для генерации видео без цунзуры. Называется https://huggingface.co/SulphurAI/Sulphur-2-base, построена на базе открытого LTX 2.3 с 9 миллиардов параметров, генерирует по тексту и по картинке.

Главное отличие от оригинала — убраны фильтры. LTX 2.3 от Lightricks уже давал хорошее качество движения и чёткость, но со встроенными ограничениями. Sulphur 2 оставляет всю мощь архитектуры, убирает барьеры и даёт полный контроль над выходом.

Работает в ComfyUI и стандартных интерфейсах для стабильной диффузии. Можно крутить локально.

Видео с примером у меня для вас не будет, вот так.

@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)

1,950

Нейроканал

28 мар. 2026 г., 02:13

Только утром про релиз новой модели Composer 2 от команды Cursor (которая по некоторым бенчмаркам обходит Claude Opus 4.6), как вокруг неё https://www.kucoin.com/news/flash/moonshot-ai-accuses-cursor-of-using-kimi-k2-5-without-license-compliance целая драма. Разработчиков обвинили в воровстве open-source модели без указания авторства.

Разработчик под ником @fynnso решил покопаться в API-запросах редактора и https://x.com/fynnso/status/2034706304875602030, что реальный внутренний ID модели Composer 2 — kimi-k2p5-rl-0317-s515-fast.

То есть, это не модель, написанная с нуля, а просто взятая китайская модель Kimi K2.5 от компании Moonshot AI, поверх которой Cursor накатили своё обучение с подкреплением (RL).
​
И в чём проблема?

Moonshot AI выпускает свои модели по модифицированной лицензии MIT. Она разрешает коммерческое использование и файн-тюнинг, но с одним жёстким условием: если проект зарабатывает больше $20 млн в месяц, он обязан явно указывать атрибуцию Kimi K2.5 прямо в пользовательском интерфейсе. Cursor (с оценкой почти в $30 млрд и гигантской базой платных юзеров) этот порог явно пробивает, но в анонсах они подавали Composer 2 как свою собственную «in-house» разработку, ни разу не упомянув Kimi.

Реакция:

— Глава претрейна Moonshot AI Юлун Ду подтвердил, что токенизатор Composer 2 идентичен токенизатору Kimi. Он публично тегнул кофаундера Cursor с вопросом: «Почему вы не уважаете нашу лицензию и не платите сборы?» (а потом удалил свой твит, но интернет всё помнит).
​
— В дело вмешался даже Илон Маск, который https://x.com/elonmusk/status/2034941631871455262 находку комьюнити твитом: «Да, это Kimi K2.5» (как ОН это понял я не представляю).
​
— Сами разработчики Cursor пока хранят молчание.

Теперь перед компанией стоит выбор: либо официально признать использование Kimi и добавить её логотип в редактор, либо в срочном порядке переучивать Composer 2 на другой базовой модели без таких лицензионных ограничений.

Нейроканал

28 мар. 2026 г., 02:13

🎥 Video

Наконец-то, Claude для Mac, как он должен был бы выглядеть! Оказывается, не только мне странно от десктоп-версии, которую предлагает Anthropic. Один разработчик явно с понимаем UX сделал всё как надо.

Программа цепляется к вашей уже настроенной локальной сессии Claude Code и даёт ей удобный визуальный интерфейс.

Пока только для macOS.

Исходники и инструкцию по установке на GitHub: https://github.com/lcoutodemos/clui-cc

1,670

Нейроканал

28 мар. 2026 г., 02:13

📷 Photo

Xiaomi продолжает экспансию на рынок искусственного интеллекта и https://mimo.xiaomi.com/mimo-v2-pro новую большую языковую модель MiMo-V2-Pro.

Кратко основное:

— Это гигантская модель-MoE: более 1 триллиона параметров в сумме, но при генерации активны только 42 миллиарда, что делает её очень быстрой.

— Контекстное окно в 1 миллион токенов (похоже, что это новый стандарт сейчас).
​
— Во время слепых тестов модель скрывалась на площадке OpenRouter под кодовым именем «Hunter Alpha» (теперь https://openrouter.ai/xiaomi/mimo-v2-pro напрямую).
​
По тестам Xiaomi, модель работает на уровне Claude Opus 4.6, но стоит в разы дешевле. API https://openrouter.ai/xiaomi/mimo-v2-pro для разработчиков: цена начинается всего от $1 за 1М входных токенов (и $3 за выходные) при контексте до 256k. Если использовать полный миллионный контекст, тариф поднимается до $2 на вход и $6 на выход.

Помимо текстовой Pro-версии, компания также показала мультимодальную модель https://mimo.xiaomi.com/mimo-v2-omni и голосовую https://mimo.xiaomi.com/mimo-v2-tts.

1,510

Нейроканал

28 мар. 2026 г., 02:13

Anthropic https://x.com/trq212/status/2034761016320696565 крутую фичу для Claude Code — Channels (Каналы). Теперь можно подключить агента к Telegram или Discord, чтобы общаться с ним и давать поручения с телефона, пока ваш терминал крутится на сервере или домашнем компьютере.

Так можно было и раньше делать, но теперь это https://code.claude.com/docs/en/channels.

По сути, это работает как двусторонний мост: вы пишете боту в телегу «Сбилди проект и скажи, если есть ошибки», сообщение улетает в ваш запущенный сеанс Claude Code, агент выполняет работу в вашей консоли и присылает ответ обратно в мессенджер.

Как настроить для Telegram (нужен Claude Code v2.1.80+):

— Создаём бота у https://t.me/BotFather и забираем токен

— Устанавливаем официальный плагин в самом Claude Code:
/plugin install telegram@claude-plugins-official

— Привязываем токен:
/telegram:configure <твой_токен>

— Перезапускаем агента с флагом каналов:
claude --channels plugin:telegram@claude-plugins-official

— Пишем боту в телегу любое сообщение. Он выдаст код привязки. Возвращаемся в терминал и подтверждаем:
/telegram:access pair <код_из_телеги>

— Включаем вайтлист, чтобы никто, кроме вас, не мог запустить rm -rf на вашем сервере через этого бота:
/telegram:access policy allowlist

В целях безопасности, если агент попытается выполнить команду, требующую подтверждения (например, удаление файлов), он всё равно остановится и будет ждать вашего согласия в терминале . Если вы хотите полностью автономную работу через телеграм на свой страх и риск, придётся запускать агента с флагом --dangerously-skip-permissions.

Подробнее https://code.claude.com/docs/en/channels#supported-channels.

View on X (Twitter)

Нейроканал

28 мар. 2026 г., 02:13

📷 Photo

Разработчики Cursor https://cursor.com/blog/composer-2 свою новую внутреннюю модель Composer 2, и она уже доступна в редакторе. Похоже, ребята всерьёз взялись за собственное обучение, чтобы меньше зависеть от API Anthropic и OpenAI.

И честно признаемся, Composer 1.5 по цена\качество уже был очень неплох, я реально некоторые простые задачки с его помощью решал. А вторая версия по некоторым бенчмаркам даже Opus 4.6 обходит.

Модель впервые прошла этап continued pretraining и серьёзное обучение с подкреплением (RL) на длинных задачах. В итоге Composer 2 научился решать сложные проблемы, требующие сотен последовательных действий.

По тестам прирост огромный по сравнению с версией 1.5:
— Terminal-Bench 2.0: 61,7 (было 47,9)
— SWE-bench Multilingual: 73,7 (было 65,9)
— Внутренний CursorBench: 61,3 (было 44,2)

Базовая версия Composer 2 стоит $0,50 за 1М входных и $2,50 за 1М выходных токенов.

Также добавили быструю версию (с тем же уровнем интеллекта, просто быстрее генерит) за $1,50 / $7,50, и именно она теперь стоит по умолчанию в редакторе.

Для пользователей с индивидуальными подписками запросы к Composer всё так же списываются из отдельного щедрого пула лимитов.

Нейроканал

28 мар. 2026 г., 02:13

📷 Photo

Anthropic https://www.anthropic.com/features/81k-interviews исследование: их ИИ-агент опросил 81к человек по всему миру о том, чего они ждут от нейросетей и чего боятся.

Чего хотят люди:
— Избавиться от рутины: переложить скучные задачи на ИИ, чтобы освободить время для семьи и хобби.
— Эмоциональной поддержки: многие используют ИИ как психотерапевта, ментора или даже партнёра, когда рядом нет живых людей.

Чего боятся:
— Ошибок: нейросети всё ещё галлюцинируют, а фактчекинг съедает сэкономленное время.
— Потери контроля и работы: страх, что ИИ заменит людей и начнёт принимать решения за нас.
— Деградации: переживания, что люди (особенно студенты) разучатся думать своей головой.

Главный парадокс:
Чем сильнее человек ценит какую-то функцию ИИ, тем больше он боится её обратной стороны. Например, те, кто ищет в нейросетях эмоциональную поддержку, больше всех боятся стать зависимыми и потерять связь с реальным миром.

1,610

Нейроканал

28 мар. 2026 г., 02:13

📷 Photo

22 апреля в Москве пройдет конференция по искусственному интеллекту «MLечный путь»

Это мероприятие от облачного провайдера Selectel для тех, кто не просто следит за хайпом вокруг ИИ, а внедряет модели в продакшн или управляет этим процессом. https://tprg.ru/cWCu: для бизнеса и для технических специалистов.

В техническом блоке доклады про:
— Выбор серверного железа под разные типы ИИ-нагрузок.
— Особенности SDLC для вероятностных систем.
— Безопасность при использовании генеративных технологий в рабочих процессах.
— Как сочетать инференс классических моделей и LLM на одной платформе.

В бизнес-треке — темы про окупаемость, риски и дорожные карты внедрения.

Участие бесплатное, но количество мест ограничено.Подробная программа и регистрация — https://tprg.ru/aioz.

Это #партнёрский пост

1,570

Нейроканал

28 мар. 2026 г., 02:13

📷 Photo

Немного занятной статистики

1,490

Нейроканал

28 мар. 2026 г., 02:13

[poll]

1,470

Нейроканал

28 мар. 2026 г., 02:13

📷 Photo

Неделю назад команда FireRedTeam https://huggingface.co/collections/FireRedTeam/fireredasr2s на HF новое семейство моделей для распознавания речи. Там есть ASR в разных вариантах и расстановка пунктуации, но нет поддержки русского, так что нам не очень интересно.

А вот что интересно, там же есть модули VAD и LID. И они уже работают на 100+ языков, включая русский.

VAD я потестировал и он реально лучше Silero справляется с некоторыми доменами аудио (не со всеми т.е. просто drop-in заменять не рекомендую, надо с умом). Основная фишка — более гранулярная нарезка сегментов с речью, маленькие паузы чётко определяет.

LID тоже хороший, но тяжёлый, на продакшен только ради распознавания языка тащить сомнительно, но если нужно качество, то попробовать стоит.

Релиз прошёл особо незамеченным, так что вот подсвечиваю что можно забрать в свои проекты.

1,580

Нейроканал

25 мар. 2026 г., 20:58

🎥 Video

Anthropic запустила Dispatch — Claude теперь может вести себя как автономный помощник по типу OpenClaw.

Даём задачи с телефона, Клод хозяйничает на компе и решает задачу.

Лично пока не тестировал, у меня десктопный клод и без этого постоянно тормозит и вылетает с ошибками, не хочу ещё больше страдать. Но выглядит интересно, конечно.

1,720

Нейроканал

25 мар. 2026 г., 20:58

📷 Photo

OpenAI https://openai.com/index/introducing-gpt-5-4-mini-and-nano/ две новые легковесные модели — GPT-5.4 mini и GPT-5.4 nano, оптимизированные для высокой скорости работы и снижения затрат в API. Обе созданы специально для быстрых ИИ-агентов, написания кода и автоматизации рутинных задач.

GPT-5.4 mini

Работает в два раза быстрее прошлого поколения (GPT-5 mini) и поддерживает огромное окно контекста в 400к токенов. Заточена под программирование и мультимодальное управление компьютером, при этом почти догоняя по качеству основную GPT-5.4 (выдаёт 54,4% успешных решений в бенчмарке SWE-Bench Pro и 72,1% в тестах интерфейсов OSWorld).

GPT-5.4 nano

Самая маленькая и дешёвая модель во всем семействе GPT-5.4. Предназначена для простых потоковых задач: парсинга, классификации данных и работы в качестве вспомогательных субагентов. Несмотря на свою легковесность и низкую цену, Nano показывает неплохие результаты: 52,4% в тестах на написание кода (SWE-Bench Pro) и 82,8% в проверке сложных знаний (GPQA Diamond).

​

1,620

Нейроканал

25 мар. 2026 г., 20:58

📷 Photo

MiniMax https://mp.weixin.qq.com/s/Xfsq8YDP7xkOLzbh1HwdjA свою новую флагманскую модель MiniMax-M2.7
​
Главная фишка этого релиза — M2.7 активно участвовала в собственном процессе обучения. Модель автономно управляла десятками задач в рамках своего же пайплайна (Reinforcement Learning): анализировала логи, писала код, запускала тесты и оптимизировала процессы, беря на себя до 30–50% рутинной работы исследователей. ИИ способен проводить автономные циклы из более чем 100 итераций улучшений без вмешательства человека.

Что ещё умеет M2.7:

— Программирование: Модель выдаёт 56,22% в бенчмарке SWE-Pro (задачи из реальных репозиториев), что ставит её в один ряд с топовыми закрытыми моделями. Отлично справляется со сквозной доставкой целых проектов, дебаггингом и безопасностью кода.

— Агенты и инструменты: При одновременной работе с 40 сложными инструментами (описание каждого превышает 2000 токенов) модель удерживает точность использования на уровне 97%.
​
— Офисные задачи: M2.7 научилась превосходно справляться с комплексным редактированием в Excel, PowerPoint и Word, поддерживая длинные цепочки правок.
​
Модель уже https://platform.minimaxi.com/ на платформе MiniMax API сразу в двух версиях: базовой (M2.7) и скоростной (M2.7-highspeed). Цена осталась такая же как для предыдущей версии 2.5.

Нейроканал

25 мар. 2026 г., 20:58

📷 Photo

По поводу всех этих новых трендов на миллионные окна контекста. Есть одна https://research.trychroma.com/context-rot, вышла ещё прошлым летом.

Суть максимально проста: чем больше текста вы закидываете в нейросеть, тем сильнее она «тупеет» и деградирует, даже на элементарных задачах. И к новому Opus 4.6 это тоже относится.

Но разработчики же заявляют 100% успех в тестах «Иголка в стоге сена»? Да, но этот тест проверяет лишь способность найти точную фразу. В реальных задачах, где нужно искать по смыслу, начинается то самое «гниение контекста».

Главные выводы исследования:

— Дистракторы ломают логику. Если в гигантском тексте есть информация, похожая на правильный ответ, но неверная (дистрактор) — модель с огромной вероятностью запутается и выдаст галлюцинацию.

— Парадокс связного текста. Найти нужный факт в логичном, хорошо написанном тексте (например, в книге или статье) нейросети сложнее, чем в тексте, где все предложения просто перемешаны в случайном порядке. Это странный баг внутреннего механизма внимания моделей.

— Провал на примитиве. Модели попросили сделать простейшую вещь: повторить длинный текст слово в слово. На больших объёмах нейросети сдаются: начинают выдумывать новые слова, ломают структуру или вовсе отказываются отвечать.

Огромное контекстное окно — это не волшебная корзина. Бездумно загружать в один промпт всю кодовую базу или архив документации всё ещё плохая идея. В идеале нужно отдавать модели (например, через RAG) только короткие и релевантные куски данных.

​

Нейроканал

24 мар. 2026 г., 04:23

📷 Photo

Mistral https://mistral.ai/news/leanstral Leanstral — ИИ-модель для математически идеального кода

В обычной разработке нейросети галлюцинируют, и нам приходится проверять их код руками. Новая модель Leanstral решает эту проблему: она пишет на языке программирования Lean 4, который математически доказывает отсутствие логических багов.

Сразу оговорюсь — это инструмент не для Telegram-ботов или обычных сайтов. Формальная верификация нужна в смарт-контрактах, криптографии, авиации или космонавтике — там, где ошибка стоит миллионы долларов или человеческие жизни, и обычных юнит-тестов недостаточно.

Работает это так: вы не пишете код сами, а только задаёте строгие математические законы (спецификацию). Модель пишет код и пытается доказать его корректность. Бездушный компилятор Lean выступает абсолютным судьей: если есть хоть одна нестыковка, код просто не скомпилируется. Агент Leanstral будет автономно переписывать решение до тех пор, пока компилятор его не примет. Человек в отладке не участвует вообще.

Раньше писать такие сложные математические доказательства умели только гигантские и дорогие модели вроде Claude Opus 4.6. Mistral же сделала узкоспециализированную и лёгкую модель (активны всего 6B параметров). В итоге, чтобы ИИ методом проб и ошибок сам написал и доказал сложный код, на Leanstral вы потратите около $36, а на Claude Opus — $1650 (в 92 раза больше) при сопоставимом качестве успешных решений.

Модель полностью открыта по лицензии Apache 2.0. Потестировать агента можно прямо в браузере через Mistral Vibe или API.

​

Нейроканал

24 мар. 2026 г., 04:23

Недавно Андрей Карпатый https://github.com/karpathy/autoresearch новый подход к разработке под названием autoresearch. Суть паттерна: ИИ-агент сам придумывает гипотезу, пишет код, запускает тесты, оценивает метрики и автоматически уходит на следующий круг. Карпатый натравил агента на свой алгоритм обучения нейросетей, оставив его на ночь. За это время ИИ автономно провёл около 700 экспериментов и смог ускорить изначально отлично оптимизированный код ещё на 11%.

Это уже круто, но читайте дальше.

Идеей https://x.com/tobi/status/2032212531846971413 Тоби Лютке, CEO платформы Shopify. Он решил применить этот же цикл к Liquid — главному шаблонизатору компании, который топовые инженеры вручную оптимизировали последние 20 лет. Тоби дал агенту скрипт с бенчмарками, в итоге ИИ без какого-либо вмешательства человека сделал движок на 53% быстрее.

Для того чтобы провернуть этот трюк с кодом Shopify, Тоби вместе с разработчиком Давидом Кортесом написали специальный плагин pi-autoresearch и https://github.com/davebcn87/pi-autoresearch его в открытый доступ. Это расширение для ИИ-обвязки pi (грубо говоря, как клод код, но с любой моделькой).

Работает это так:
— Вы описываете задачу. Например, «сделай выполнение этого скрипта быстрее».
— Предоставляете bash-скрипт с вашими тестами или бенчмарками (ну или ИИ сам пишет, но это важный момент и лучше проконтролировать).
— Запускаете процесс.

Агент начинает бесконечный цикл экспериментов. Он сам переписывает код, прогоняет тесты и записывает удачные и неудачные попытки в специальный файл-журнал, чтобы учиться на своих ошибках. Если что-то получилось, то делает коммит, чтобы зафиксировать, если нет, то откатывает репо.

У меня с первого раза получилось не очень, агент начал залипать на оптимизациях под конкретный датасет. Но с другой стороны это логично, какая задача, такое и решение. Думаю теперь где ещё можно попробовать.

​

View on X (Twitter)

Нейроканал

24 мар. 2026 г., 04:23

Очередной топ трендов HuggingFace за неделю

TL;DR

Новое: Fish Audio S2 Pro — 5B TTS, бьёт все closed-source модели на Audio Turing Test. Nemotron 3 Super от NVIDIA — гибрид Mamba2+MoE на 120B/12B активных с 1M контекстом. TADA от Hume AI — TTS с 1:1 выравниванием текст-аудио, 0% галлюцинаций. GLM-OCR — 0.9B OCR-модель, #1 на OmniDocBench. OmniCoder-9B — агентный кодер на базе Qwen3.5. Anima — anime T2I на NVIDIA Cosmos.

Держится: LTX-2.3, Qwen3.5-9B, Qwen3.5-35B-A3B, Jackrong Claude-Opus-Distilled.

Аудио — главная тема недели

— https://huggingface.co/fishaudio/s2-pro — Dual-AR TTS на 5B (4B Slow AR + 400M Fast AR). 10M+ часов аудио, 80+ языков (включая русский). Фишка: free-form теги типа [whisper], [excited], [laughing] прямо в тексте — 15 000+ уникальных тегов для пословного контроля. Audio Turing Test 0,515 (для сравнения у MiniMax 0,387). EmergentTTS-Eval win rate 81,88% — выше всех, включая Google и OpenAI. RTF 0,195, time-to-first-audio ~100ms на H200. SGLang-движок с prefix caching. Research лицензия.

— https://huggingface.co/HumeAI/tada-1b / https://huggingface.co/HumeAI/tada-3b-ml от Hume AI — TTS на базе Llama 3.2 с уникальной архитектурой: 1:1 синхронизация текст-аудио (один аудио-фрейм на один текстовый токен). Flow matching head предсказывает акустику и длительность одновременно. RTF 0,09 — в 5x быстрее аналогов. 0% галлюцинаций на 1000+ тестах. 3B-версия поддерживает 10 языков (русского нет). MIT лицензия.

LLM

— https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16 от NVIDIA — 120B/12B активных ( про эту модель). Гибрид Mamba-2 + LatentMoE + Attention с Multi-Token Prediction. Контекст до 1M токенов, бенчмарки топовые: HMMT 94,7, SWE-Bench 60,5, GPQA Diamond 82,7. Throughput в 2,2x выше GPT-OSS-120B и 7,5x выше Qwen3.5-122B. https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4 влезает на 2x H100. Nemotron Open License.

— https://huggingface.co/Tesslate/OmniCoder-9B от Tesslate — агентный кодер на базе Qwen3.5-9B. Обучен на 425K+ траекториях из Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro. GPQA Diamond 83,8, Terminal-Bench 23,6. 262K контекст, https://huggingface.co/Tesslate/OmniCoder-9B-GGUF. Apache 2.0.

— https://huggingface.co/LocoreMind/LocoTrainer-4B от LocoreMind (авторы LocoOperator) — 4B агент-эксперт по MS-SWIFT фреймворку. Дистиллирован из Qwen3-Coder-Next, 362K обучающих семплов. Навигация по кодовой базе + генерация markdown-отчётов. MIT.

OCR и генерация

— https://huggingface.co/zai-org/GLM-OCR от Z ai — 0,9B OCR-модель на архитектуре GLM-V. Топ-1 на OmniDocBench V1.5 (94,62, для сравнения у Gemini-1.5-Pro 90,3, GPT-4o 85,4). Таблицы, формулы, печатки, рукопись. Двухэтапный пайплайн: layout analysis (PP-DocLayout-V3) → параллельное распознавание. 1,86 стр/с для PDF. MIT.

— https://huggingface.co/circlestone-labs/Anima от CircleStone Labs — 2B anime T2I модель на NVIDIA Cosmos. LLM-адаптер (Qwen 3 0.6B) для текстовых эмбеддингов. Обучена на миллионах anime-изображений + 800K non-anime для регуляризации. ComfyUI из коробки. Preview-версия, non-commercial лицензия.

Uncensored-волна продолжается: HauhauCS выпустил https://huggingface.co/HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive вслед за 9B из прошлого обзора.

Неделя голоса и агентов: Fish Audio и Hume AI подняли планку open-source TTS на новый уровень — оба бьют closed-source. NVIDIA вернулась с Mamba2-гибридом на 1M контекста. А GLM-OCR показал, что 0.9B хватает для SOTA в распознавании документов.

Хорошей недели! 👾

Нейроканал

22 мар. 2026 г., 21:09

📷 Photo

NVIDIA https://huggingface.co/collections/nvidia/nvidia-nemotron-v3 на Hugging Face новую открытую модель Nemotron-3-Super. Этот релиз интересен тем, что компания пытается решить главную проблему современных ИИ-агентов: они слишком долго «думают» перед выдачей ответа и пожирают огромное количество ресурсов на длинных сессиях.
​
Чтобы разогнать модель, NVIDIA собрали очень нетипичную гибридную архитектуру, объединив классический Attention, Mamba-2 и Mixture of Experts.

Сообщество и бизнес это оценили, в итоге три варианта новой модели в топе хагинфейса, а Perplexity добавила эту модель вместо Kimi т.е. вот рядом с Claude, Gemini и GPT.
​
Что на практике:

— скорость генерации выросла в разы за счёт механизма Multi-Token Prediction (модель предсказывает сразу несколько токенов за один шаг);

— при общих 120 миллиардах параметров во время генерации активны всего 12 миллиардов;
​
— огромное окно контекста в 1 миллион токенов обрабатывается с минимальными задержками благодаря слоям Mamba;

— модель нативно обучалась в 4-битном формате (NVFP4) специально под новые чипы Blackwell, поэтому она почти не теряет в качестве при квантовании.

Получается отличный вариант для задач, где вам нужен быстрый агент с большим контекстом и умением долго рассуждать.

Нейроканал

22 мар. 2026 г., 21:09

📷 Photo

Anthropic тихо расширила контекстное окно Opus 4.6 по подписке до одного миллион токенов. Просто в очередном обновлении моделька сменилась, ничего доплачивать не нужно.

Подвох в том, что огромные промпты будут сжирать лимиты ещё быстрее, чем раньше. Плюс учитывайте падение качества ответов при сильном заполнении контекста. После отметки примерно в 250 000 – 500 000 токенов Opus 4.6 начинает терять нить рассуждений, пропускать детали из начала промпта и в целом хуже справляется со сложными задачами.
​
Теперь нужно ещё внимательнее следить за компакцией, чаще запускать вручную или начинать новые сессии.

1,890

Нейроканал

21 мар. 2026 г., 20:17

📷 Photo

Google https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/ Gemini Embedding 2 — свою первую нативно мультимодальную модель для создания эмбеддингов. Если вы когда-нибудь собирали системы семантического поиска или RAG, то наверняка как и я радуетесь подобным моделькам.

Веса закрытые, нужно дёргкать API. Бенчмарки, конечно, лучше всех (тут главное с правильными конкурентами сравнивать).
​
Новая модель умеет мапить текст, картинки, аудио, видео и PDF-документы в единое 3072-мерное векторное пространство.
​
Что ещё полезного:

— размерность финального вектора можно динамически урезать через параметр output_dimensionality, чтобы экономить место в базе без сильной потери качества;
​
— модель умеет сама извлекать аудиодорожки из видео и делает OCR документов без промежуточных костылей;
​
— можно передавать кастомные инструкции (например, task:code retrieval или task:search result), чтобы модель заранее оптимизировала векторы под ваш конкретный сценарий использования

— поддерживается больше 100 языков (а у моделек гугла с этим обычно как раз всё хорошо, видимо им важна настоящая мультиязычность)

Showing 30 of 49 posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Нейроканал

Нейроканал

Рейтинг

Рост участников (Последние 19 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Random Open Science

Сердце 🧡 Сообщества

Чат для общения

Студия Никитина | event | нейросети

Прокси тут

Techlead Russia

Помощь подключение

Градостроительный комплекс Москвы

Похожие каналы Telegram

Random Open Science

Сердце 🧡 Сообщества

Чат для общения

Студия Никитина | event | нейросети

Прокси тут

Techlead Russia

Помощь подключение

Градостроительный комплекс Москвы

Последние посты

Отзывы пользователей (0)