Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.
Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии.
Aвтор: @asanakoy
PR: @ssnowysnow
@ai_newz offers specialized information about ssnowysnow and scientist for subscribers interested in Мировые новости
Unitree показали МЕХУ
Называется GD01, весит полтонны, а цена стартует с 650 тысяч долларов. Мне особенно понравилось как робот может быть как бипедом, так и квадрипедом, жаль только что кабина пилота не поворачивается.
28,600
244
0
эйай ньюз
17 мая 2026 г., 16:08
приехал пхд студент из епфл в отпуск. лежит под пальмой, тут ему звонит профессор, говорит мол ахуел он, дедлайн на aaai, надо статьи писать, а не отдыхать. ну нечего делать, стажер пошел скейлинг лоуз для ллм запускать. попивает пина коладу, промптит клод, чтобы он ему график нарисовал, а рядом на ветке сидит обезьяна и постоянно за ним наблюдает. как-то раз отошел стажер, возвращается, а обезьяна уже вместо него за компом сидит и экспы на 30B модель раскатывает. и так каждый раз. стоило стажеру отойти, как обезьяна на его место садилась и статью писать начинала. посмотрел профессор на это дело и уволил пхд студента. через полгода звонит ему и говорит:
- приходи к нам обратно, нам опять стажер нужен.
- ага, не справилась обезьяна.
- нет, обезьяна уже лидом ресерча стала, опять скейлинг лоуз крутить некому
25,900
965
эйай ньюз
17 мая 2026 г., 16:08
📷 Photo
Mythos за месяц нашёл больше уязвимостей в Firefox чем разработчики нашли за полтора года
Причём из 271 найденной моделью уязвимости были баги позволяющие выход из песочницы, которые в комбинации с прочими багами могли бы позволить заражение от простого перехода по ссылке. Баги, разумеется, уже пофиксили в трёх последних релизах. Из хороших новостей — некоторые части браузера не так давно переписывали с упором на безопасность и в этих частях браузера уязвимостей не нашли. Анонс Anthropic подтвердился реальным использованием, кибербезопасность изменилась навсегда.
https://hacks.mozilla.org/2026/05/behind-the-scenes-hardening-firefox/
52,500
эйай ньюз
17 мая 2026 г., 16:08
🎥 Video
Google тестит Gemini Omni
Похоже теперь Gemini умеет в видеогенерацию, а моделям Veo, как отдельной линейке, пришёл конец. Логичный шаг, учитывая возможность Gemini выдавать на выход как аудио так и изображения. Модель скорее всего полноценно покажут на следующей неделе, на Google I/O.
42,800
390
эйай ньюз
17 мая 2026 г., 16:08
Нейродайджест за неделю (#116)
Открытые модели
— миллион токенов контекста, мультимодальность (даже аудио), неплохие агентские результаты.
— команда обновила существующий претрейн. Очень хорошо показывает почему большие dense модели теперь никто не тренирует.
https://huggingface.co/collections/poolside/laguna-xs2— неплохавя моделька от Poolside AI, на уровне Qwen 3.5 35B-A3B при схожем размере, но при этом не китайская.
Разное
— результаты очень хорошо показывают почему арена мусор.
— команда дурачится, а тем временем выручка Codex выросла в два раза за неделю.
— эзотерическая LLM натренированная на данных до 1930 года включительно.
>
#дайджест
40,200
90
0
эйай ньюз
17 мая 2026 г., 16:08
🎥 Video
OpenAI обновили GPT Instant до версии 5.5
Модель теперь умнее, меньше галлюцинирует и при этом выдаёт заметно более короткие ответы. Кроме этого обновили интерфейс памяти в ChatGPT — будут показывать на основе каких воспоминаний моделька ответила. Новую модель уже раскатывают на всех пользователей ChatGPT,
А вы пользуетесь не ризонерами? Если да, то для чего?
37,400
224
эйай ньюз
17 мая 2026 г., 16:08
📷 Photo
Anthropic арендуют Colossus у SpaceX
Датацентр Маска на 200+ тысяч видеокарт в итоге оказался не нужен для инференса Grok. Как следствие Anthropic повышает пятичасовые лимиты для подписчиков в два раза и убрала урезанные лимиты в пиковые часы. Кроме этого в разы выросли лимиты на использование API. Ну и Anthropic выразили интерес в программе орбитальных датацентров SpaceX, так что такая кооперация у них надолго.
Интересно, а после этого разбанят ли Claude для xAI?
41,900
504
эйай ньюз
17 мая 2026 г., 16:08
🎥 Video
OpenAI добавили в Codex питомцев
И да, его можно сделать гоблином. Ну а что, после роста выручки в два раза за неделю, команде можно и подурачиться.
А из Claude Code тамагочи вырезали всего через неделю после добавления...
38,800
373
эйай ньюз
17 мая 2026 г., 16:08
Помните вы переживали что ваше резюме сделанное с LLM, может не пройти какой-то отбор в HR-системе в месте куда откликаетесь? Можете больше не переживать, всё наоборот
Ресечры https://arxiv.org/abs/2509.00462 сценарий: кандидат пишет резюме с помощью LLM, а компания потом скринит это резюме, тоже через LLM – то есть робот пишет, робот читает, человек где-то в углу пьёт кофе и надеется, что наймут адеквата
В статье два вывода:
1. Резюме, переписанные LLM, чаще проходят автоматический отбор (☕️)
В симуляциях кандидаты, которые использовали тот же LLM, что и система-оценщик, оказывались в шортлисте заметно чаще, чем такие же по содержанию кандидаты с резюме сделанными врукопашную – примерно на 20-60% чаще
2. Сам скоринг оказался байасным. Модель не просто делает вывод в стиле: “о, тут лучше написано”, она, похоже, может узнавать свой стиль и предпочитать тексты, похожие на её собственные – авторы называют это self-preference bias: модель склонна любить контент, который сама же могла бы написать, маленький цифровой нарциссизм
То есть страх “меня не пригласят на собес, потому что резюме написано с АИ” может быть не главным. Главный риск другой: вас могут НЕ позвать именно потому, что резюме не звучит как родной диалект модели-оценщика
Раньше люди подстраивали CV под рекрутера, теперь нужно подстраивать под модель ☺️
32,300
эйай ньюз
17 мая 2026 г., 16:08
📷 Photo
Mistral Medium 3.5
Это мультимодальная dense модель на 128B, с контекстом на 256k. Обходит прошлые модели Mistral, но не дотягивает до самых больших открытых моделей.
Модель единственная в своей весовой категории, все конкуренты в разы больше, так что для локального деплоя может быть неплохим вариантом. Для того чтобы модель не вела себя совсем как черепашка, опубликовали ещё и голову для спекулятивного декодинга.
Просят за API этой модели $1.5/$7.5 за миллион токенов, так что смысла юзать в облаке особо нет. Лицензия открытая, но компаниям с выручкой больше $20M в месяц нужно покупать лицензию.
https://huggingface.co/collections/mistralai/mistral-medium-35
https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5
42,500
эйай ньюз
26 мар. 2026 г., 23:47
🎥 Video
Вот и настоящая реалтайм генерация видео подъехала
Runway и NVIDIA выкатили Gen-4.5 на новых чипах Vera Rubin. Теперь HD-видео генерится в реальном времени с задержкой в жалкие 100 мс, позволяя менять промпты и режиссировать сцену прямо на лету, без всяких ожиданий рендера.
Главная фишка релиза кроется в GWM-1 — авторегрессионном симуляторе физического мира. Это семейство из трёх специализированных моделей: GWM Avatars генерит интерактивных говорящих голов, GWM Robotics работает как песочница для тренировки железных роботов, а GWM Worlds рендерит стабильные бесконечные миры. По сути это прямой конкурент гугловской Genie, и жутко интересно представить как это повлияет на игры будущего.
https://dev.runwayml.com/ уже доступны для тестов, дают щедрые 30 минут чтобы побаловаться. Матрица всё ближе, Нео.
https://runwayml.com/news/runway-partners-with-nvidia
36,400
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Похоже Composer 2 — это пост-трейн китайской Kimi 2.5 Сразу после выхода Composer 2 пользователи заметили что модель на эндпоинте называется kimi-k2p5-rl-0317-s515-fast, а чуть позже пошли (ныне удалённые) шокированные твиты от команды Kimi — по их словам…
29,000
257
эйай ньюз
26 мар. 2026 г., 23:47
Илон рассказал о планах на космические датацентры
Показал рендер 100киловаттного спутника весом в тонну, Starship сможет такие выводить на орбиту десятками за каждый запуск. Один такой спутник будет производить электричества примерно как вся МКС и в 5 раз больше чем спутники Starlink V3. Предвидя комментарии об охлаждении чипов в космосе, https://www.youtube.com/watch?v=FlQYU3m1e80 хорошее видео с анализом от одного из крупных космических ютуберов.
Чтобы насытить всё это чипами, SpaceX будут строить свою фабу для их производства, планируя производить тераватт чипов в год (для сравнения, электросеть США производит как раз тераватт). Причём под одной крышей собираются делать всё — маски для литографии, память, логические чипы и упаковывать всё это в одно целое. Цель сверхамбициозная, такого уровня интеграции в мире нигде нет, но если кто-то и сможет сделать это, так это Маск.
30,800
437
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Cursor релизнули Composer 2
Это второе поколение собственных моделей стартапа. Заявляют что она на уровне опуса, при этом заметно дешевле, но явно нужно тестить самим.
Модель довольно дешёвая — $0.5/$2.5 за миллион токенов, но дьявол в деталях: по дефолту юзерам дают fast версию, которая стоит $1.5/$7.5 за лям токенов. Кроме этого она доступна по подписке.
30,900
171
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Похоже Composer 2 — это пост-трейн китайской Kimi 2.5
Сразу после выхода Composer 2 пользователи заметили что модель на эндпоинте называется kimi-k2p5-rl-0317-s515-fast, а чуть позже пошли (ныне удалённые) шокированные твиты от команды Kimi — по их словам они ничего не знали об использовании Cursor их весов. И раньше ходили слухи что оригинальный Composer был основан на китайской модели — GLM 4.6, так что прецедент такого "ребрендинга" есть, но там ситуация отличается.
Дело в лицензии — если GLM лицензирована по MIT, то у Kimi 2.5 лицензия более сложная — подобные к лицензии MIT права она даёт только до 100 миллионов пользователей продукта или 20 миллионов выручки в месяц. То есть тюн GLM не нарушал лицензию оригинальных весов, а тюн Kimi — нарушает.
Ситуацию обостряет конфликт Anthropic с авторами Kimi — компания https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks Moonshot в использовании более чем 3.4 миллионов запросов для дистилляции. Возможно руководство Cursor решило, что из-за собственных проблем с данными, Moonshot не отважится подать на них в суд и им за это ничего не будет.
Достаём попкорн и наблюдаем за ситуацией
эйай ньюз
26 мар. 2026 г., 23:47
🎥 Video
Street View через нейросеть
Корейцы из Naver показали Seoul World Model — заметную часть Сеула вышло впихнуть в одну модельку. Это модель реального места, которая не разваливаясь позволяет путешествовать много километров подряд. Можно и промптить модель творить с городом всякие непотребства — наводнение, напададение инопланетян и Годзиллы.
Сделали это на основе Nvidia Cosmos Predict 2.5 — DiT на 2 миллиарда параметров, а тренировали всего на 24 H100. Моделька выдаёт 15 fps на одной H100, но оптимизацией для локального запуска ещё никто особо не занимался. Код и веса ещё не релизнули, но обещают выложить скоро.
https://arxiv.org/abs/2603.15583
https://github.com/naver-ai/seoul-world-model
31,500
245
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Партнеры Nvidia открыли предзаказы на DGX Station Это десктопная машинка с одной GB300 на 748 гигов оперативки внутри (треть из этого HBM 3E, остальное LPDDR5X). Цены начинаются на отметке в $87k. @ai_newz
29,400
595
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Mistral выкатили Small 4
И всё грустно. На опубликованных бенчах модель проигрывает сентябрьскому Qwen 3 Next, у которого в полтора раза меньше параметров в целом и в два раза меньше активных.
Моделька мультимодальная с 256к токенов контекста. Архитектура — та же вариация на тему DeepSeek V3 что использовалась в . Доступна по Apache 2.0, базовую модель не выложили, но зато сделали голову для спекулятивного декодинга.
Веса: https://huggingface.co/mistralai/Mistral-Small-4-119B-2603/ https://huggingface.co/mistralai/Mistral-Small-4-119B-2603-NVFP4
35,200
156
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Партнеры Nvidia открыли предзаказы на DGX Station
Это десктопная машинка с одной GB300 на 748 гигов оперативки внутри (треть из этого HBM 3E, остальное LPDDR5X). Цены начинаются на отметке в $87k.
34,900
252
эйай ньюз
26 мар. 2026 г., 23:47
📷 Photo
Midjourney V8 alpha!
Все долго ждали новой модели от MJ и вот она (ну почти)!
Что обещают:
— лучшее понимание сложных промптов
— сильнее personalization / sref / moodboards
— более детальные и цельные картинки
— лучше рендер текста, особенно если писать его в кавычках
— генерация примерно в 5 раз быстрее
Что важно:
— есть --hd (нативный 2K) и --q 4 для большей когерентности
— поддерживаются --raw, --chaos, --weird, --exp
— --hd, --q 4, sref и moodboards сейчас в 4 раза дороже и медленнее
Сами Midjourney советуют для лучших результатов активнее использовать длинные промпты, --raw, sref и moodboards.
Я потестил на простых коротких промптах - ну такое. Модель еще явно недотренена.
Ранний доступ к модели тут: http://alpha.midjourney.com/.
https://t.me/ai_new
28,600
эйай ньюз
24 мар. 2026 г., 05:14
Нейродайджест за неделю (#109)
LLM
- — Gemini Embedding теперь может нативно обрабатывать до 120 секунд видео, PDF, аудио и текст.
- — убрали повышенную цену за длинные запросы для Sonnet/Opus 4.6. А на следующие две недели ещё и в не-пиковые часы.
Генеративные модели
- — Adobe завезли прикольную фичу, которую анонсировали еще очень давно. Композить еще никогда не было так легко.
Прочее
- — Оптимизирован под Blackwell. Даёт до 1.3x ускорения для BF16, а весь код теперь написан на Python с CuTe-DSL.
>
#дайджест
30,900
62
0
эйай ньюз
24 мар. 2026 г., 05:14
📷 Photo
Тут Хуанг опять сливает размеры моделей OpenAI
Похоже в GPT-5 всего два триллиона параметров. Раньше он так же показывал количество параметров для GPT-4 (GPT MoE 1.8T). То есть у OpenAI размер флагманской модели за три года не вырос совсем.
32,500
352
эйай ньюз
24 мар. 2026 г., 05:14
📷 Photo
У Claude теперь по дефолту миллион токенов контекста
Повышенную цену за запросы больше определённой длины убрали. Расширенный контекст доступен и с Sonnet 4.6 и с Opus 4.6 , причём не только по API, но и в Claude Code по подписке Max, Team и Enterprise. А вот пользователей чата обделили, но они и не смотрят на compacting по полдня.
40,400
405
эйай ньюз
24 мар. 2026 г., 05:14
🎥 Video
У Claude теперь по дефолту миллион токенов контекста Повышенную цену за запросы больше определённой длины убрали. Расширенный контекст доступен и с Sonnet 4.6 и с Opus 4.6 , причём не только по API, но и в Claude Code по подписке Max, Team и Enterprise. А…
36,300
487
эйай ньюз
24 мар. 2026 г., 05:14
🎥 Video
Прикольную штуку в фотошоп завезли - поворот 2d картинок!
По демо оценить скорость и качество сложно - кажется видео тут ускорено. Но это наверное какая-то мелкая real-time диффузия.
31,400
273
эйай ньюз
22 мар. 2026 г., 21:48
Тут мои товарищи ищут себе мощного Senior Backend Engineer (Node.js/TypeScript, AI/LLM)
AI-апп для женщин про питание и образ жизни для ежедневного использования. Внутри — AI-ассистент, интеграции с сервисами и партнёрами, которые помогают пользователю удобно управлять своим питанием и образом жизни. Компания находится в Дубае
Продукт на стадии запуска MVP и ищут инженера. Нужен сильный инженер на part-time с 2-недельным тестовым периодом (с перспективой перехода на full-time) для поддержки и развития существующего бэкенда, который поможет сделать систему стабильной, умной и масштабируемой.
Стек:
- Node.js + TypeScript
Fastify
- Supabase (Auth, Postgres, Storage)
- Mastra + AI SDK (стриминг, tools, LLM orchestration)
OpenAPI, EAS/Nixpacks, CI/CD
Задачи:
- Разработать новые фичи
- Привести backend к production-уровню по reliability/security
- Усилить domain-логику (auth, onboarding, nutrition, chat) и убрать критичный техдолг
- Поддерживать фронтенд (React Native).
Обязательные требования:
- 6+ лет в backend-разработке, уверенный senior.
- Глубокий опыт Node.js/TypeScript и высоконагруженных API.
- Практика с Postgres и проектированием схем/миграций.
- Опыт с auth/security (RBAC, secrets, rate limiting, abuse prevention).
- Умение проектировать отказоустойчивые интеграции с внешними AI/API + опыт с Fastify, Supabase, LLM/tool orchestration.
Что важно в работе:
- Высокая степень самостоятельности и технический кругозор.
- Умеение быстро разбираться в существующем коде и приоритизировать риски.
- Применение архитектурных решений с учетом time-to-market и стоимости поддержки
- Умение работать в команде, вести техническую дискуссию, быть на связи и присутствовать на коротких ежедневных синках (≈15 минут).
- Чёткая документация технических решений.
Будет большим плюсом: знание React Native, опыт выпуска релизов в App Store / Google Play и ведения релизного цикла.
Для отклика нужно GitHub/резюме и короткое сопроводительное письмо про 2–3 кейса подъема backend'а из MVP в production.
Писать сюда: https://t.me/LilianaLetai
эйай ньюз
22 мар. 2026 г., 21:48
Вышел Flash Attention 4 https://www.youtube.com/watch?v=ZIEq-WTquy4
(На прошлой неделе)
На этот раз специально оптимизировали под новую архитектуру Blackwell (B200 и GB200), в отличие от . На всяких 5090 дополнительного прироста нет.
Для BF16 даёт до 1.3x ускорения относительно cuDNN 9.13 и до 2.7x по сравнению с Triton! Выжимает солидные 1.6 PFLOPs/s (71% от теоретического пика B200). При этом в новых версиях cuDNN часть этих оптимизаций уже тоже появилась.
Среди ключевых трюков — software-эмуляция exp, conditional softmax rescaling, а в backward — использование tensor memory* и 2-CTA MMA**, что заметно снижает давление на shared memory. К этому бонусом идёт то, что весь kernel код теперь написан на Python (CuTe-DSL) без жестких C++ темплейтов, поэтому компиляция стала в 20-30 раз быстрее.
* Tensor memory — это новый сверхбыстрый on-chip буфер Blackwell рядом с tensor cores, куда можно складывать промежуточные результаты и меньше дёргать shared memory.
** 2-CTA MMA — режим, где одну matmul считает пара CTA (группа потоков), а не одна, что позволяет брать более крупные тайлы и заметно уменьшать shared-memory traffic → backward работает эффективнее.
Для задротов, очень рекомендую вот этот https://www.youtube.com/watch?v=ZIEq-WTquy4 о том, как FA4 работает.
https://github.com/Dao-AILab/flash-attention/blob/main/assets/fa4_paper.pdf
https://github.com/Dao-AILab/flash-attention/tree/main/flash_attn/cute
эйай ньюз
21 мар. 2026 г., 20:54
📷 Photo
Гугл выпустил новую Gemini Embedding — с мультимодальными эмбеддингами!
Новая модель может нативно эмбеддить до 120 секунд видео, 6 страниц PDF ну и аудио с текстом не остались в стороне. Модель доступна как и во free tier, так и в платном API. Эмбеддинги, разумеется, сделаны матрёшкой — куски эмбеддинга сами по себе являются полноценными эмбеддингами, пусть и менее точными.
Цены гугл опять повысил — за текст просят $0.2 за миллион токенов, а вот за мультимодальность цена как-то нездраво растёт — цена за видео доходит до 12 долларов за миллион токенов (15к кадров). Гугл пользуется отсутствием альтернатив — другие фронтирные компании этим не занимаются — те же OpenAI в последний раз обновляли эмбеддинг модели в январе 2024, обновив заодно GPT 3.5 Turbo и GPT 4 Turbo.
30,600
эйай ньюз
19 мар. 2026 г., 20:32
🎥 Video
И снова криповая история про симуляцию, фанаты аниме Пантеон оценят:
Челы загрузили мозг мухи-дрозофилы - нейрон за нейроном - и запустили его в симуляции физического тела (это не нейросеть имитирующая биологию мухи, тут нет весов или тренировки, это именно копия реальных нейронов мухи)
Ее мозг это ~125 000 нейронов и ~50 миллионов синапсов
Сигналы виртуального мира входят в копию, активность бежит по всей системе мухи и вирутальное тело двигается ☕️
Дальше такое же хотят сделать с мышами
Тут больше деталей:
https://eon.systems/
Матрицу для мух мы сделали, поздравляю – хоть для кого-то
27,400
457
эйай ньюз
19 мар. 2026 г., 20:32
Нейродайджест за две недели (#108)
LLM
- —сильно качнули по метрикам и скорости, закрепив за собой звание лучшей открытой модели. Ещё Alibaba выкатила и (от 0.8B до 9B), которые даже в таком размере остались мультимодальными гибридными ризонерами.
- — лучшая в своём классе по бенчам и скорости (до 400 токенов/сек).
- — OpenAI без лишнего шума выкатили новую версию флагманской модели, сразу с Pro-версией.
Генеративные модели
- — Геймчейнджер для видео, который поправляет артефакты генерации. Цена, правда, заоблачная.
- — После и состоялся релиз: бафнули текст и консистентность, но прорыва нет, а нативные 4K нам так и не дали, они апскейлом с оригинала в 1k.
- — Вышел Seedream 5.0 Lite, который, судя по бенчмаркам и тестам, не конкурент Банане, а скорее открытому Qwen.
Прочее
- — Папа Римский призвал священников не использовать AI для проповедей, так как уже лично замечает, как батюшки зачитывают сгенерированные тексты.
- — Исторический раунд от Amazon, Nvidia и SoftBank, в основном в форме компьюта.
- — Qualcomm анонсировали чип, который может запускать 2B-модели на часах со скоростью 10 токенов/сек.
- — Друзья организовали соревнование в Legal-домене с призовым пулом $32к.
- — Описан реальный клинический кейс, как GPT-4o свёл девушку с ума, а новый бенчмарк показывает, что большинство LLM склонны поддерживать бред.
>
#дайджест