Новая ИИ модель Claude Mythos Preview от Anthropic выглядит как очень громкий анонс
Если коротко: они заявляют, что сделали модель общего назначения, которую особенно сильно прокачали в программировании и логике. И вместе с этим у неё якобы очень сильно выросли возможности в поиске уязвимостей в коде
Причём настолько, что они решили не выпускать её в публичный доступ. Вместо этого модель дадут только ограниченному кругу компаний, которые занимаются поиском и исправлением уязвимостей в критически важном программном обеспечении. Под это Anthropic даже выделяют до 100 миллионов долларов в виде кредитов на использование модели
Звучит мощно. Но лично я здесь настроен довольно скептически
Я реально сильно удивлюсь, если новая модель от Anthropic и правда обладает всеми теми способностями, о которых они рассказывают. Почему? Потому что раньше они уже не раз делали очень громкие заявления о возможностях своих моделей, а когда я потом шёл проверять это в реальных задачах и проектах, то часто разочаровывался
У меня это ощущение тянется ещё со времён моделей после Sonnet 3.5. Много раз видел на практике, как в разные периоды Gemini Pro и модели GPT оказывались заметно сильнее, чем модели Anthropic. Я и сейчас продолжаю всё это тестировать и сравнивать, и лично для себя пока вижу, что Anthropic во многом отстают
Где они мне нравятся больше всего — это визуальная часть. Они действительно часто хорошо делают красивые интерфейсы. Плюс есть ощущение, что они неплохо работают с инструментами, а это важно для агентских сценариев, где модель не просто пишет текст, а выполняет действия по шагам
Поэтому в очередные ошеломляющие заявления от Anthropic я, честно говоря, не очень верю
Что здесь реально вызывает у меня доверие:
они приводят конкретные примеры,
и при этом не дают модель всем подряд в открытый доступ
Из того, что они описывают, Mythos Preview якобы смогла:
— найти 27-летнюю уязвимость в OpenBSD (операционная система, которую считают одной из самых защищённых в мире);
— найти 16-летнюю уязвимость в FFmpeg (популярный инструмент для обработки видео), которую до этого не замечали обычные автоматические проверки;
— самостоятельно собрать цепочку из нескольких уязвимостей в Linux (операционная система, на которой работает огромное количество серверов), чтобы получить полный контроль над машиной.
Если это правда, это уже очень серьёзный уровень 🔥
Самый важный вывод здесь даже не в самой модели, а в общем тренде: возможности таких систем растут очень быстро. И если сегодня они умеют лучше искать слабые места в коде, то завтра это уже может сильно повлиять и на безопасность, и на разработку, и вообще на то, как будет устроена работа с технологиями
В общем, я пока без восторгов.
Смотрю на это с интересом, но без слепой веры в маркетинг.
А вы вообще пробовали работать с моделями Anthropic?
Какой у вас был опыт по сравнению с GPT и Gemini? Расскажите в комментах 👇
https://red.anthropic.com/2026/mythos-preview/