Мои любимчики из http://Z.ai/ на днях опенсорснули GLM-5.1 — своего нового флагмана для агентного кодинга. В https://z.ai/subscribe?ic=NWHTZAEKOW эта модель была доступна уже около недели.
Этот релиз был призван решить следующую проблему: большинство текущих моделей быстро выдыхаются. Они натренированы на коротких трейсах задач и плохо работают в длинной перспективе — они просто начинают ходить по кругу и галлюцинировать. Это видно на длинных агентских чатах со всеми открытыми моделями, и с GLM, по пятую версию, в частности.
Утверждается, что GLM-5.1 спроектировали так, чтобы модель не сходила с ума на марафонских дистанциях. Она умеет разбивать сложную задачу, ставить эксперименты, вдумчиво читать логи, находить блокеры и пересматривать стратегию сотни итераций подряд. Чем дольше крутится агент, тем лучше результат.
Что по цифрам:
▶️ SWE-Bench Pro:
58.4% (обходит GPT-5.4 с её 57.7% и Claude Opus 4.6 с 57.3%).
▶️ VectorDBBench (600+ итераций):
Модели дали пустой скелет на Rust и пустили в свободное плавание. Она сама писала код, компилила, профилировала и решала, что менять дальше. За 600+ сабмитов и 6000+ вызовов инструментов она разогнала базу до 21.5k QPS — это примерно в 6 раз быстрее прошлого рекорда Opus 4.6, поставленного за короткую 50-ходовую сессию. Модель сама додумалась сменить алгоритмы поиска и переписать пайплайн.
▶️ KernelBench (1000+ ходов):
Автономно оптимизировала PyTorch GPU-ядра, выдав ускорение в 3.6 раза.
▶️ Linux-десктоп в браузере (8 часов):
Дали голый промпт написать ОС-подобный UI в вебе. Модель молотила 8 часов без вмешательства carbon based lifeforms: написала базовый layout, потом сама разобралась, чего не хватает, поочередно добавила файловый менеджер, терминал, калькулятор и игры, сведя всё в стильный и рабочий проект.
Веса модели полностью открыты под MIT. Никаких мутных лицензий, всё уже лежит на HuggingFace и ModelScope, поддерживается запуск через vLLM и SGLang. Если у вас есть мощности для запуска модели на 754 миллиарда параметров, то дерзайте! А ежели вы простой люд, вроде меня, то можете просто подписаться на https://z.ai/subscribe?ic=NWHTZAEKOW (реф, дает 10% скидку). Я регулярно пользуюсь планом для второстепенных задач, типа индексации кодовой базы в документацию, но в хвиттере вижу, что именно версию 5.1 выделяют и хвалят. Думаю, в некоторых сценариях она может заменить проприетарные флагманские модели. На сайте плана есть документация по интеграции в любой тулинг, от Claude Code до Cursor.
https://z.ai/blog/glm-5.1