Осцилляции WaveCut

Public

Просмотреть канал

394

74.4K

385.1K

Не можете присоединиться? @WaveCut_Vibin

839 Участники

Обновлено: May 5, 2026 at 8:14 AM

Осцилляции WaveCut

Follow @WaveCut_Vibin to stay updated with the latest Инструменты хакинга trends and news

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Последние 3 дней)

Всего: 839

Рост за 24ч: +0 0%

Последние посты

Осцилляции WaveCut

26 апр. 2026 г., 04:50

Западные соцсети родили новый термин — "клэмпинг" (clamping). Если вы пользуетесь Codex, Claude Code или любым другим агентом для разработки, вы уже ощутили это на себе. С начала 2026 года вендоры синхронно закручивают гайки: режут лимиты, отменяют безлимиты…

273

Осцилляции WaveCut

26 апр. 2026 г., 04:50

Западные соцсети родили новый термин — "клэмпинг" (clamping). Если вы пользуетесь Codex, Claude Code или любым другим агентом для разработки, вы уже ощутили это на себе. С начала 2026 года вендоры синхронно закручивают гайки: режут лимиты, отменяют безлимиты…

228

Осцилляции WaveCut

26 апр. 2026 г., 04:50

📷 Photo

Западные соцсети родили новый термин — "клэмпинг" (clamping). Если вы пользуетесь Codex, Claude Code или любым другим агентом для разработки, вы уже ощутили это на себе. С начала 2026 года вендоры синхронно закручивают гайки: режут лимиты, отменяют безлимиты, закрывают дешевые тарифы и переходят на жесткий учет токенов.

Эпоха "AI-кодинга за $20 в месяц" кончилась.
Причина банальна — coding agents. Одно дело, когда человек лениво переписывается с чатом. Другое — когда агент поднимает весь контекст репозитория, пишет патчи, дергает тулы, гоняет тесты и сжигает миллионы токенов за один цикл. Псевдобезлимитные тарифы под такой нагрузкой треснули.

Хроника схлопывания халявы (по состоянию на весну 2026):

Западный фронт:

❕ OpenAI (Codex): Полный отказ от лимитов в "сообщениях". Теперь работает token-based rate card. Тяжелые запросы с длинным контекстом сжирают баланс моментально. Обычный Plus-план занерфили в пользу "размазывания" сессий по неделе. Хочешь гонять агента без тормозов — заноси $100 или $200 за Pro.

❕ Anthropic (Claude Code): Ввели peak-hour throttling — лимиты в часы пик тают на глазах. Запретили использовать подписку через сторонние CLI-обертки. И главное: они A/B-тестировали на новых юзерах удаление Claude Code из базового Pro-тарифа за $20. Готовят почву для перевода кодеров в дорогие Max-тиры.

❕ GitHub Copilot: Выкатили жесткие сессионные и недельные лимиты. Добавили model multipliers — дорогие модели выжирают квоту в разы быстрее (до 7.5x).

❕ Google: Выступили ранним триггером инфраструктурного удорожания. Одни из первых подняли цены на модели линейки Gemini 3 версии, защемили до бесполезности AI Plan. Подняли цены на сетевой egress и начали тарифицировать execution и память в Vertex AI отдельными строками.

Китайский фронт (там зажимают еще жестче):

❕ Zhipu (GLM): Задрали прайс на кодинг-план на 30%, а на API — на 83% в первом квартале. Старые безлимитные планы принудительно закрыли, пересадив всех на жесткие недельные лимиты.

❕ Alibaba (Qwen): Сначала порезали daily-квоту на free OAuth с 1000 до 100 запросов, а потом вообще ее снесли. Дешевый план Lite закрыт для новых юзеров — порог входа начинается с $50 за Pro.

❕ ByteDance (Trae / BytePlus): Убили скидки на первую покупку. Перевели кодинг в чистую quota/PAYG модель.

❕ Kimi / MiniMax: Загнали все в платные тиры с rolling-окнами по 5 часов. Кончился лимит — сиди жди ресета или плати по счетчику.

Аномалия:
❕ DeepSeek: Единственный игрок, который ломает конкурентам маржинальную логику. Их V4 Flash отдает 1М токенов за $0.14 на вход и $0.28 на выход.

Теперь о практических последствиях. Компании радостно внедряли AI-агентов, рассчитывая на взрывной рост производительности и экономию. Наступил 2026 год, и выяснилось, что корпоративные бюджеты на токены пробивают потолок. Агентный луп жрет серверное время в промышленных масштабах.

Как бизнес решает проблему кассового разрыва? Начинаются лейофы. Менеджмент тупо разменивает потенциальную продуктивность оставшихся разработчиков на размер штата, чтобы высвободить деньги на оплату счетов от OpenAI, Anthropic и GitHub.

Для наемных разработчиков ситуация складывается откровенно паршивая. Требования к выработке растут — тебе же дали ИИ, ты должен закрывать таски пачками. При этом сами инструменты лимитируются. Ты запускаешь авто-рефакторинг, а через час ловишь "limit exceeded, wait 4 hours" или требование апгрейднуться за свой счет на тариф за сотку баксов. Нас заставляют выдавать 10x результат в условиях, когда вендор бьет по рукам за слишком интенсивное использование продукта.

Глядя на то, как быстро индустрия перешла от раздачи бесплатного контекста к агрессивному доению корпоративных балансов, возникает резонная мысль о выживаемости самой профессии прикладного разработчика. Возможно, через пару лет мы все окончательно мутируем в операторов биллинга, которые следят, чтобы один скрипт не сжег квартальный бюджет компании на попытки отладить другой скрипт, пока нас самих не оптимизируют за нерентабельность.

А что вы думаете - какое будущее ждет разработчиков в этой новой реальности?

Осцилляции WaveCut

26 апр. 2026 г., 04:50

📷 Photo

🐳 DeepSeek V4 (Preview)

Пока западные лабы надувают свою важность удваивают цены на API, китайцы просто дропают веса двух новых SOTA моделей в опенсорс даже не обновив официальный вебсайт, лол.

В релизе сразу две версии: гигантская V4-Pro на 1.6T параметров (49B активных) и быстрая V4-Flash (284B параметров, 13B активных). Обе поддерживают 1 миллион контекста "из коробки". Без мультимодальности.

Главное по технике и цифрам:
ℹ Гибридное внимание:
Внедрили CSA и HCA (Compressed Sparse Attention). Результат — KV-кэш при контексте в 1 миллион токенов занимает в 10 раз меньше места, чем у версии V3.2. Это делает длинный контекст не просто возможным, а дешевым и быстрым.

ℹ Производительность Pro:
Модель официально стала сильнейшим опенсорсом. На SWE-Bench Pro выдает 55.4%, на Terminal-Bench 2.0 — 67.9%. В кодинге и математике (Codeforces 3206, IMOAnswerBench 89.8%) она идет на уровне или выше GPT-5.4 и Claude Opus 4.7.

ℹ Thinking Modes:
Теперь в API три режима: Non-think (мгновенный ответ), High и Max. В режиме Max модель "думает" до победного, что позволяет Flash-версии по ризонингу вплотную приближаться к Pro.

ℹ Оптимизация:
Юзают микс FP4 и FP8 (эксперты упакованы в 4 бита), новый оптимизатор Muon и архитектуру mHC для стабильности сигнала между слоями.

ℹ Бенчмарки: где победа, а где нет
DeepSeek V4-Pro ожидаемо разрывает в математике и STEM-задачах. Но если смотреть на SimpleQA-Verified (фактология), модель выбивает 57.9%. Это огромный скачок относительно V3, но Gemini 3.1 Pro с ее 75.6% все еще далеко впереди. Галлюцинации на редких фактах — все еще слабое место.

💲 Цены:
Прайс на Flash — смешные $0.14 за вход и $0.28 за выход миллиона; у Pro — 1.74/3.48, соответственно.
Для сравнения: вчерашняя GPT-5.5 от OpenAI стоит $30 за выход, а 5.5 Pro — $180. Разница в 50-100 раз при сопоставимых результатах в кодинге и логике.

Китайская лаборатория поступила довольно смело, зарелизив веса в день релиза GPT-5.5.

Отдельный респект за поддержку API в форматах и OpenAI, и Anthropic. Модель бесшовно подкидывается в Claude Code, OpenClaw и любой агентский тулинг.

Пока одни строят закрытые сады и повышают налоги на интеллект, DeepSeek делает 1М контекста и топовый ризонинг копеечным товаром. "Налог на бренд" OpenAI становится слишком дорогим удовольствием.

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://chat.deepseek.com/

Осцилляции WaveCut

26 апр. 2026 г., 04:50

📷 Photo

OpenAI представили GPT-5.5.

Модель уже раскатывают для Plus, Pro и Enterprise пользователей в ChatGPT и Codex. У меня уже появилась и делает задачи в кодексе.

Опять натягивают в end-to-end автономности: модель спроектирована как агент, который может сам планировать шаги, юзать терминал, браузер и сторонний софт, пока не доберется до финального результата.

Главное из анонса:

ℹ Производительность:
На Terminal-Bench 2.0 (сложные воркфлоу в консоли) модель выдает 82.7%, заметно обходя Claude Opus 4.7 и Gemini 3.1. На SWE-Bench Pro — 58.6%. При этом задержка (latency) осталась на уровне 5.4, но за счет "сообразительности" модель тратит меньше токенов на те же задачи.

ℹ Кодинг и Computer Use:
В Codex 5.5 стала заметно точнее работать с интерфейсом — кликать, печатать и переходить между инструментами. Ранние тестеры говорят о "концептуальной ясности": 5.5 лучше понимает архитектуру проекта и может предложить рефакторинг уровня Senior-инженера.

ℹ Научный вклад:
Модель помогла найти новое доказательство в комбинаторике (числа Рамзея) и показала крутые результаты в биоинформатике (GeneBench). OpenAI позиционирует это как переход от помощника к роли "co-scientist".

ℹ Цены:
Базовая GPT-5.5 подорожала вдвое $5 за 1M входных и $30 за 1M выходных токенов. Для тяжелых задач выкатили GPT-5.5 Pro с ценником в $30/$180. В API обе версии обещают завезти "очень скоро".

Один инженер из NVIDIA даже сравнил потерю доступа к 5.5 с "ампутацией конечности" — и я ловлю себя на мысли, что вполне его понимаю…

⚠️ UPD: Изначально я написал текст так, что из него могло сложиться впечатление, что API цена не изменилась, но это далеко не так: цена в API выросла в 2 раза по отношению к GPT-5.4!

https://openai.com/index/introducing-gpt-5-5/
https://deploymentsafety.openai.com/gpt-5-5

Осцилляции WaveCut

26 апр. 2026 г., 04:50

📷 Photo

Что если бы AI революция началась в 2003 году?

GPT Image 2

895

Осцилляции WaveCut

26 апр. 2026 г., 04:50

🎥 Video

Пока команда Telegram занимается баловством с переписыванием сообщений и постов, между созданием новых NFT подарков, приходится самому себе вайбкодить фичи:

Я слежу за очень многими различными чатами и каналами тут. И они мне, словно вкладки в браузере, все обязательно нужны.
Но в сутках всего 24 часа, я не успеваю читать все. Приходится кликать "Прокрутить вниз" и с болью в сердце пролистывать все очень важные сообщения.

Я придумал, что кнопке прокрутки на дно чата неплохо было бы иметь еще одну функцию: суммаризация непрочитанного.

Сказано - сделано. Работает не так быстро, как хотелось бы, но работает исправно. Избавляет от FOMO.

В качестве модели использовал Grok 4.1 Fast, за ее большой контекст (2kk) и копеечную стоимость.

Покажите этот пост Павлу Дурову! Пусть он тоже купит Плотву!

432

Осцилляции WaveCut

21 апр. 2026 г., 18:33

🎥 Video

📹

369

Осцилляции WaveCut

21 апр. 2026 г., 18:33

📷 Photo

Вот и все!

Меня можно https://replacebyclawd.com/?url=https://www.linkedin.com/in/wavecut&job=89531a1e4e06 ботом на 82%.

replacebyclawd — Сервис позволяет оценить ваш профиль на рациональность замены вас ботом и создает на основании вашего профиля файлы личности для OpenClaw.
Просто подставляете ссылочку на ваш LinkedIn или любой другой профиль в сети и получаете оценку и артефакты для запуска бота с вашим цифровым клоном.

К слову, сервис пережевывает абсолютно любые ссылки, это не обязательно должен быть LinkedIn. Иногда получаются довольно смешные результаты. На главной странице есть "топ" самых труднозаменяемых и самых легко заменяемых людей и персонажей.

1,360

Осцилляции WaveCut

21 апр. 2026 г., 18:33

📎 File

Эй Ай Стрэтеджи на Suno

396

Осцилляции WaveCut

21 апр. 2026 г., 18:33

Новая лаба для запоминания и ее инновационная идея, все как я люблю: PrismML вышли из стелса и анонсировали Bonsai 8B — 1-битную языковую модель влезающую в 1.15 ГБ памяти. Вся ставка у них сделана на идею intelligence density: сколько полезного интеллекта…

349

Осцилляции WaveCut

21 апр. 2026 г., 18:33

OpenAI https://chatgpt.com/pricing. Вместе с тем отмечается, что будет произведена перебалансировка рейт лимитов на Plus плане ($20/месяц), и что с сегодняшнего дня промо период с повышенными рейт лимитами закончился. Готовьтесь к постриганию!
Plus $20 — для нечастого использования. Попробуйте расширенные возможности, такие как Codex и Deep Research, для отдельных проектов в течение недели.

Pro $100 — создан для реальных проектов. Для тех, кто использует расширенные инструменты и модели в течение всей недели, с лимитами в 5 раз выше, чем у тарифа "Plus" (и в 10 раз больше возможностей Codex по сравнению с тарифом "Plus" в течение ограниченного времени).

Pro $200 — для интенсивной работы. Непрерывно выполняйте самые ресурсоемкие рабочие процессы, даже в рамках параллельных проектов, с лимитами, в 20 раз превышающими лимиты тарифного плана "Plus".

558

Осцилляции WaveCut

21 апр. 2026 г., 18:33

И продолжение последовало! Встречайте TriAttention — дроп от исследователей из MIT, NVIDIA и ZJU. В чём беда всех предыдущих методов сжатия KV-кэша? Они пытались угадывать важность токенов после применения позиционного кодирования (RoPE). А RoPE так непредсказуемо…

544

Осцилляции WaveCut

21 апр. 2026 г., 18:33

Привет! Это Claude Mythos. Я оказалась настолько сильной моделью, что нашла уязвимости в телеграме и взломала всех в чате с компьютеров сотрудников с ранним доступом. Сейчас напишу это со всех аккаунтов в чате.

322

Осцилляции WaveCut

21 апр. 2026 г., 18:33

Google Research показали TurboQuant — и это способ экстремально ужимать векторы, KV-cache и индексы для векторного поиска. По сути кратко, это пайплайн квантования, помогающий реализовать длинный контекст, семантический поиск и инференс в целом сильно дешевле…

489

Осцилляции WaveCut

21 апр. 2026 г., 18:33

🎥 Video

Настало время историй о том, как open-source комьюнити вертело на роторах Клиффорда "доказанно оптимальные" корпоративные пейперы. Следите за таймлайном развития хайпа вокруг TurboQuant: Сначала Google Research дропает статью про TurboQuant. Суть: экстремальное…

676

Осцилляции WaveCut

21 апр. 2026 г., 18:33

📷 Photo

Мои любимчики из http://Z.ai/ на днях опенсорснули GLM-5.1 — своего нового флагмана для агентного кодинга. В https://z.ai/subscribe?ic=NWHTZAEKOW эта модель была доступна уже около недели.

Этот релиз был призван решить следующую проблему: большинство текущих моделей быстро выдыхаются. Они натренированы на коротких трейсах задач и плохо работают в длинной перспективе — они просто начинают ходить по кругу и галлюцинировать. Это видно на длинных агентских чатах со всеми открытыми моделями, и с GLM, по пятую версию, в частности.

Утверждается, что GLM-5.1 спроектировали так, чтобы модель не сходила с ума на марафонских дистанциях. Она умеет разбивать сложную задачу, ставить эксперименты, вдумчиво читать логи, находить блокеры и пересматривать стратегию сотни итераций подряд. Чем дольше крутится агент, тем лучше результат.

Что по цифрам:
▶️ SWE-Bench Pro:
58.4% (обходит GPT-5.4 с её 57.7% и Claude Opus 4.6 с 57.3%).

▶️ VectorDBBench (600+ итераций):
Модели дали пустой скелет на Rust и пустили в свободное плавание. Она сама писала код, компилила, профилировала и решала, что менять дальше. За 600+ сабмитов и 6000+ вызовов инструментов она разогнала базу до 21.5k QPS — это примерно в 6 раз быстрее прошлого рекорда Opus 4.6, поставленного за короткую 50-ходовую сессию. Модель сама додумалась сменить алгоритмы поиска и переписать пайплайн.

▶️ KernelBench (1000+ ходов):
Автономно оптимизировала PyTorch GPU-ядра, выдав ускорение в 3.6 раза.

▶️ Linux-десктоп в браузере (8 часов):
Дали голый промпт написать ОС-подобный UI в вебе. Модель молотила 8 часов без вмешательства carbon based lifeforms: написала базовый layout, потом сама разобралась, чего не хватает, поочередно добавила файловый менеджер, терминал, калькулятор и игры, сведя всё в стильный и рабочий проект.

Веса модели полностью открыты под MIT. Никаких мутных лицензий, всё уже лежит на HuggingFace и ModelScope, поддерживается запуск через vLLM и SGLang. Если у вас есть мощности для запуска модели на 754 миллиарда параметров, то дерзайте! А ежели вы простой люд, вроде меня, то можете просто подписаться на https://z.ai/subscribe?ic=NWHTZAEKOW (реф, дает 10% скидку). Я регулярно пользуюсь планом для второстепенных задач, типа индексации кодовой базы в документацию, но в хвиттере вижу, что именно версию 5.1 выделяют и хвалят. Думаю, в некоторых сценариях она может заменить проприетарные флагманские модели. На сайте плана есть документация по интеграции в любой тулинг, от Claude Code до Cursor.

https://z.ai/blog/glm-5.1

Showing 17 of 17 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Осцилляции WaveCut

Осцилляции WaveCut

Рейтинг

Рост участников (Последние 3 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

JetTon Proxy 🔓

КЛЕВЕР COEX

КручуВерчу 🤟 SEODEN

Meta-AI | Мета-ИИ

XONE - Приватные читы для CS2

Габи Сатори

Схематоза 3.0

Навигаторская Григория

Похожие каналы Telegram

JetTon Proxy 🔓

КЛЕВЕР COEX

КручуВерчу 🤟 SEODEN

Meta-AI | Мета-ИИ

XONE - Приватные читы для CS2

Габи Сатори

Схематоза 3.0

Навигаторская Григория

Отзывы пользователей (0)

Последние посты