Быстро кончаются лимиты в Claude / Claude Code? Ща решим.
😯 Держите 4 правила, после которых забудете, что такое /API Error You've hit your limit · resets 8:30pm. Бонус в конце — как обходить лимит, если всё же упёрся.
Сначала матчасть — за что мы вообще платим:
Claude считает не запросы, а токены — кусочки текста, которыми обменивается ты и модель. PRD на 5 страниц = ~2-3к токенов. Один жирный промпт с большим контекстом легко съедает 10-20к.
Одновременно у тебя работают три лимита:
— Сессионный — 5-часовое окно, сбрасывается автоматически
— Недельная квота — общий объём за 7 дней
— Разные модели жрут по-разному: Opus летит быстрее, Sonnet средне, Haiku еле трогает квоту
И главное, что почти никто не понимает: проблема не в лимитах, а в том, что Opus гоняют на всё подряд. Ниже покажу, как это исправить.
Правило 1. Opus думает. Sonnet делает.
Жирнейшая фишка — команда /model opusplan. Это встроенный альяс, который сам переключает модели в одной сессии:
— Plan Mode → подключается Opus 4.7 (думает, проектирует, разбирает архитектуру)
— Execute → переключается на Sonnet 4.6 (исполняет, пишет код)
Результат: −60-80% токенов на той же задаче. Качество не падает. Потому что Opus тратится только на стратегию, а исполнительную работу делает Sonnet.
Это распределение работы, как в нормальной команде — архитектор не клеит обои))
Правило 2. Не юзай Opus на всё подряд.
Команда /model даёт три варианта. Выбирай осознанно:
⭐️ OPUS 4.7 ($$$) — архитектура, стратегия, сложный ресёрч, когда нужна реальная сила
⭐️ SONNET 4.6 ($$) — ежедневная работа: PRD, письма, код, анализ. Твой рабочий конь
⭐️ HAIKU 4.5 ($) — быстро, часто, массово. В 3 раза дешевле Sonnet
Лайфхак, который перевернёт ваш расход: Haiku тащит ~90% задач Sonnet при 3-кратной экономии. Если ты всё подряд пишешь на Sonnet/Opus — ты просто сжигаешь квоту.
Правило 3. /clear — твой лучший друг.
Каждая новая задача = новая сессия. Если тащишь старый контекст в новую тему — Claude перечитывает всё целиком каждый раз. И каждый раз это новые токены, новый расход квоты.
Три команды для гигиены контекста:
— /clear — стирает контекст начисто
— /compact — сжимает длинную сессию, оставляет суть
— /rewind — откат к конкретной точке разговора
Правило большого пальца: новая тема → /clear. Экономит часы работы и реальные деньги на квоте.
Правило 4. Не пиши промпт дважды.
Длинный промпт, который ты пишешь каждый раз — съедает токены при каждом запуске. Если делаешь однотипную задачу регулярно используй скиллы. Это одна команда, которая подтягивает инструкцию из файла.
# было:
400 слов промпта. каждый раз.
# стало:
> /go-digest
→ Claude сам подтягивает инструкцию из файла
→ −80% токенов на повторной задаче
Один раз настроил — забыл и пользуешься.
Если всё же упёрся в потолок — три обходных пути:
Переключись на Sonnet/Haiku — у них лимиты считаются отдельно
Подожди 5 часов — сессионное окно сбрасывается автоматически
Enterprise-стек: AWS Bedrock / Vertex AI / Azure Foundry — Claude через них работает с другими квотами
Бонус-команда, которая спасёт квоту:
/cost — показывает сколько токенов потратил, какой % недельной квоты ушёл, когда сброс.
Проверяй раз в день первую неделю — и ты поймёшь свой реальный расход. Большинство сжигают 80% квоты на 20% задач, которые можно было сделать на Haiku за копейки))
🔥 — если зашло. В след посте разберу еще более имбовые фишки.
➕ Кстати, еще больше пользы по ИИ / вайбкодинг в (остается 24 часа, чтобы залететь)