Claude Code незаметно утроил мне расход токенов. И я нашёл причину и исправил её
Сел сегодня разбираться, почему лимиты Max-подписки начали улетать просто на глазах. Месяц назад я мог работать с утра до вечера и даже половину недельного окна не сжирать. А сейчас - треть лимита за два дня не самой напряжённой работы, при том что делаю я ровно то же самое.
Сначала подумал, что меня накрыло то, про что сейчас все жалуются на Reddit ("лимиты порезали"). Полез копать свои логи. Оказалось гораздо интереснее.
Антропик потихоньку делает вроде классные, но хитрые вещи, которые заставляют тебя тратить больше денег и лимитов - при том что никаких радикальных изменений как бы и не произошло.
1. 1М контекст по умолчанию
2. Убрали опцию "очистить контекст и имплементировать" при выходе из план режима
1M контекст штука мощная, но пользоваться им надо очень с умом.
Пока что я вернулся на 200К модель, а сделать это можно только через конфиг - из меню выбора моделей они это хитро убрали. И вернул опцию очистки контекста после плана. Ну и сижу смотрю что можно выкинуть из того, что подгружается автоматом.
Полагаю, что через какое-то время Антропики и эти возможности отрубят, да и вообще есть некая гипотеза, что 1М модель на 20% контексте работает лучше, чем 200К модель на 80% контексте, поэтому возможно есть способ включить 1М но поставить жесткий авто-компакт на 180-200К, но, конечно же, такой настройки нету и придётся мудрить с хуками.
Пока не стал возиться, но сделал дополнение для статуслайна, которое показывает мне вот этот снежный ком накопившегося контекста, а также моё предыдущее сообщение (чтобы напоминать мне про тяжелые картинки и пдф скопированные прямо в клод кода). И также номер сообщения по порядку - чтобы тоже не превращать всё в бесконечные чаты.
Выглядит так: "#12 · last 356 · next 113K".
Расскажу наверно отдельно и могу поделиться скриптом. Там было немного замороченно его считать, полчасика пришлось поковыряться и потестировать.
Весь разбор с графиками, цифрами и двумя строчками в settings.json, которые возвращают расход обратно - собрал в https://medium.com/@timmukhin/claude-codes-1m-context-trap-will-make-you-poor-436fee224e04
Если у вас Max и вы тоже с марта замечаете, что лимиты тают быстрее - загляните. Дело не в вас 🙂
Upd: в сегодняшнем контексте «если у вас МАХ» звучит неоднозначно 🤣 только заметил
—
4 оставшихся слайда и pdf на русском в комментах к посту.