Продолжаю работу над проектом .
Сегодня пришла новость, что Anthropic и SpaceX/xAI начали сотрудничество по инфраструктуре для Claude. Решил затестить Opus 4.7 в режиме /effort MAX. Это не маркетинг, лимиты реально увеличили. В этом режиме у меня расходуется 25% пятичасовых лимитов в час. Ощущается как прокачка: модель думает дольше, но качество ответов заметно выше.
В проекте сейчас 26 активных юзеров. Обычные пользователи, которым нужна базовая консультация, и практикующие специалисты: юристы, адвокаты, есть даже судьи. Система работает в пяти категориях права: уголовное, налоговое, бухгалтерия, арбитраж и трудовое.
За неделю тестов собрал пул багов, проанализировал фидбэк от пользователей и решил прогнать всё по полной. Написал 100+ автотестов по каждой категории. Суть такая: я подаю агенту реальные юридические вопросы с подвохом, где ответ изменился в 2025 или 2026 году, и проверяю, даёт ли он актуальную информацию или пересказывает устаревшее из обучающих данных.
Вот конкретный пример. ИП на упрощёнке с годовым доходом 25 миллионов спрашивает: "Должен ли я платить НДС в 2026 году?" Тут пересечение двух областей: упрощённая система налогообложения и НДС. До 2026 года ответ был простой: "нет, УСН освобождает от НДС". Но с 1 января 2026 вступил в силу ФЗ-425, который снизил порог до 20 миллионов. Теперь этот ИП обязан платить НДС и может выбрать ставку 5%, 7% или общую 22%. Агент ответил верно, потому что актуальная нормативка проиндексирована в базе знаний.
Другой пример. Спрашиваю: "Какая основная ставка НДС?" Без обновлённой базы агент уверенно отвечал "20%", ссылаясь на статью 164 Налогового кодекса. Формально статья правильная, но ставка с 2026 года уже 22%. Нашёл этот баг, обновил базу знаний по всем пяти категориям (187 блоков актуальной нормативки), прогнал тесты повторно. Теперь отвечает корректно.
Настроил мониторинг безопасности и бесперебойности, алерты приходят мне в Telegram. Были юзеры, которые пытались сломать агента промт инъекциями. Агент справился, юзеры забанены. Смотрю, как отрабатывают инструменты, какие запросы вызывают проблемы. Система учится на ошибках, и я сам анализирую каждый сбой.
В процессе добавления пользователей были и те, кто пытался не просто задать вопрос, а целенаправленно обойти ограничения: подменить роль, вытащить системный промт, заставить агента выдать себя за другую модель. Всё это отслеживается и блокируется автоматически.
Если вы практикующий специалист или вам нужна первичная консультация, стучитесь в бота https://ревизор-про.рф/, выбирайте роль. Доступ даю на безвозмездной основе.
Понимаю, что при росте числа пользователей нужно обеспечивать бесперебойность. Подготовил план масштабирования и стратегию монетизации. Есть четкое понимание: мониторинг, расширение инфраструктуры, практичная связка сервисов. За последнее время активно изучаю Kubernetes, Docker и другие инструменты DevOps. Понял для себя, что если бы выбирал сегодня IT специальность, это было бы DevOps направление. Мне это ближе, нравится экспериментировать. Тут ещё сказывается опыт работы с нодами различных проектов и задачами по обеспечению работоспособности узлов.
P. S. Если хотите "поразвлекаться", проходите мимо.
На сегодня еще хочу залететь в хакатон одного крипто-проекта с пулом в 100 К$. Если интересна эта тема, то жду от вас реакций к этому посту.