Последний год с перерывами я собирал свою шайтан-машину для сайтов. Не конструктор «на коленке», а генератор, который сам собирает контент, эмбединги, структуру и на выходе дает готовые статические сайты под разные задачи 🚀
Главная идея проста: текст должен на 100% закрывать интент и максимально перекрывать n‑gram’ы из топа. Если документ и по смыслу, и статистически похож на то, что уже ранжируется (но чуть лучше закрывает потребность пользователя), даже свежий домен без ссылок начинает довольно быстро двигаться ⚡️
Что делает система:
1. Собирает выдачу и семантику
Я прогоняю ключи, снимаю SERP, вытаскиваю тексты топов, метаданные и их сниппеты. Все складывается в RAG, чтобы работать с уже готовым «слепком ниши». Параллельно локальная LLM‑модель проверяет: а вообще то ли я собираю? Например, в выдаче Бразилии могут быть сайты из Португалии, и если использовать контент с них, получим инфу про европейские платежки и бонусы в евро — оно не мержится с бразильским реалом. Если так, донор уходит в мусор 🧹
2. Строит эмбединги и каркас
Тексты превращаются в вектора — по сути, в координаты смыслов, чтобы понимать, как выглядят «нормальные» документы в этой теме. Параллельно выделяются типичные блоки: h2/h3, FAQ, плюсы/минусы, how‑to, money‑блоки, требуемый объём текста. На выходе получается каркас статьи/кластера. Тут заходят дешевые модели OpenAI, можно и локальные подключать 💡
3. Генерирует и проверяет контент
LLM пишет текст не в вакууме: она опирается на RAG, каркас и n‑gram профиль топа. Если покрытие слабое — блоки перегенерируются, пока документ не станет и читабельным, и статистически «правильным» под тему. Большие блоки я иногда пишу через Claude AI, а если нужно сэкономить бюджет, подключается Deepseek (в 10 раз дешевле). Все настраивается по желанию
4. Собирает готовый сайт
Дальше все заливается в шаблоны: HTML, тема, цвета, меню, перелинковки, schema(.org), офферы, OG‑картинки и т.д. На выходе — готовый статический сайт. Можно сразу сгенерить сетку или соло-проект. Важный момент: каждый сайт в сетке уникален и по цветам, и по именам стилей, и по адресам редиректных папок на офферы. Минимум футпринтов 👣
Какие сайты я так делаю:
- Review‑сайты:
Классические обзоры брендов + категории и SEO‑страницы под «лучшие казино для…».
- Showcase / витрины:
Много карточек казино, фильтры, навигация по кластерам, плюс SEO‑блоки внизу.
- Гибриды:
Витринная логика + сильные обзоры и кластеры под длинный хвост.
- Одностраничники под бренд/оффер:
Один домен — одна страница, но с нормальным контентом: hero, преимущества, FAQ, SEO‑секция, юр‑блоки.
Почему мне был не нужен «еще один генератор текстов»
Цель была не сделать кнопку «написать статью», а собрать пайплайн, который понимает нишу и выдачу: от сбора SERP и эмбедингов до проверки n‑gram покрытий и финального билда сайта. Поэтому весь вайб‑код растянулся почти на год. Зато теперь можно взять новое гео, закинуть домены и через пару часов получить сетку сайтов, которая изначально заточена под интент и реальный паттерн топа, а не просто под «очередной AI‑текст»
Если зайдет, в отдельном посте могу подробно разобрать именно контентную часть и n‑gram проверку.
Если полезно — поставь огонек 🔥
#мойстек