
Обновлено: May 6, 2026 at 5:49 PM
Эй ай надзор
Loading...
Рейтинг
Требуется вход
Loading...
Loading recommended channels...

Follow @ai_archnadzor to stay updated with the latest keywords and mlops trends and news
Пока нет отзывов. Будьте первым, кто поделится своим опытом!
,
Текст статьи...
2. Предсказание индексов (Index Prediction): Специализированная модель (семейство IndexLM на базе Qwen3 от 0.6B до 4B параметров) получает на вход URL, заголовок, список проиндексированных блоков и запрос пользователя. Выход модели: только массив интервалов, например [[1, 2], [5, 8]]. Модель не переписывает текст, она просто говорит: «Релевантная информация находится в блоках с 1 по 2 и с 5 по 8». 3. Пост-процессинг: Система мгновенно «склеивает» выбранные блоки обратно в Markdown, сохраняя таблицы и списки, но отсекая 90% ненужного мусора (рекламу, навигацию, футеры). 📈 Почему это важно для архитектора? * Декаплинг скорости от длины: Скорость извлечения больше не зависит от того, сколько текста нужно достать. Модель генерирует всего несколько чисел (индексов), что в 10 раз быстрее генеративных моделей (типа Firecrawl). * Query-Aware Extraction: В отличие от Readability-библиотек, IndexLM ищет контент под конкретный запрос. Если вы спросите про «цену», он достанет блок с ценой, проигнорировав основное описание. * Экономия контекста: На вход основной LLM (GPT-4/Claude) подается идеально чистый Markdown, что позволяет запихнуть в один контекстный запрос в 5-10 раз больше проанализированных страниц. 🧪 Результаты тестов: IndexLM-4B показывает лучший F1-score на бенчмарках типа HotpotQA и MultiHopRAG, обходя традиционные RAG-пайплайны. Это позволяет использовать маленькие и дешевые модели (0.6B) на этапе пре-процессинга, оставляя дорогую память основной модели для финальных рассуждений. Резюме: Если ваш агент «тонет» в HTML-мусоре, переходите от генерации контента к его индексации. Это чистый инженерный выигрыш в задержке (latency) и стоимости. Alibaba Cloud представила на этот счет https://www.alibabacloud.com/help/en/model-studio/web-extractor в Model Studio и развивает семейство Qwen, включая Qwen3.5 🔗 https://qwenlm.github.io/qwen-code-docs/en/developers/tools/web-fetch/ https://arxiv.org/pdf/2512.06641v1 Также читайте канал Эй ай надзор в https://max.ru/join/Nsna0txx7HluVwTcdusJ_lhr_E_0l6692IfGuKtJM7Y #WebScraping #RAG #AI #IndexLM #LLM #SystemDesign #InformationRetrieval