📣GraphRAG, Machine Unlearning, TTS-битва и юрдоки без API! Новая порция исследований от Raft на Хабре — читаем!
➡️ https://habr.com/ru/companies/raft/articles/981858/
Исследовали технологию, которая позволяет моделям "забывать" нежелательные данные без полного переобучения. Классические методы защиты (промпты, классификаторы, RLHF) только блокируют генерацию проблемного контента, но персональные данные остаются внутри модели. А это конфликтует с GDPR и российским 149-ФЗ, которые закрепляют "право на забвение". В статье — как формируются Forget Set и Retain Set, чем Machine Unlearning может заменить дорогой RLHF, и обзор open-source инструмента OpenUnlearning с поддержкой LoRA для экономии GPU-памяти.
➡️ https://habr.com/ru/companies/oleg-bunin/articles/984340/ 8 способов укротить расширенный контекст у LLM
Протестировали 8 архитектурных подходов GraphRAG на реальном медицинском кейсе: как помочь врачам-онкологам принимать решения, когда стандартный RAG находит факты, но не связывает их. Оказалось, что в 22% случаев пациенты остаются без назначения из-за того, что система не видит взаимодействие между препаратами и сопутствующими болезнями. В статье — полный бенчмарк с метриками (faithfulness, latency, cost), сравнение от базового GraphRAG до мультимодального поиска, и главное открытие: Graph-Native Chunking снизил галлюцинации на 84%, а Hybrid Search показал лучший баланс. Бонус — дерево решений для выбора правильной архитектуры под вашу задачу.
➡️Можно ли https://habr.com/ru/companies/runity/articles/987424/ open-source LLM
Протестировали несколько классов моделей (от легковесных до reasoning) на реальном архиве из 200+ договоров, актов и счетов. Оказалось, что выбор модели — не главное: ключ к качеству — в архитектуре пайплайна. Адаптивный чанкинг, строгая валидация схемы и контроль уверенности подняли точность с 63% до 99,7%. В статье — детали эксперимента, почему Qwen3-30B-A3B оказалась оптимальной и как управлять ошибками в production.
➡️ https://habr.com/ru/companies/raft/articles/991404/ не про токены: почему span важнее BIO
Разобрали неочевидную проблему NER-задач: оказывается, большинство популярных схем разметки (IO, BIO, IOBES) ломаются на вложенных сущностях. Например, когда внутри "адреса" нужно выделить "город" и "улицу" — классические токен-level подходы просто не справляются. В статье показали на примерах, почему span-level разметка — это must-have, как конвертировать форматы между собой и какие грабли ждут при масштабировании числа классов. Бонус: практические рекомендации, когда стоит усложнять схему, а когда хватит простого BIO.
➡️Обзор Open Source моделей для https://habr.com/ru/companies/raft/articles/991844/
Протестировали 7 open-source моделей для синтеза речи на русском языке: от китайских мультиязычных до отечественных Silero и ESpeech. Каждую прогнали через одинаковые тесты, замерили скорость на CPU/GPU и оценили естественность, выразительность и простоту интеграции. После сравнения выявили явного аутсайдера и топ-3: Silero (самая быстрая), F5-TTS (лучшая выразительность) и QwenTTS (баланс качества и удобства). Уже можно выбирать под свою задачу.
❤️ — команде за сильный рисёрч
🔥— если ждёшь новые статьи