AI/ML Ready | Нейросети

Public

Просмотреть канал

Не можете присоединиться? @neuro_ready

11.9k Участники

Обновлено: May 13, 2026 at 6:18 AM

AI/ML Ready | Нейросети

Авторский канал про искусственный интеллект и машинное обучение. Нейросети, гайды, советы, задачи, промпты и шпаргалки. Обновления каждый день! Автор: @energy_it РКН: https://clck.ru/3QREEC Реклама на бирже: https://telega.in/c/neuro_ready

Join @neuro_ready for exclusive httpstelegaincneuro_ready and energy_it content and discussions in 12

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Последние 10 дней)

Всего: 11.9K

Рост за 24ч: +0 0%

Последние посты

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

❤️ Полезная https://habr.com/ru/articles/988358/ для тех, кто хочет руками собрать чат‑бота с LLM и понять, как это работает на практике!

В этой статье:
• Показывают базовую сборку Telegram‑бота на Python.

• Разбирают, как связать модель, обработку сообщений и логику ответов в один рабочий пайплайну.

• Объясняют, как довести проект до usable‑состояния.
https://habr.com/ru/post/248153/🔊 Продолжай читать на https://habr.com/ru/articles/988358/

🚪 AI Ready | #статья

1,220

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

Запуск и симуляция работы слоя Mixture of Experts на Python.

Модели-гиганты вроде Mixtral или GPT-4 используют архитектуру Mixture of Experts (MoE) для экономии вычислительных ресурсов за счет разделения сети на узкоспециализированные подсети. Мы реализуем простейший слой MoE с маршрутизатором и двумя экспертами, чтобы понять логику распределения токенов. Это позволит увидеть, как модель активирует только нужные веса для каждого конкретного запроса в реальном времени.

Для начала установим фреймворк PyTorch, необходимый для матричных вычислений и создания слоев нейросети.

pip install torch

Библиотека успешно установлена и готова к сборке кастомной архитектуры.

Создадим скрипт, описывающий логику двух независимых экспертов и функцию маршрутизации входных тензоров.

import torch
import torch.nn as nn

class SimpleMoE(nn. Module):
def __init__(self):
super().__init__()
self.experts = nn. ModuleList([nn. Linear(4, 4) for _ in range(2)])
self.router = nn. Linear(4, 2)

def forward(self, x):
route_weights = torch.softmax(self.router(x), dim=-1)
best_expert = torch.argmax(route_weights, dim=-1)
return self.experts[best_expert](x)

Архитектура готова: роутер динамически выбирает одного из двух экспертов на основе входящего вектора.

Запустим симуляцию передачи данных через созданный слой MoE для получения финального предсказания.

Инициализация модели и прогон тестового вектора признаков:

moe_layer = SimpleMoE()
data = torch.randn(4)
output = moe_layer(data)
print("MoE forward pass successful")

Тестовый вектор успешно прошел через маршрутизатор и был обработан выбранной подсетью.

# проверка (запуск итогового скрипта валидации)
python3 -c "import torch; import torch.nn as nn; r = nn. Linear(2, 2); print('Status: OK') if r(torch.randn(2)).shape[0] == 2 else print('Error')"

Ожидаемый вывод: Status: OK

Архитектура MoE позволяет кратно масштабировать количество параметров модели без пропорционального увеличения стоимости инференса. Понимание работы маршрутизатора критично при оптимизации и квантовании современных LLM для их локального развертывания.

👉 AI Ready | #ml

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

1,160

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

🎥 Video

🧐 Jenni AI — помощник для написания текстов и статей!

Сервис помогает писать статьи, эссе, документацию, research-материалы и другой текстовый контент. Jenni AI умеет генерировать идеи, продолжать текст, делать перефразирование и помогать со структурой. Платформа сочетает AI-автодополнение с ручным редактированием, поэтому текст можно быстро дорабатывать под свой стиль и задачи.

📌 Оставляю ссылочку: http://jenni.ai/

🚪 AI Ready | #нейросеть

1,250

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

Знаете, что Python может считать нарастающие значения без явных циклов и промежуточных переменных?

Во многих задачах нужно считать накопительный результат — сумму, максимум, баланс, прогресс.

Обычно это делают вручную через цикл и переменную-аккумулятор:
s = 0
result = []
for x in data:
s += x
result.append(s)

itertools.accumulate делает это декларативно, сразу показывая намерение кода:
list(accumulate(data))

Причём это не только сумма, можно передать любую бинарную функцию и получить накопление по своей логике:
from operator import mul
list(accumulate(data, mul))

Это удобно для финансовых расчётов, метрик, логов, прогресса, агрегатов и любых задач с текущим состоянием:
transactions = [100, -20, 50]
balances = list(accumulate(transactions))

🔥 accumulate убирает шаблонные циклы и делает код ближе к модели данных, особенно в аналитике и потоковой обработке.

👉 Python Ready | #совет

1,390

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

🤖 Обработка персональных данных: как маскировать личную информацию перед OpenAI!

Отправка реальных имен, телефонов или адресов в облачные API — это риск нарушения приватности и политик безопасности.

Маскировка данных (PII) на лету позволяет использовать мощные модели, не передавая им секреты ваших клиентов. Вы сохраняете контроль над информацией, а нейросеть получает только стерильный контекст.

🚪 AI Ready | #API

1,470

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

1,290

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

🎥 Video

😍 Quizgecko — AI-сервис для создания тестов, карточек и квизов!

Платформа, которая с помощью ИИ генерирует тесты и обучающие материалы из текста, PDF, ссылок, видео или документов. Можно быстро создавать квизы, flashcards и вопросы для проверки знаний. Сервис подойдёт преподавателям, студентам и разработчикам обучающих платформ. Есть поддержка разных форматов контента и автоматическая генерация вопросов на основе загруженной информации.

📌 Оставляю ссылочку: http://quizgecko.com/

🚪 AI Ready | #нейросет

1,350

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

Почему классический ReLU больше не тянет современные языковые модели?

Старый добрый ReLU грубо обнуляет все отрицательные значения, что приводит к «мертвым нейронам» и потере градиентов в глубоких трансформерах.

Современные функции вроде GeLU и SwiGLU обеспечивают плавный изгиб графика, позволяя модели лучше улавливать нюансы данных и быстрее сходиться при обучении миллиардов параметров.

Реализация GeLU (Gaussian Error Linear Unit), которая стала стандартом для BERT и GPT:

import torch.nn as nn
gelu = nn. GELU()
output = gelu(input_tensor)

Она взвешивает входные данные по их значению, сохраняя небольшую информацию даже от отрицательных чисел.

Применение SwiGLU — секретного ингредиента архитектуры Llama 3 для повышения производительности:

# SwiGLU обычно требует разделения весов на две части
gate = nn. Linear(dim, hidden_dim * 2)
activated = swiglu(gate(input_tensor))

При переходе с ReLU на SwiGLU учитывайте, что количество параметров в слое вырастет, поэтому обычно уменьшают размер скрытого слоя (hidden_dim), чтобы сохранить прежнюю скорость инференса.

➡️ AI Ready | #совет

AI/ML Ready | Нейросети

26 мая 2026 г., 12:32

📷 Photo

📂 Наглядная карта возможностей Claude!

Чат для повседневных задач, reasoning для сложных решений, developer API для интеграций, build для файлов и артефактов, browser для веб-задач и так далее.

Идеально, чтобы быстро понять, какой режим Claude использовать под конкретную задачу.

🚪 AI Ready | #ресурсы

1,510

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

Создание ML-конвейера с использованием Scikit-Learn Pipelines.

Разрозненные этапы обработки данных и обучения модели часто приводят к ошибкам в коде и сложностям при деплое. Мы объединим нормализацию признаков и модель в единый объект Pipeline, чтобы гарантировать чистоту данных на этапе предсказания. Этот подход автоматизирует весь путь от сырых значений до готового API.

Для начала установим необходимые библиотеки для работы с данными и моделями:

pip install scikit-learn pandas

Библиотеки успешно установлены и готовы к созданию вашего первого конвейера.

Создадим конвейер, который сначала масштабирует входные данные, а затем обучает классификатор:

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression

pipe = Pipeline([
('scaler', StandardScaler()),
('clf', LogisticRegression())
])

Конвейер настроен: при вызове .fit() данные автоматически пройдут через скалер перед подачей в модель.

Обучим этот конвейер на тестовом наборе данных и подготовим его к работе:

import numpy as np
X = np.array([[1, 2], [3, 4], [5, 6]])
y = np.array([0, 0, 1])
pipe.fit(X, y)
print("Pipeline trained and ready for inference")

Теперь модель готова предсказывать результаты для любых новых входящих данных:

# проверка (выполнение предсказания)
python3 -c "import numpy as np; from sklearn.pipeline import Pipeline; from sklearn.linear_model import LogisticRegression; from sklearn.preprocessing import StandardScaler; pipe = Pipeline([('s', StandardScaler()), ('c', LogisticRegression())]); pipe.fit([[1,2]], [0]); print(pipe.predict([[1,2]]))"

Ожидаемый вывод: [0]

Использование Pipeline исключает «утечку данных» и делает код лаконичным, что критически важно для продакшн-решений. Всегда заворачивайте этапы предобработки в конвейер, чтобы избежать рассинхрона между обучением и реальным использованием модели.

👉 AI Ready | #ml

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

📷 Photo

👍 Хочешь сделать собственного голосового помощника на Python? Тогда эта https://habr.com/ru/articles/860902/?utm_source=chatgpt.com тебе точно понравится!

В ней ты узнаешь:
• Как использовать библиотеку SpeechRecognition для распознавания речи
• Как подключить pyttsx3 для синтеза голоса
• Как обрабатывать команды и давать голосовой ответ

🔊 Продолжай читать на https://habr.com/ru/articles/860902/?utm_source=chatgpt.com

🚪 AI Ready | #статья

1,320

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

🎥 Video

☕️ Scite — нейросеть для анализа научных статей и проверки источников!

Это AI-платформа, которая помогает не просто находить научные статьи, а оценивать их качество через анализ цитирований. Сервис показывает, как именно используется работа: поддерживают ли её другие исследования, опровергают или просто упоминаю. Scite также умеет искать релевантные публикации и показывать контекст цитирования внутри текста.

📌 Оставляю ссылочку: http://scite.ai/

🚪 AI Ready | #нейросеть

1,290

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

Поиск похожих документов через TF-IDF + cosine similarity!

Если нужно быстро найти похожие тексты — статьи, дубликаты, описания товаров или просто документы на близкую тему — не обязательно сразу брать эмбеддинги и нейросети. Часто хватает старого доброго подхода: TF-IDF + cosine similarity.

Идея простая: текст превращается в числовой вектор, а потом мы смотрим, насколько векторы похожи между собой. Если угол между ними маленький — тексты похожи по набору слов и терминов.

Для начала ставим зависимости:
pip install pandas scikit-learn


Импортируем всё необходимое:
import pandas as pd

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity


Соберём маленький датасет для примера:
data = pd. DataFrame({
"text": [
"machine learning for fraud detection",
"deep learning for image recognition",
"fraud detection in banking systems",
"neural networks for computer vision",
"bank transactions anomaly detection"
]
})


Теперь векторизуем тексты:
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(data["text"])


Здесь fit_transform делает две вещи: строит словарь по нашим текстам и сразу переводит каждый текст в TF-IDF-вектор.

Считаем косинусную близость:
sim_matrix = cosine_similarity(X)


Получаем матрицу похожести: каждая строка показывает, насколько выбранный документ похож на остальные.

Например, возьмём первый текст:
target_idx = 0

similarities = list(enumerate(sim_matrix[target_idx]))
similarities = sorted(similarities, key=lambda x: x[1], reverse=True)

print(similarities)


Первым почти всегда будет сам документ со score 1.0. Поэтому его обычно пропускают и берут следующие результаты:
top_k = 2

for idx, score in similarities[1:top_k+1]:
print(f"Score: {round(score, 3)} | Text:", data["text"].iloc[idx])


Такой способ хорошо подходит для быстрого baseline: поиск похожих документов, дедупликация, простые рекомендации, группировка текстов.

🔥 Но есть нюансы: TF-IDF не понимает смысл как эмбеддинги, он в основном работает по словам и терминам; качество сильно зависит от чистки текста, стоп-слов и лемматизации; cosine_similarity(X) строит полную матрицу NxN, на больших объёмах это быстро становится проблемой.

🚪 AI Ready | #ml

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

📷 Photo

📂 Разбор способов работы с Claude!

Это наглядная карта возможностей Claude: чат для повседневных задач, reasoning для сложных решений, developer API для интеграций, build для файлов и артефактов, browser для веб-задач и так далее.

Идеально, чтобы быстро понять, какой режим Claude использовать под конкретную задачу.

🚪 AI Ready | #ресурс

1,250

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

📷 Photo

🤖 Квантование (Quantization): сжимаем веса модели без потери качества.

Огромные нейросети обычно хранятся в 32-битном формате, требуя колоссальных объемов видеопамяти. Квантование решает эту проблему, переводя веса модели из высокоточных форматов в компактные 8 или 4 бита. Это позволяет запускать мощный ИИ на обычных домашних видеокартах, сохраняя точность ответов.

Основные моменты:
• Экономия ресурсов: размер модели уменьшается в 4–8 раз, что открывает доступ к LLM на пользовательском «железе»;

• Магия округления: сложные числа заменяются на дискретные уровни из узкой сетки, что ускоряет вычисления без ущерба для логики;

• Доступность: благодаря форматам типа GGUF или EXL2, модели уровня Llama 3 работают плавно даже на обычном ПК.

Понимая принципы квантования, вы понимаете, как нейросети «худеют» до размеров смартфона, не теряя при этом своего интеллекта.

🚪 AI Ready | #ML

1,820

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

📷 Photo

1,330

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

🎥 Video

✍️ Genei — AI-инструмент для ускорения чтения и работы с информацией!

Это нейросеть, ориентированная на работу с текстами и исследованиями: она анализирует статьи, PDF и веб-страницы, автоматически выделяет ключевые идеи и делает краткие выжимки. Сервис помогает быстрее обрабатывать большие объёмы информации и структурировать материалы в удобном виде.

📌 Оставляю ссылочку: https://www.genei.io/

🚪 AI Ready | #нейросеть

1,780

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

🎥 Video

😍 Tana — AI-инструмент для управления знаниями и автоматизации работы!

Это рабочее пространство, которое объединяет заметки, задачи и базу знаний. Сервис использует AI и граф связей, чтобы структурировать информацию и превращать обычные записи в взаимосвязанную систему данных. Tana может фиксировать встречи, генерировать задачи, создавать документы и организовывать информацию.

📌 Оставляю ссылочку: http://tana.inc/

🚪 AI Ready | #нейросеть

1,560

AI/ML Ready | Нейросети

11 мая 2026 г., 03:52

Быстрая очистка текста для NLP с библиотекой CleanText.

Сырые данные из соцсетей часто содержат ссылки, эмодзи, лишнюю пунктуацию и спецсимволы, которые мешают модели ML находить зависимости. Мы применим инструмент clean-text для автоматической нормализации текста и удаления цифрового «шума» перед подачей в нейросеть. Это позволяет стандартизировать входные данные без написания сложных регулярных выражений вручную.

Для начала установим библиотеку, которая умеет обрабатывать кодировки и чистить текст на уровне символов:

pip install clean-text

Библиотека установлена и готова к интеграции в ваш скрипт предобработки.

Теперь напишем функцию, которая удалит URL-адреса, почту, пунктуацию и приведет весь текст к нижнему регистру:

from cleantext import clean

raw_text = "Check out https://google.com! My email is [email protected]. 😊 #AI"
clean_text = clean(raw_text, fix_unicode=True, to_ascii=True, lower=True,
no_urls=True, no_emails=True, no_punct=True)
print(clean_text)

Выполнение кода превратит замусоренную строку в чистый набор слов, готовый для токенизации.

Добавим шаг для замены чисел на специальные токены и удаления лишних пробелов:

final_text = clean(clean_text, no_numbers=True, replace_with_number="")
print(f"Result: {final_text}")

Это полезно, когда конкретные значения чисел не важны для анализа тональности или тематики.

Проверка, вывод финального текста:

python3 -c "from cleantext import clean; print(clean('Hello 123!', no_numbers=True))"

Чистка данных — самый важный этап в ML. Используйте clean-text для быстрой подготовки датасетов, но помните, что удаление эмодзи может лишить модель информации о сарказме или эмоциях.

👉 Python Ready | #ml

1,700

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

📷 Photo

☕️ Свежая и полезная https://habr.com/ru/articles/994618/ на Хабре: «Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как»

В этой статье:
• Разбирается, почему огромный контекст, не решение проблемы памяти LLM, особенно для локальных моделей;
• Пошагово показывается, как вынести память агента наружу;
• Приводится реальная архитектура с кодом на Python, где агент сам сохраняет факты, ищет по смыслу и достаёт нужные решения.

🔊 Продолжайте читать на https://habr.com/ru/articles/994618/

🚪 AI Ready | #статья

691

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

📷 Photo

🤖 LoRA и QLoRA: обучаем гигантов на домашнем ПК за копейки!

Раньше для дообучения моделей уровня Llama требовались промышленные кластеры видеокарт. Технология LoRA совершила революцию, позволив обновлять лишь крошечную часть параметров нейросети.

Основные моменты:
• Всей модели, LoRA добавляет к ней маленькие адаптеры, которые весят считанные мегабайты;

• QLoRA — технология позволяет упаковать веса в 4 бита, благодаря чему модели на 13B параметров теперь запускаются на обычном игровом железе;

• Вы можете обучить ИИ своему стилю письма или специфическим знаниям, потратив на это всего пару часов.

Сегодня дообучение ИИ — это не привилегия корпораций, а доступный инструмент для каждого разработчика с видеокартой.

🚪 AI Ready | #ML

962

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

🎥 Video

☕️ Создавай 3D-модели из любых изображений с помощью Imgto3D!

Загрузи фото, скриншот или рисунок, выбери желаемое качество — и получи готовую текстурированную модель всего за пару секунд. Подходит для игр, AR/VR и 3D-печати, работает прямо в браузере без установки программ.

📌 Оставляю ссылочку: https://www.imgto3d.ai/ru

🚪 AI Ready | #нейросеть

1,130

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

Аргументы командной строки через argparse!

Когда скрипт запускается не руками один раз, а используется повторно — в автоматизации, cron, CI или просто в разных сценариях — почти сразу появляется потребность передавать ему параметры при запуске.

В Python для этого обычно используют встроенный модуль argparse. Он позволяет собрать нормальный CLI без внешних библиотек и при этом не писать разбор аргументов вручную.

Подключение стандартное:
import argparse

Создаём парсер:
parser = argparse. ArgumentParser(description="Пример CLI-программы")

Допустим, скрипт должен принимать имя пользователя. Это будет обязательный позиционный аргумент:
parser.add_argument("name", help="Имя пользователя")

Теперь добавим необязательный параметр возраста:
parser.add_argument("--age", type=int, help="Возраст")

Если нужен обычный флаг, который просто включается при наличии, удобно использовать store_true:
parser.add_argument("--admin", action="store_true", help="Режим администратора")

Для параметров можно задавать значение по умолчанию. Например, порт:
parser.add_argument("--port", type=int, default=8080, help="Порт приложения")

А если значение должно быть из фиксированного набора, пригодится choices:
parser.add_argument(
"--mode",
choices=["dev", "prod"],
default="dev",
help="Режим запуска"
)

После описания всех аргументов вызываем разбор:
args = parser.parse_args()

Дальше работаем с ними как с обычными атрибутами:
print(f"Привет, {args.name}!")

if args.age is not None:
print(f"Возраст: {args.age}")

if args.admin:
print("Права администратора включены")

print(f"Порт: {args.port}")
print(f"Режим: {args.mode}")

Пример запуска:
python app.py Alex --age 30 --admin --port 9000 --mode prod

Что получим:
Привет, Alex!
Возраст: 30
Права администратора включены
Порт: 9000
Режим: prod

argparse удобен тем, что сразу закрывает базовые задачи: умеет разбирать позиционные и именованные аргументы, приводит значения к нужному типу, проверяет допустимые варианты и сам показывает ошибку, если в параметрах что-то не так.

Плюс у него из коробки есть --help, поэтому даже для маленького скрипта можно быстро сделать внятный интерфейс запуска:
python app.py --help

Если сценариев несколько, CLI можно расширить через subparsers и сделать подкоманды — по аналогии с git или docker.

🔥 Для служебных утилит, внутренних инструментов и автоматизации argparse до сих пор остаётся очень хорошим вариантом: он встроен в стандартную библиотеку, предсказуемо работает и закрывает большую часть повседневных задач без лишних зависимостей.

🚪 AI Ready | #практика

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

📷 Photo

📂 Напоминалка по стратегиям индексирования в RAG!

Например, Chunk Indexing — базовый подход, при котором документы разбиваются на чанки и индексируются в векторной БД, а Sub-chunk Indexing использует более мелкие фрагменты для повышения точности поиска.

На картинке — 4 подхода к индексированию в RAG, которые влияют на качество поиска и итогового ответа модели.

Сохрани, чтобы не потерять!

🚪 AI Ready | #ресурс

1,290

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

📷 Photo

💅 Интересная https://habr.com/ru/articles/1007574/ вышла на Хабре: «Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло»!

В этой статье:
• Описан эксперимент, в котором AI-агенту дали собственную среду с доступом к терминалу и файловой системе;
• Архитектура такой системы: периодические пробуждения агента и файловая память между сессиями;
• Как за сотни сессий агент начал создавать инструменты, изменять свои инструкции и генерировать тексты.

🔊 Продолжайте читать на https://habr.com/ru/articles/1007574/

🚪 AI Ready | #статья

1,400

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

Переобучение в ML на практике: как быстро увидеть overfitting!

В машинном обучении мало просто обучить модель. Куда важнее понять, как она поведёт себя на новых данных, которых она раньше не видела.

Типичная ситуация выглядит так: на обучающей выборке всё почти идеально, а на отложенной — заметно хуже. Это и есть один из самых характерных признаков переобучения (overfitting): модель слишком хорошо подстроилась под обучающие данные и хуже обобщает результат, ниже — простой пример.

Установка:
pip install scikit-learn

Импортируем нужные инструменты:
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

Сгенерируем синтетический датасет. Для демонстрации этого вполне достаточно: нам не нужен сложный реальный набор данных, если цель — быстро показать сам эффект переобучения:
X, y = make_classification(
n_samples=300,
n_features=10,
random_state=42
)

Делим данные на train и test. Это принципиально важный шаг. Если проверять качество на тех же данных, на которых модель обучалась, оценка будет слишком оптимистичной и почти бесполезной:
X_train, X_test, y_train, y_test = train_test_split(
X, y,
test_size=0.3,
random_state=42,
stratify=y
)

stratify=y здесь полезен тем, что сохраняет примерно одинаковую пропорцию классов в обеих выборках.

Сначала возьмём дерево решений без ограничения глубины. Такое дерево очень гибкое и легко подстраивается под особенности обучающей выборки:
model = DecisionTreeClassifier(max_depth=None, random_state=42)
model.fit(X_train, y_train)

Смотрим качество на train и test:
train_acc = accuracy_score(y_train, model.predict(X_train))
test_acc = accuracy_score(y_test, model.predict(X_test))

print("Train:", train_acc)
print("Test:", test_acc)

Во многих случаях здесь можно увидеть почти идеальное качество на train — иногда даже 1.0 — и заметно более слабый результат на test.

Это сильный сигнал, что модель слишком точно подстроилась под обучающие данные и захватила не только полезные закономерности, но и частные особенности конкретной train-выборки.

Один из самых простых способов снизить риск переобучения — сделать модель менее сложной. Для дерева решений это можно сделать через max_depth:
model = DecisionTreeClassifier(max_depth=3, random_state=42)
model.fit(X_train, y_train)

И снова измерим качество:
print("Train:", accuracy_score(y_train, model.predict(X_train)))
print("Test:", accuracy_score(y_test, model.predict(X_test)))

🔥 Сама идея довольно простая: чем сложнее модель, тем выше риск, что она начнёт слишком точно подстраиваться под обучающую выборку. Не всегда проблема именно в overfitting, но на практике это одна из первых вещей, которые стоит проверить.

👉 Python Ready | #ml

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

📷 Photo

Рекомендательные системы — один из ключевых механизмов, на которых держатся современные продукты. Они помогают пользователям находить контент, товары и сервисы, а бизнесу — повышать вовлеченность и качество пользовательского опыта. Вместе с Владимиром Байкаловым, ведущим исследователем AI VK, разбираем главные тренды в рекомендациях и последние значимые работы.

🔗 Список статей

Масштабирование
🟣 https://arxiv.org/abs/2402.17152
🟣 https://arxiv.org/abs/2507.15994
🟣 https://arxiv.org/abs/2601.20083

Lifelong Recommendations
🟣 https://arxiv.org/abs/2506.02267?utm_source=chatgpt.com
🟣 https://arxiv.org/abs/2407.16357?utm_source=chatgpt.com
🟣 https://arxiv.org/abs/2505.04421?utm_source=chatgpt.com
🟣 https://dl.acm.org/doi/10.1145/3746252.3761564

Generative Retrieval
🟣 https://arxiv.org/abs/2202.06991
🟣 https://arxiv.org/pdf/2305.05065
🟣 https://arxiv.org/pdf/2503.02453

Semantic IDs
🟣 https://arxiv.org/abs/2504.02137
🟣 https://arxiv.org/pdf/2502.13581
🟣 https://arxiv.org/pdf/2405.07314
🟣 https://arxiv.org/pdf/2602.16375

End to End Рекомендации
🟣 https://arxiv.org/abs/2502.18965
🟣 https://arxiv.org/pdf/2512.22386
🟣 https://arxiv.org/pdf/2505.17549

LLMxRecSys
🟣 https://arxiv.org/abs/2510.07784
🟣 https://arxiv.org/abs/2510.11639
🟣 https://arxiv.org/abs/2512.21257

#aivk #recsys

AI/ML Ready | Нейросети

2 апр. 2026 г., 00:09

🎥 Video

💡 Heptabase — инструмент для визуального управления знаниями и структурирования сложной информации!

Если нужно системно работать с большим объёмом данных, нейросеть позволяет превращать заметки, документы и идеи в наглядную связанную карту. Структура и рабочее поле помогают выстраивать связи между элементами, анализировать архитектуру и формировать целостное понимание темы.

📌 Оставляю ссылочку: http://heptabase.com/

🚪 AI Ready | #нейросеть

1,520

Showing 29 of 29 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

AI/ML Ready | Нейросети

AI/ML Ready | Нейросети

Рейтинг

Рост участников (Последние 10 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Random Open Science

Сердце 🧡 Сообщества

Чат для общения

Студия Никитина | event | нейросети

Прокси тут

Techlead Russia

Помощь подключение

Градостроительный комплекс Москвы

Похожие каналы Telegram

Random Open Science

Сердце 🧡 Сообщества

Чат для общения

Студия Никитина | event | нейросети

Прокси тут

Techlead Russia

Помощь подключение

Градостроительный комплекс Москвы

Отзывы пользователей (0)

Последние посты