DS/ML | Собесы

Public

Просмотреть канал

761

560

369

Не можете присоединиться? @dsml_sobes

257 Участники

Обновлено: May 26, 2026 at 6:54 AM

DS/ML | Собесы

@dsml_sobes is a dedicated channel for Медицина with regular updates in Медицина

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Сегодня)

Всего: 257

Последние посты

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | Телекоммуникационная компания
Вакансия: Data Science
Уровень: Middle
Жалование: 300к запрошено

🔊 https://boosty.to/sa_sobes/posts/9b5abc31-856d-4876-a955-5397f2e4812c🔊

📝 Секция «Общие вопросы»:

🔵Есть ли у тебя интерес к NLP.

🧠 Секция «Машинное обучение»:

🔵С какими ещё трансформер‑архитектурами работал.
🔵GPT вы для чего использовали.
🔵Современные подходы типа T5 и т.п. разбирал.
🔵Чем RoBERTa отличается от BERT.
🔵Какие loss‑функции знаешь, для классификации и metric learning.
🔵Проблемы RNN способы борьбы.
🔵Attention vs self‑attention, сравнение CNN/RNN/трансформеров.
🔵Можно ли GPT обучать на задачах как у BERT, особенности однонаправленного attention.

Обучение моделей и оптимизация

🔵Batch normalization: зачем, минусы, отличие от layer norm.
🔵Dropout, как работает на train и на inference.
🔵Борьба с взрывом/затуханием градиента, skip connections и clipping.
🔵Дистилляция, упрощение модели, подход к слишком тяжёлой сетке.

👩‍💻 Нейросети

🔵BERT, GPT, T5, RoBERTa, задачи BERT.
🔵Архитектура энкодера BERT, этапы: токенизация, эмбеддинги, позиционные эмбеддинги, multi‑head attention.

Прод и эксплуатация моделей

🔵Формат хранения весов (Pickle, sklearn), оптимизация, деплой через Docker, CPU inference.

📊 Секция «метрики и оценка моделей»:

🔵Precision, Recall, F1.
🔵балансировка классов.
🔵ROC‑AUC и его интерпретация.

💻Инфраструктура и деплой

🔵REST‑сервисы, FastAPI vs Flask, асинхронность и I/O‑bound кейсы.
🔵Опыт работы с Docker/Docker Compose.
🔵Опыт работы с Kubernetes.

🤓 Секция «Практика»:

🔴Кейс: трансформер не успевает по latency, бизнес недоволен качеством, идея и необходимость её валидации.

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤

194

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | Банк

Вакансия: Data Science
Уровень: Middle
Жалование: 300 запрошено
Сфера: Финтех

🔊 https://boosty.to/sa_sobes/posts/b7e0fb85-4289-4fdd-b1bb-5b1685dfc96c🔊

📝 Секция «Общие вопросы»:

🔵Вопрос о наличии высшего образования.
🔵На каких языках программирования писал, помимо Python.

🔢 Секция «Математика и статистика»:

🔵Коллинеарные признаки: разница между линейной моделью и случайным лесом.
🔵Влияет ли маленькая разница в процентах по баннерам на суждение об эксперименте.
🔵Что знаешь про доверительные интервалы и статистическую значимость.

📈 Секция «анализ данных»:

🔵Как делается отбор признаков при 50 фичах.

🧠 Секция «Машинное обучение»:

🔵Изменение ROC AUC и LogLoss при умножении предсказаний на 2.
🔵Почему ROC AUC не меняется при таком преобразовании.

🔍 Секция «Работа с признаками»:

🔵Как грамотно обработать категориальные признаки.
🔵Что будет, если сделать mean target encoding «в чистом виде».

🖥 Секция «Бизнес-мышление и интерпретация результатов»:

🔵Сравнение баннеров по конверсии и количеству кликов.

🤓 Секция «Практика»:

🔴Кейс: Есть 2 баннера и статистика кликов по ним. Первый посмотрели 10000 человек и кликнули 190 раз, второй - 11000/220 раз соответственно. Какой баннер выберем и почему?
🔴Кейс: У нас есть пользователи и ID фильма. Как нам построить рекомендательную систему?

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤

191

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | Букмекерская компания

Вакансия: Data Science
Уровень: Middle
Жалование: 250 запрошено

🔊 https://boosty.to/sa_sobes/posts/be4b868a-5d2a-4242-9c8f-0db1a02bcb15🔊

🔢 Секция «Математика и статистика»:

🔵Чем отличаются logloss и Brier score
🔵Когда выберешь F1, а когда logloss.
🔵Как связаны Gini и ROC‑AUC.
🔵Можно ли трактовать выход логрегрессии как вероятность.

📈 Секция «анализ данных»:

🔵Расскажи про скоринговый продукт: какие были данные, особенности.
🔵Как делал отбор фичей.
🔵Зачем бороться с мультиколлинеарностью.
Что делать при высокой корреляции, если не удалять обе фичи.

🧠 Секция «Машинное обучение»:

🔵Что знаешь про L1/L2‑регуляризацию.
🔵Поможет ли L2 при мультиколлинеарности.
🔵F1 vs logloss.

🔍 Секция «Работа с признаками»:

🔵Что делать с сильно коррелирующими признаками.
🔵Как проверяешь корректность переменных.

📊 Секция «метрики и оценка моделей»:

🔵Связь prediction и реальной вероятности при class_weight.
🔵logloss vs Brier score.

🖥 Секция «Бизнес-мышление и интерпретация результатов»:

🔵Как тестировали модель и решали, когда её менять.

🤓 Секция «Практика»:

🔴Кейс: SQL‑задача про кумулятивную сумму
🔴Кейс: У нас есть вид спорта - настольный тенис. Правила чемпионатов таковы, что играются туры, тур - 8 подряд идущих матчей, где играют 4 игрока. Играют 6 матчей - каждый с каждым. Этих игроков по результатам первых 6 матчей ранжируют и они играют 7-8 матч за 1 место. Есть информация, что за последний год сыграли 10000 таких туров, играли разные игроки, есть вся история этих матчей. Оценить вероятность того, что в первом финальном матче победит первый игрок.

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | телекоммуникационная компания

Вакансия: Data Science
Уровень: Middle
Жалование: 350 запрошено
Сфера: телекоммуникации

🔊 https://boosty.to/sa_sobes/posts/da9d0b8c-c8b1-4d31-8b3e-3f2c01a50692🔊

📝 Секция «Общие вопросы»:

🔵Расскажите о себе, о своём опыте.
🔵PD-модель ты построил на CatBoost.
🔵Модель PD ты разработал сам, внедрил.
🔵В продуктивизации ты участвовал.

🔢 Секция «Математика и статистика»:

🔵Параметры бустинга: какие знаешь.
🔵Глубина в бустинге.
🔵Глубина деревьев в случайном лесе.
🔵Число деревьев в бустинге, переобучение.
🔵Число деревьев в случайном лесе.
🔵Удалить первое/последнее дерево в бустинге - что произойдёт.
🔵Связь MDE и размера выборки.

📈 Секция «анализ данных»:

🔵Пропуски в табличных данных - что делать.
🔵Выборка с дисбалансом классов - какие методы.
🔵Sparse матрица - какие модели подойдут.

🧠 Секция «Машинное обучение»:

🔵Label Encoding: где применять.
🔵Может ли бустинг давать отрицательные предсказания.

🔍 Секция «Работа с признаками»:

🔵Пропуски в табличных данных - что делать.
🔵Как работать с категориальными фичами.

📊 Секция «метрики и оценка моделей»:

🔵Метрики бинарной классификации.
🔵Precision, Recall - что это.
🔵Когда использовать Recall/Precision.
🔵Что такое F1.
🔵ROC-AUC - что это.
🔵Нужно ли подбирать пороги для ROC-AUC.
🔵Метрики регрессии.
🔵Baseline для MSE.
🔵Baseline для MAE.

🖥 Секция «Бизнес-мышление и интерпретация результатов»:

🔵Как понять, что модель лучше бизнес-правил.
🔵Как провести A/B-тест для сравнения.

🤓 Секция «Практика»:

🔴Кейс: У тебя задача регрессии и у тебя в таргете значения от 1 до 100, в датасете тестовом у тебя значения от 1 до 150. Линейная модель сможет предсказывать значения, какие?
🔴Кейс: У тебя есть какая - то фича, принимает значения от 1 до 1000, там есть какие - то пропуски. Кто - то тебе подсказал: "заполняй пропуски "-999", как думаешь, что для каких моделей это сработает?
🔴Кейс: К тебе пришли и сказали: "мы хотим сделать модель маркетинговую, которая будет находить клиентов, склонных подключать какую - то услугу. У нас есть call - центр, который за месяц может обзвонить 1000 клиентов. Мы сейчас берем какое-то случайное подмножество в нашей базе, пусть у нас 10 млн клиентов. Мы можем обзвонить только 1000 клиентов. Придумай модель.

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | Страховая компания

Вакансия: Data Science
Уровень: Middle
Жалование: 250 запрошено
Сфера: Услуги страхования

🔊 https://boosty.to/sa_sobes/posts/eb5c8e22-0043-42aa-93fe-ab2f68b8166b🔊

📝 Секция «Общие вопросы»:

🔵Расскажите о себе, о своём опыте.
🔵На какой грейд себя оцениваешь.
🔵Опыт работы с Docker.
🔵Опыт работы с Git.
🔵Что интереснее, временные ряды или классический ML.

📈 Секция «анализ данных»:

🔵Определение выбросов и действия с ними.
🔵Isolation Forest.

🧠 Секция «Машинное обучение»:

🔵Линейная регрессия: что это, где применяется.
🔵Проблемы batch GD по памяти.
🔵Стохастический градиентный спуск.
🔵Проблемы SGD со сходимостью.
🔵Логистическая регрессия vs линейная.
🔵Метод опорных векторов.
🔵Уточнение про SVM при нелинейной разделимости и выбросах.
🔵Kernel / ядровый переход.
🔵Дерево решений и критерии разбиения.
🔵Альтернативные критерии дерева.
🔵Information gain, variance reduction.
🔵Чем бустинг отличается от бэггинга.
🔵Как задаётся начальное предсказание в градиентном бустинге для регрессии и классификации.
🔵Что такое бэггинг и как связан с bootstrap.

🔍 Секция «Работа с признаками»:

🔵Обработка пропусков в данных.
🔵Нужно ли нормализовать все модели.
🔵Виды нормализации.
🔵Кодирование категориальных признаков.
🔵Target encoding.
🔵Методы снижения размерности.

📊 Секция «метрики и оценка моделей»:

🔵ROC-AUC: что это, диапазон значений.
🔵Другие метрики классификации.

🤓 Секция «Практика»:

🔴Кейс: Сказали сделать модель, она бинарной классификации, т.е клиент купит у нас страховку или не купит. Прислали большой датасет. Нужно разработать модель.
🔴Кейс: Что произойдёт с бэггингом, если два дерева обучатся на одинаковых данных bootstrap.

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤ https://t.me/devops_sobes

DS/ML | Собесы

26 мая 2026 г., 06:55

Senior Data Scientist | информационная система

Вакансия: Data Scientist
Уровень: Senior
Жалование: 300 запрошено

🔊 https://boosty.to/sa_sobes/posts/b23cb124-9351-4a75-a5a9-ac24087367f1🔊

🔢 Секция «Математика и статистика»:

🔵Немонотонное преобразование и ROC-AUC.
🔵Как выбирают порог в ROC .
🔵Что означают точки на ROC-кривой .
🔵Где «градиент» в градиентном бустинге.

🧠 Секция «Машинное обучение»:

🔵Какие модели строила, бинарная классификация или регрессия.
🔵Преимущества бустинга vs линейных моделей.
🔵Бустинг - ансамбль чего.
🔵Как происходит предсказание в дереве и в ансамбле.

🔍 Секция «Работа с признаками»:

🔵Кто генерил фичи и парсеры.
🔵Что делали именно по преобразованию признаков.

📊 Секция «метрики и оценка моделей»:

🔵Какими метриками оцениваются ваши модели.
🔵Как реализован мониторинг метрик и обновление дашборда.

🤓 Секция «Практика»:

🔴Кейс: Задача на ревью кода.

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤ https://t.me/devops_sobes

194

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | онлайн-платформа для операций с недвижимостью

Вакансия: Data Scientist
Уровень: Middle
Жалование: 250 запрошено
Сфера: Недвижимость

🔊 https://boosty.to/sa_sobes/posts/555a384d-9723-4422-b267-f6284b4be5de🔊

🧠 Секция «Машинное обучение»:

🔵В каких случаях Random Forest хуже линейной регрессии
🔵В каких случаях одно дерево лучше случайного леса
🔵Что такое случайный лес
🔵Как определить, что в сабсэмпл попали хорошие/плохие признаки
🔵Проблемы target encoding
🔵Target encoding и редкие классы
🔵Способы отбора фичей
🔵Роль PCA в отборе фичей
🔵Методы замены/зануления признаков для отбора
🔵Как считается feature importance
🔵Затухающий градиент в трансформерах / residual connections
🔵Определение затухающего градиента
🔵Другие способы борьбы с затухающим градиентом
🔵Методы ускорения инференса
🔵Max/average pooling
🔵Плюсы/минусы pooling
🔵Опыт в NLP/CV
🔵Лемматизация и стемминг

🔍 Секция «Работа с признаками»:

🔵Подходы кодирования категориальных признаков
🔵Что такое target encoding
🔵Разница one-hot и label encoding
🔵Альтернатива one-hot с меньшим числом признаков

🖥 Секция «SQL и работа с данными»:

🔵Как группировать данные (SQL-задача)
🔵Оконные функции для нумерации сделок
🔵Что делает RANK
🔵Отличие RANK и ROW_NUMBER

🖥 Секция «Python для анализа данных»

🔵Что такое декораторы, как работают
🔵Как декоратор модифицирует функцию
🔵Что знаешь про генераторы

🤓 Секция «Практика»:

🔴Кейс: Дан массив положительных целых чисел nums и целое число S . Найдите минимальную длину непрерывного подмассива, сумма элементов которого больше или равна S . Если такого подмассива не существует, верните 0.
🔴Кейс: Есть таблица sales (sale_id, sale_date, price, agent_id), которая содержит информацию о продажах объектов недвижимости агентами. Напишите запрос, чтобы найти общую сумму продаж для последних 2 сделок каждого агента.

💩 Голосование: Как вам собес?

❤️ — Админ, спасибо за подгон.

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤ https://t.me/devops_sobes

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle Data Scientist | Консалтинговая компания в нефтегазовой отрасли

Вакансия: Data Scientist
Уровень: Middle
Жалование: 250 запрошено
Сфера: Разработка программного обеспечения

🔊 https://boosty.to/sa_sobes/posts/d8bfcd4a-9d00-4efd-a94a-1e28ae47f9e6🔊

📝 Секция «Общие вопросы»:

🔵Расскажите о себе, о своём опыте.
🔵что такое типичное поведение, как определить нормальность

🔢 Секция «Математика и статистика»:

🔵Мы построили 3 сигмы. Аномалии 7 месяцев назад. Значит ли это, что тогда произошло событие, приведшее к аварии.
🔵Что такое изменение тренда: дельта между часовыми значениями или что-то еще

📈 Секция «анализ данных»:

🔵Как будете смотреть на данные, учитывая тысячи датчиков и 3 года истории (вопрос по кейсу)

🧠 Секция «Машинное обучение»:

🔵С какими видами моделей вы работали
🔵С какой кластеризацией сталкивались и в какой постановке
🔵Какие методики кластеризации использовали

📊 Секция «метрики и оценка моделей»:

🔵Что такое метрики, что такое мониторинг
🔵Что посоветуете, чтобы в будущем не было аварий (вопрос по кейсу)
🔵Если использовать скользящее окно и дельту, как учесть плавный рост температуры (вопрос по кейсу)

🤓 Секция «Практика»:

🔴Кейс: Приходит заказчик и говорит: у нас в цеху стоит агрегат под давлением и высокими температурами, его физичесмки разорвало. Агрегат оснащён огромным количеством датчиков, вся их история есть, данные пишутся раз в минуту. Как будете выявлять причину аварии.

Подписывайтесь на:
❤ https://t.me/devops_sobes

173

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle DS|Банк

Вакансия: Data Scientist.
Уровень: middle DS.
Жалование: 200к запрошено.
Сфера: Финтех

🔊 https://boosty.to/sa_sobes/posts/1ba035ba-ec99-4362-a472-482ba1a56c23

🖥 Секция «Математика и статистика»:

🔵Почему обычно не выравнивают классы синтетическими выборками.

🖥 Секция «SQL и работа с данными»:

🔵SQL - задача (практика).

🖥 Секция «Python для анализа данных»

🔵Как бы ты реализовал функцию, которая по строке считает количество слов.
🔵Какие краевые случаи могут быть в задаче подсчёта слов.
🔵Как обойти случай с несколькими пробелами подряд.
🔵Если знаки пунктуации отделены пробелами, как не считать их словами.
🔵Как посчитать количество уникальных слов в строке.
🔵Что ты будешь класть в set при решении задачи с уникальными словами.
🔵Как внутри устроено множество (set) в Python.
🔵Какие элементы можно класть в set? Есть ли ограничения.
🔵Почему, по твоей интуиции, не все типы можно положить в set.
🔵Что происходит, когда вызывается set.add('abc')
🔵На какие два типа делятся объекты в Python.

🤓 Секция «Практические задания»:

🔴Кейс: У тебя есть таблица сессий пользователей, она состоит из двух колонок: id пользователя и timestamp его захода на наш ресурс. Нужно посчитать количество пользователей которые зашли на наш ресурс за календарный год, отчет по каждому месяцу.

💩 Голосование: Как вам собес?

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤

178

DS/ML | Собесы

26 мая 2026 г., 06:55

Middle ML|интернет-сервис для размещения объявлений о товарах

Вакансия: Machine Learning Engineer
Уровень: middle
Жалование: 270к запрошено.
Сфера: Сфера электронной коммерции.

🔊 https://boosty.to/sa_sobes/posts/b73913de-72b1-4967-bb10-22285a077308🔊

📝 Секция «Общие вопросы»:

🔵Расскажите о себе, о своём опыте.
🔵Что тебе ближе: ML vs DS.

🧠 Секция «Машинное обучение»:

🔵Реализации / библиотеки бустинга.
🔵В чём отличие Random Forest и бустинга.
🔵В чём разница между XGBoost, LightGBM и CatBoost.
🔵В чём главная особенность CatBoost.
🔵Как количество деревьев в RF влияет на bias и variance.
🔵Почему при инференсе в проде лучше выбрать бустинг, а не RF, при одинаковом качестве и числе деревьев.
🔵Какие деревья строим в бустинге, а какие в RF.
🔵В регрессии с выбросами какую метрику оптимизировать - MAE или MSE.
🔵Что такое регуляризация и какие виды знаешь.
🔵Почему L1 разреживает веса, а L2 -нет.
🔵В логистической регрессии с регуляризацией нужно ли включать bias в регуляризатор.

Секция «Прод и эксплуатация моделей»:

🔵Почему в проде лучше бустинг, а не RF, при одинаковом качестве и числе деревьев.
🔵Три модели (XGB, LGBM, CatBoost) с одинаковым качеством. Какую выберешь для прод-реалтайм инференса.

📊Секция «Метрики и мониторинг качества»:

🔵Какие метрики классификации знаешь, их плюсы/минусы.
🔵Чем глобально отличается ROC-AUC от Precision/Recall/F1.
🔵Как из скоров получить TP/FP и посчитать F1? Почему нужен порог.
🔵Как выбрать лучшую модель при дисбалансе (spam detection) с разными метриками.

🤓 Секция «Практические задания»:

🔴Кейс: Мы решаем модерационную задачу. Необходимо находить контакты в тексте описания объявления. У нас есть фиксированный ресурс ручной модерации, часть потока можем отправлять им на дополнительную проверку. Нам нужно сделать ML модельку и подобрать два порога:
1) порог для автоотклонения объявления.
2) порог для отправки на проверку в ручную модерацию.
Что важнее при выборе порога в этих двух случаях: точность выбранной модели или полнота?

💩 Голосование: Как вам собес?

🙏 — Сложновато

🔥 — Изи собес.

Подписывайтесь на:
❤

Showing 10 of 10 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

DS/ML | Собесы

DS/ML | Собесы

Рейтинг

Рост участников (Сегодня)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

«Доброе сердце» благотворительный фонд

ЭкоСтомДВ

ОРГАНИК ЛОГОС | Фульвовые кислоты | БАД

Кселла

МинЗдрав Дети

заметки гинеколога

MyGenetics | Генетика для жизни

GBT ACADEMY Russia

Похожие каналы Telegram

«Доброе сердце» благотворительный фонд

ЭкоСтомДВ

ОРГАНИК ЛОГОС | Фульвовые кислоты | БАД

Кселла

МинЗдрав Дети

заметки гинеколога

MyGenetics | Генетика для жизни

GBT ACADEMY Russia

Отзывы пользователей (0)

Последние посты