Middle Data Scientist | Телекоммуникационная компания
Вакансия: Data Science
Уровень: Middle
Жалование: 300к запрошено
🔊 https://boosty.to/sa_sobes/posts/9b5abc31-856d-4876-a955-5397f2e4812c🔊
📝 Секция «Общие вопросы»:
🔵Есть ли у тебя интерес к NLP.
🧠 Секция «Машинное обучение»:
🔵С какими ещё трансформер‑архитектурами работал.
🔵GPT вы для чего использовали.
🔵Современные подходы типа T5 и т.п. разбирал.
🔵Чем RoBERTa отличается от BERT.
🔵Какие loss‑функции знаешь, для классификации и metric learning.
🔵Проблемы RNN способы борьбы.
🔵Attention vs self‑attention, сравнение CNN/RNN/трансформеров.
🔵Можно ли GPT обучать на задачах как у BERT, особенности однонаправленного attention.
Обучение моделей и оптимизация
🔵Batch normalization: зачем, минусы, отличие от layer norm.
🔵Dropout, как работает на train и на inference.
🔵Борьба с взрывом/затуханием градиента, skip connections и clipping.
🔵Дистилляция, упрощение модели, подход к слишком тяжёлой сетке.
👩💻 Нейросети
🔵BERT, GPT, T5, RoBERTa, задачи BERT.
🔵Архитектура энкодера BERT, этапы: токенизация, эмбеддинги, позиционные эмбеддинги, multi‑head attention.
Прод и эксплуатация моделей
🔵Формат хранения весов (Pickle, sklearn), оптимизация, деплой через Docker, CPU inference.
📊 Секция «метрики и оценка моделей»:
🔵Precision, Recall, F1.
🔵балансировка классов.
🔵ROC‑AUC и его интерпретация.
💻Инфраструктура и деплой
🔵REST‑сервисы, FastAPI vs Flask, асинхронность и I/O‑bound кейсы.
🔵Опыт работы с Docker/Docker Compose.
🔵Опыт работы с Kubernetes.
🤓 Секция «Практика»:
🔴Кейс: трансформер не успевает по latency, бизнес недоволен качеством, идея и необходимость её валидации.
💩 Голосование: Как вам собес?
❤️ — Админ, спасибо за подгон.
🙏 — Сложновато
🔥 — Изи собес.
Подписывайтесь на:
❤