Формат заключительного этапа
Вас ждут два тура по 5 часов. Первый тур — математика в ИИ, второй — машинное и глубокое обучение.
❤️ Первый день — математический тур
В первый день участникам предстоит решать математические задачи на темы, связанные с искусственным интеллектом. Среди них: теория вероятностей, линейная алгебра, оптимизация, комбинаторика, теоретическая информатика и алгоритмы.
В отличие от регионального этапа, в задачах, где требуется что-то доказать, необходимо привести строгое математическое решение на листах. Доказательства не должны опираться на результаты выполнения программного кода.
При этом Python можно использовать как вспомогательный инструмент для решения математических задач. За правильные ответы и примеры, полученные с помощью компьютера, будут начисляться частичные баллы. Мы также добавили библиотеки pycosat и cvxpy в надежде на то, что они могут оказаться вам полезными, но они не являются обязательными для решения задач.
❤️ Второй день — анализ данных и машинное обучение
Второй день будет похож на второй тур регионального этапа, но сложность задач немного возрастёт. Кроме того, на заключительном этапе появятся задачи, в которых нужно будет работать с нейросетями.
Темы задач:
1. Анализ данных
2. Кластеризация
3. Машинное обучение на табличных данных
4. NLP
5. CV
Подробнее о темах NLP и CV:
➡️ Основы нейросетей: полносвязные нейронные сети, обучение нейросетей, получение предсказаний для элементов данных.
➡️ Основы CV: устройство и обучение сверточных нейронных сетей (CNN).
➡️ Основы NLP: обработка текста, классические и нейросетевые модели для работы с текстами, эмбеддинги текстов.
➡️ Использование эмбеддингов предобученных моделей (для задач CV и NLP).
К базовым моделям DL, которые нужно знать, относятся полносвязные нейросети и CNN. Такие модели, как BERT и похожие на него трансформеры достаточно понимать на уровне работы с предобученными моделями и их эмбеддингами. Что касается других моделей (RNN, LSTM, GRU, и так далее), то получить полный балл в решениях вы сможете и без их использования.
В целом не стоит ожидать, что потребуется решать специфичные задачи (сегментации, детекции или генерации). В задачах, где будут даны предобученные модели, как правило, будет предложена одна модель, чтобы участникам не приходилось перебирать множество вариантов.
Список доступных библиотек на финале⬇️
– ipykernel
– pandas
– numpy
– matplotlib
– seaborn
– scikit-learn
– scipy
– Xgboost
– lightgbm
– catboost
– numba
– polars
– tensorflow
– keras
– torch
– pytorch-lightning
– torchvision
– scikit-image
– opencv-python
– Pillow
– transformers
– spacy
– nltk
– gensim
– Albumentations
– pycosat
– cvxpy
– tqdm