Часть Пятая. Офисная
И тут меня спасла очередная случайность. Моя работа в Сигме неожиданно закончилась, и мне пришлось начать активно искать что-то другое. И буквально через пару недель я нашла свою первую работу по специальности. У меня было всего два собеседования - в Телефонику и в небольшую контору, которая занималась статистикой. Телефоника отказала из-за неродного испанского, а вторая компания после тестового задания позвала меня к себе.
Это было немного рискованное мероприятие, потому что я ничего не знала про эту контору, и она не внушала большого доверия (спойлер: предчувствия оправдались). Но я была не в той ситуации, чтобы выбирать. Я снова собрала два своих чемодана и уехала обратно в Мадрид. На всякий случай я заплатила за следующий месяц за квартиру в Доностии и так подстраховалась на случай, если что-то пойдет не так. Было грустно уезжать с одной стороны - и захватывающие начинать новую профессию с другой. В конце концов, я приехала на время, учиться, и когда-нибудь это время должно было закончиться.
Работа была очень забавная. Мне нужно было обучать модели классификации сообщений в Твиттере - кто за независимость Каталонии, а кто против. Я сперва обрабатывала сырые данные, потом полуавтоматически делала аннотации (на испанском и каталанском), а затем пилила модели. От меня не требовалось программировать, а все машинной обучение делалось в программе Rapidminer. Но я все равно начала писать мелкие скрипты для обработки текста и вставлять их в Rapidminer (он это позволял делать).
Rapidminer, визуальный, цветной, с кнопочками, помог мне разобраться в машинном обучении. Все это выглядело как белый экран, куда ты расставляешь цветные квадратики и соединяешь их стрелочками. Каждый квадратик означает одну операцию, например, можно сделать такую цепочку: прочитать датасет, обработать датасет, перевести тексты в векторы, подать векторы в модель, присоединить модель обучения, сохранить результат. Внутри квадратика - параметры. Тогда же я освоила основы анализа данных - работу с таблицами, разные пивоты, мерджи и фильтры, столкнулась с проблемой кодировки текста, форматов, разделителей и много чем еще.
Поскольку новая работа была связана с классификацией твитов, я быстро поменяла тему магистерской работы и в январе начала все сначала. Все, что я делала на работе, я решила включить в магистерскую. Плюс добавила эксперименты с уже готовым датасетом из прошлогоднего shared task. Эксперименты мои были настолько хороши, что преподаватели сперва даже не верили мне, что я это все делаю сама. Думали, что мне кто-то на работе помогает. А мне никто не помогал, я была единственным человеком в офисе, кто разбирался в NLP.
Все это меня страшно радовало и мотивировало. А еще - у нас был офис в старинном здании в центре Мадрида, около площади Колумба, и каждый день я топала от метро до офиса вместе с модными зажиточными мадридцами, на обеде выходила попить кофе на террасе, погреться на солнце, пройтись по магазинам, а во время рабочего дня меня практически никто не беспокоил ни совещаниями, ни звонками. Это была лучшая работа для интроверта, и было даже жаль, что я не интроверт.