В конце марта на платформе Kaggle в режиме InClass прошел второй MEGOGO Media Hackathon — MEGOGO Kaggle Challenge. Специалисты по data science и machine learning соревновались в прогнозировании того, что будут смотреть пользователи MEGOGO.
Хакатон длился 48 часов — с 22:00 (по Киеву) 22 марта до 22:00 (по Киеву) 24 марта. Его целью было участие в развитии украинского Data Science и Machine Learning комьюнити, а также установление контакта между разработчиками и медийным бизнесом. Участвовать можно было индивидуально или в команде до 5 человек. Обязательным условием была регистрация на Kaggle, где нужно было создать команду в первые 24 часа после начала хакатона. Организаторы получили 177 заявок, в итоге участие принял 81 человек. Конкурсанты сформировали 42 команды и предоставили 634 решения. Хакатон стал международным — в нем зарегистрировались не только украинцы, но и участники из других стран, в том числе Швеции и Германии.
Для прогнозирования платформа MEGOGO предоставила доступ к анонимизированным реальным данным об активности пользователей за 3 месяца — кто, что и когда смотрел и какие фильмы понравились.
На основе информации участники должны были создать высокоточное воспроизводимое решение, способное предсказать, что пользователи MEGOGO будут смотреть в следующем месяце. Допускались работы на любом языке программирования. Все команды и индивидуальные участники могли выбрать по два решения для оценки.
Победителей определили с помощью приватной турнирной таблицы. Три команды разделили денежные призы. Первое место занял Алексей Гранков (команда x0x0w1). Он натренировал рекуррентную нейронную сеть (RNN) на миксе из данных о просмотрах и эмбеддинге по метаданным о фильмах. За 15 минут до финала Алексей усовершенствовал решение, использовав два типа нейросетей. Это и принесло ему победу. X0x0w1 получит $2000.
«Замечательный был хакатон. Перечислю ключевые моменты, которые в сумме сделали его таковым. Неординарная задача, предобработанный тренировочный датасет с чистыми данным, не анонимизированная информация по фильмам, налаженное общение между организаторами и участниками, своевременные ответы и разъяснения вопросов, не очень большой набор данных, который позволял участвовать практически всем желающим. Благодаря небольшому объему информации по решению такого рода задач можно было попробовать придумать и реализовать свои идеи, которые в итоге давали весьма неплохой результат. В следующем году хотелось бы увидеть продолжение с большим интервалом времени на конкурс, будем ждать с нетерпением», — поделился впечатлениями Алексей.
Второй стала команда AfterParty. Участники уступили победу в последние минуты. В решении AfterParty использовали последовательности просмотренных фильмов в качестве входных данных, натренировав комплексный ансамбль из RNN и нейросетей долгой краткосрочной памяти (LSTM). Приз команды — $1000.
«Хотим поблагодарить MEGOGO за проведение этого соревнования. Для нас это первый хакатон по рекомендательным системам и уже довольно успешный, хотя все еще есть к чему стремиться. Отдельное спасибо людям, которые готовили данные, отсутствие шафла между пабликом и прайватом в топ 10 — это сильно», — сказал Антон Баздырев, капитан AfterParty.
«Бронзовым» было признано решение команды Netflix. Ее участники провели качественный exploratory data analysis и добавили явное использование данных о недосмотренных сериалах и купленных, но не просмотренных фильмах к классической ALS-модели. Это повысило точность решения. Участники получат $500.
«Дякую організаторам Megogo Kaggle Challenge за проведення відмінного змагання. Для багатьох учасників команди це було першим змаганням такого плану. Після цього досвіду, впевнені, що будуть ще і ще. Змагання хоч зайняло всі вихідні, але дало замість більше (і це не про приз, хоча він та ще вишенька на торті). Зібравшись вперше як команда, ми безперервно генерували ідеї, висували гіпотези, намагались викачати з даних побільше “нафти”, писали код і з перехрещеними пальцями спостерігали за позиціями на лідерборді, опісля кожної нової здачі. За дві доби ми пережили кілька мозкових штурмів та емоційних штормів. Перепробували купу нових речей на практиці, а також дізнались цікаві факти через працю з даними (подумати не могли, що так багато переглядають “Трое из Простоквашино”). Але основним все ж залишається той заряд бадьорості та творчого підйому, такий потрібний, аби надалі розвиватись у цій магічній галузі машинного навчання», — резюмировал капитан Антон Тарасов.
Среди победителей был один Kaggle competitions master, двое Kaggle competitions contributors, а также новички платформы. Выплаты призерам произведут в соответствии с налоговым законодательством Украины.
Напомним, первый хакатон MEGOGO провели в Киеве в октябре 2018 года. Решениями-победителями стали мобильное приложение-квиз для киноманов, инструмент для iOS-видеоплеера, и конструктор для создания Stories.
Заглавная иллюстрация: https://ua.depositphotos.com/