Календарь событий
Пятница 04 Сентябрь 2015, 18:00 - 21:00
Хиты : 89
от Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
https://corp.mail.ru/ru/press/events/109/
В программе – 3 доклада по 30 минут, после которых участники смогут пообщаться в неформальной обстановке за чашкой чая. В этот раз спикерами выступят:
Дмитрий Селиванов, Однокласники
Finding Similar Items in high-dimensional spaces: Locality Sensitive Hashing
Дмитрий познакомит слушателей с эффективным вероятностным методом снижения размерности многомерных данных – Locality Sensitive Hashing. На примере задачи поиска похожих текстовых документов гости подробно разберут алгоритм Minhash и научатся выявлять дубликаты за линейное время.
Дмитрий Бабаев, Тинькофф Банк
Data science using Big Data. Pragmatic approach
Подготовка данных, построение предиктивных моделей и дальнейшее их использование становятся сложнее при работе с big data. Возникают новые проблемы, которые отсутствуют при работе с обычными объемами данных. Комбинация привычных и новых инструментов работы с данными позволяет использовать большие данные, применяя привычные подходы работы с данными. Спикер расскажет, как эффективно использовать стандартные инструменты машинного обучения из Python Data Stack (IPython Notebook, SciKit-Learn, Pandas) совместно с Apache Spark и Hadoop Stack. Он затронет подходы к машинному обучению на больших данных и LSML, а также поделится практическими приемами ML в комбинации со Spark.
Андрей Кутузов, Mail.Ru Group
Нейронные языковые модели и задача определения семантической близости слов для русского языка
Доклад касается популярных в последние годы нейронных или предсказательных моделей, которые переворачивают семантический анализ текстов с ног на голову. Эти модели позволяют быстро получать векторы (не нужна запятая) во много тысяч раз компактнее, чем при традиционном подходе, и качество при этом только повышается.
Подробнее @mephistopheies
В программе – 3 доклада по 30 минут, после которых участники смогут пообщаться в неформальной обстановке за чашкой чая. В этот раз спикерами выступят:
Дмитрий Селиванов, Однокласники
Finding Similar Items in high-dimensional spaces: Locality Sensitive Hashing
Дмитрий познакомит слушателей с эффективным вероятностным методом снижения размерности многомерных данных – Locality Sensitive Hashing. На примере задачи поиска похожих текстовых документов гости подробно разберут алгоритм Minhash и научатся выявлять дубликаты за линейное время.
Дмитрий Бабаев, Тинькофф Банк
Data science using Big Data. Pragmatic approach
Подготовка данных, построение предиктивных моделей и дальнейшее их использование становятся сложнее при работе с big data. Возникают новые проблемы, которые отсутствуют при работе с обычными объемами данных. Комбинация привычных и новых инструментов работы с данными позволяет использовать большие данные, применяя привычные подходы работы с данными. Спикер расскажет, как эффективно использовать стандартные инструменты машинного обучения из Python Data Stack (IPython Notebook, SciKit-Learn, Pandas) совместно с Apache Spark и Hadoop Stack. Он затронет подходы к машинному обучению на больших данных и LSML, а также поделится практическими приемами ML в комбинации со Spark.
Андрей Кутузов, Mail.Ru Group
Нейронные языковые модели и задача определения семантической близости слов для русского языка
Доклад касается популярных в последние годы нейронных или предсказательных моделей, которые переворачивают семантический анализ текстов с ног на голову. Эти модели позволяют быстро получать векторы (не нужна запятая) во много тысяч раз компактнее, чем при традиционном подходе, и качество при этом только повышается.
Подробнее @mephistopheies
Место Кинозал Mail.ru Ленинградский проспект д.39, строение 79