• У нас ещё есть ChatGPT/DALLE/VISION. Всё это бесплатно.

[Datastart] Онлайн-конференция Data Science (2020)

vitriol0674

Команда форума
Разула в сердце
Живёт по соседству
Особенный
Спасибо от Разулы
Регистрация
13 Янв 2018
Сообщения
40.383
Реакции
668.589
Ra
125.078
[Datastart] Онлайн-конференция Data Science (2020)
25

КОМУ ПОДХОДИТ
  • РУКОВОДИТЕЛЯМ
    Внедрение передовых технологий – это ключ к стабильному росту, повышению прибыли и отрыву от конкурентов

  • РАЗРАБОТЧИКАМ
    Активное взаимодействие, нетворкинг и получение полезных контактов в удобном формате

  • АНАЛИТИКАМ
    Наш курс обработки и анализа данных поможет работе с BigData, рассказывая о максимально подходящих и действенных методиках

  • СТУДЕНТАМ
    Поможем выбрать техническую специализацию, сэкономить время и набраться вдохновения для исследования новых задач
ПРОГРАММА МЕРОПРИЯТИЯ
1. Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики.


Дмитрий Ветров Профессор-исследователь НИУ ВШЭ (Факультет компьютерных наук), глава Лаборатории машинного обучения, SAIC MOSCOW.

За последние годы в глубинных нейронных сетях был обнаружен ряд необычных эффектов (двойной спуск, связность мод, "минные поля" в рельефе функции потерь, и др.), показавших, что сообщество плохо понимает, что происходит в процессе обучения нейронных сетей. В ходе доклада мы попробуем увязать ряд эффектов в единую гипотезу и обсудим результаты экспериментов, которые косвенно ее подтверждают.

2. Инфраструктура извлечения факторов в проде

Михаил Трофимов ML Engineer в Praxis Pioneering

Часто при разработке продукта возникает несколько команд, реализующих ML в проде. У каждой стоит задача подсчета факторов, сбора сэмплов, обучения моделей, выкатка моделей в прод, доставка факторов в прод, синхронизация оффлайна и онлайна. Зачастую, каждая команда решает эти задачи независимо, что приводит в конечном итоге к замедлению разработки. В своем докладе я расскажу, как общая инфрастуктура факторов може ускорить разработку, зачем это вообще надо и какие проблемы возникают при ее построении.

3. «Питонись на отличненько»

Михаил СвешниковML Architect в Zyfra

Питон известен своим низким порогом входа и на нем действительно очень просто писать код. Однако это не значит, что на нем просто писать ХОРОШИЙ код. Я расскажу, что же это за зверь такой – хороший код на питоне, а так же покажу полезные приемы, которые помогут вам проще и быстрее писать на питоне и вообще поднимут ваше питон кунг-фу на новый уровень. Доклад будет интересен и тем, кто только собирается учить питон, и тем кто уже в познании питона настолько преисполнился, будто бы уже 100 триллионов миллиардов лет пишет код на триллионах и триллионах таких же языков.

4. Новинки CatBoost: поддержка эмбеддингов, обучение на SPARK и это еще не всё!

Станислав Кириллов Руководитель группы ML систем Яндекса

Как многим известно, градиентный бустинг на решающих деревьях остается SoTA на задачах, представимых в виде таблиц с признаками разной природы. До недавних пор CatBoost поддерживал 3 типа значений в колонках таких таблиц - вещественные признаки, категориальные и тексты.
Сегодня мы хотим презентовать возможность обучения на эмбеддингах объектов - вещественных векторах, показывающих положение объекта в каком-то семантическом пространстве.
Например, классическими примером эмбеддингов для текстов является word2vec, более новым - эмбеддинги трансформеров (BERT, GPT, etc). Мы расскажем о том, как именно CatBoost работает с такими векторами и как их использование может повысить качество ваших моделей.
Вторая важная новость, о которой мы расскажем - поддержка обучения на SPARK кластерах. Мы покажем, как реализована поддержка SPARK и как ей воспользоваться.
Ну и, конечно, это еще не все классные новости - еще мы расскажем о новых ускорениях и улучшениях, которые произошли с CatBoost за последние полгода.

5. Инструменты визуализиации в NLP: от графов знаний до BERT

Валентин Малых Senior Research Scientist в Noah’s Ark Lab

Кажется, что нет более далекой области от визуализации, чем обработка текстов. Но на самом деле визуализации и тут могут во многом помочь. Я расскажу про работу с графами знаний, а также про то, какие можно получить знания изучая паттерны внимания модели BERT

6. “Классическое” машинное обучение на табличных данных

Александр Фонарев Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор

В последние годы прикладное машинное обучение всё больше разделяется на два основных блока. Первый и наиболее хайповый — deep learning для обработки изображений, текста, звука и т. п. Второй, более старый, но не менее важный для бизнеса — “классический” ml для задач со табличными (структурированными) данными, использующийся для предсказания временных рядов, построения рекомендательных систем, предсказания поломок оборудования и многих других задач. В докладе мы погрузимся во второй блок: обсудим алгоритмы работы со структурированными данным, типизацию задач в этой области, практические кейсы, особенности индустрии сегодня и её развитие завтра.

7. Эмбеддинги графов без учителя

Антон Цицулин Аспирант университета Бонна, студент-исследователь в Google

В последние годы всё больше ML пайплайнов строится на эмбеддингах – вещественных векторах довольно малой размерности, отражающие семантические свойства объектов. Мы довольно хорошо научились извлекать их из текстов, картинок, звука, но для графов доступных коробочных решений пока нет. Графы – хитрый вид данных, который возникает, когда нам даны только связи разных объектов между собой. Например, дружба или подписки в соцсетях, покупки товаров и другие действия пользователей – лишь одни из примеров отношений, которые удобно моделировать графами. Я расскажу, как получать эмбеддинги для графов, про графовые нейросети и то, как их обучать без учителя.

8. Что такое "быстрый код"?

Николай Марков Principal Architect в компании Aligned Research Group

Какие именно особенности железа и кода заставляют его выполняться быстрее и эффективнее решать задачу? Стоит ли овчинка выделки? В докладе мы поговорим о том, как именно достигается высокая скорость выполнения кода, поковыряем распределенные вычисления, JIT, железки и векторизацию.

9. Как устроен умный робот, улучшающий колл-центры Яндекс

Татьяна Савельева Head of unstructured data analysis в Yandex.Taxi

В своем докладе расскажу про наш продукт для автоматизации и улучшения коллцентров. Как автоматизировать 80% первой линии поддержки так, чтобы робот был неотличим от человека, как понять какой текст лучше присылать пользователю, как раздавать промокодыс большей пользой для клиента и многое другое.

10. Почему бизнес не хочет внедрять современные технологии?

Евгений Лимаренко CIO группа компаний Gulliver&Co

Знакомая ситуация: приходишь в компанию или к коллегам в Коммерческий департамент, рассказываешь о крутом решении которую с парнями придумал и даже собрал MVP, а они смотрят, киваю головой и отказываются? Я расскажу вам, почему так происходит, как мыслят сотрудники бизнес подразделений и что нужно сделать, а что делать не надо, чтобы они хотели с вами работать.

11. Open Source In the Wild

Максим Кочуров Инженер-исследователь в NTechLab

Все из нас (ну точно многие) пользуются библиотеками Numpy, Pandas, sklearn и так далее. Мир опен сорса очень огромен, там просиходят большие (и неочень) события, свои местечковые конференции, принимаются решения, которые влияют на нашу разработку.
Однако знакомы с этой "кухней" далеко не все. Стандарты разработки многих продуктов обычно высоки. Кажется, что попасть в опен сорс сложно или почти невозможно. Не понятно с чего начать. Куда писать? Куда коммитить и как это делать? А вообще, зачем оно вообще нужно, вливаться в этот опен сорс, это же работа за бесплатно?
Другие проблемы, которые уже несколько уровнем выше, возникают и куда более серьезны для развития проекта. Как взаимодействовать с пользователями? Как развивать комьюнити? Как добиваться узнаваемости и расширять пользовательскую базу?
Проблемы взаимодействия с другими проектами тоже не остаются в стороне. Это бывают отношения пользователь-проект или проект-проект. В каждом из случаев есть нюансы. Как повлиять на развитие проекта? Как добавить недостающую фичу? Как поправить багу в любимой библиотеке? И самое главное, почему все так долго, и можно ли побыстрее?
В опен сорс я попал со студенческой скамьи на наивном энтузиазме, но это продолжает переворачивать жизнь по сей день. Я постараюсь ответить на перечисленные вопросы опираясь на свой опыт, ретроспективные выводы спустя несколько лет участия в нескольких крупных проектах.

12. Сколько стоит неэффективный Data Science или чему учить команду DS?

Михаил Рожков Creator Machine Learning REPA

Применение Data Science (DS) в бизнесе обычно связывают с тем value, которое смогут принести модели после их внедрение в процесс или продукт. При этом часто упускают из виду, что работа DS команды это сложный процесс, который требует значительных ресурсов и компетенций команды. В докладе обсудим, как можно оценить эффект от внедрения инструментов автоматизации и инженерных практик в Data Science. Доклад поможет компаниям найти точки роста DS команд и приоритезировать программы обучения и развития.

13. Рабочий Вариант: как большие данные меняют мир массового найма

Алексей Романов Expert Data Scientist в BigData МТС

Искусственный интеллект в массовом найме — очень модная тема, и бизнес плотоядно облизывается, глядя на перспективы анализа больших данных в этой области.
Однако с точки зрения Data Science работа в HR очень специфична: люди не тексты и не картинки, они капризны и часто непредсказуемы.
В своём докладе я дам общий обзор комплекса DS-задач, которые возникают в области массового найма, и разберу более пристально наиболее каверзные из них

14. Метрики в DS-проектах

Алексей Могильников ML Lead в Сбербанке, Chief Methodologist в LeanDS

Прикладное машинное обучение должно нести ценность бизнесу. В момент разработки модели не ясно как можно оценить потенциальную пользу модели и выбрать ожидаемые значения метрик на кросс-валидации или отложенной выборке такие, чтобы разработка модели имела смысл и ценность её была ощутима. В докладе будет показан подход к решению этой задачи и будет продемонстрировано как можно рассчитывать ценность, которую модель приносит бизнесу.

Тариф - Онлайн трансляция + видеозаписи двух потоков
Онлайн-участие
Видеозаписи двух потоков конференции
Презентации всех спикеров конференции
Бонус: видеозаписи Конференции от 30/06/2020 в подарок

ПРОДАЖНИК

Войти или Зарегистрироваться чтобы увидеть скрытый текст.



СКАЧАТЬ:

 

kardan

Спасибо от Разулы
Регистрация
16 Апр 2017
Сообщения
440
Реакции
613
Ra
457
Что за .spa файлы, кто это записывал? Руки оторвать ему.
 

kardan

Спасибо от Разулы
Регистрация
16 Апр 2017
Сообщения
440
Реакции
613
Ra
457
Как открыть кто знает? Гугл говорит нужна кака-то прога для анимешников
 

Похожие темы

Теги по которым нашли тему

  1. Data Science
  2. Онлайн-конференция Data Science
  3. machine learning
  4. mail.group
  5. data scientist
  6. Ветров
  7. нейросети
  8. machine-learning-data-analysis
  9. Антон Марков
  10. data
Сверху