[Simulative] Симулятор «SQL для анализа данных» (2022)
Это не курс. Это симулятор работы аналитика данных в реальной компании с элементами обучения. Вы будете считать retention и LTV, писать многоэтажные CTE и делать другие полезные для бизнеса штуки с помощью SQL.
Цели симулятора:
Симулятор состоит из 13 глав.
Каждая глава — это теория + практические задачи + отработка навыков на бизнесовых кейсах.
Вы будете анализировать пользовательский опыт платформы IT Resume, работать с продакшен-левел инструментами и решать реальные кейсы с интересным сюжетом.
Для отработки и закрепления результатов — тест + расчётные задания.
Вы научитесь группировать таблицу по определенным признакам и использовать агрегатные функции: от простейших AVG и MIN до экзотических mode WITHIN GROUP.
Для отработки навыков — домашнее задание.
После этого вы снова отработаете полученные знания на реальных кейсах. Например:
Для закрепления — домашнее задание.
После этого вы продолжите анализировать user experience платформы. Например:
Для закрепления — традиционная домашка.
После этого закрепите все на практике. Например:
Для отработки — полноценное домашнее задание.
Затем вы снова вернетесь к работе над аналитикой платформы. Например:
Будете использовать: draw.io, DBeaver, MySQL + Workbench, сервисы-фейкеры.
В этой главе вы научитесь работать с psycopg2, mysql.connector, узнаете про шаблон проектирования Singleton, научитесь регистрировать собственные типы данных, работать с базой через Python, разберете ошибки типа Authentication plugin ′caching_sha2_password′ cannot be loaded и многое другое.
Для отработки — полноценное домашнее задание.
В результате вы получите:
На выходе вы будете иметь скрипты и инструкции для автоматизации задач с помощью cron, а также готовый проект с Python-кодом для ежедневного инсерта данных в БД.
SQL тесно связан с аналитикой и датавизом. В этой главе вы будете подключать базу к Power BI и Redash, чтобы строить ad-hoc отчеты и дашборды. Затронем тему подключения по ssh, построения дашбордов и поиска полезных инсайтов.
В результате этой главы вы решите реальное тестовое задание в крупную Edtech компанию на позицию аналитика.
В конце — небольшая ретроспектива всех ваших наработок, а также наши советы относительно тестовых заданий, best practices и дальнейшего развития. Полезные материалы, ссылки и непрошенные советы — то, что нужно в конце такого обучения.
Но на самом деле, это не конец, а только начало интересного пути Продажник:
Simulative / Симулятор SQL для анализа данных: Обучение на практике
Скачать:
Это не курс. Это симулятор работы аналитика данных в реальной компании с элементами обучения. Вы будете считать retention и LTV, писать многоэтажные CTE и делать другие полезные для бизнеса штуки с помощью SQL.
Цели симулятора:
- Обучить не элементарным «SQL-запросам», а полезным фишкам, экосистеме и продакшен-левел коду Научить писать запросы, нужные бизнесу. Вы не будете изучать котиков — вы будете считать LTV, делать сложные агрегации и ad-hoc Погрузить в среду. Вы будете работать с профессиональными инструментами — PostgreSQL, DBeaver, MySQL, Power BI и шедулерами
- Писать многочисленные ad-hoc SQL запросы: сбор и валидация email-адресов, расчет статистик пользовательской активности и многое другое Собирать когорты, анализировать retention, LTV, CR и другие продуктовые метрики с помощью high-level SQL-запросов Автоматизировать импорт/экспорт данных на Windows/Linux сервере с помощью SQL + Python + psycopg2 + cron
Симулятор состоит из 13 глав.
Каждая глава — это теория + практические задачи + отработка навыков на бизнесовых кейсах.
Вы будете анализировать пользовательский опыт платформы IT Resume, работать с продакшен-левел инструментами и решать реальные кейсы с интересным сюжетом.
- Вы познакомитесь с базами данных, поймете отличие БД от СУБД, обсудите важность нормализации на конкретных кейсах и прочие «основы основ».
В конце - тест для проверки знаний.
Вы научитесь подключаться к удаленной базе 4 разными способами, разберете типы данных и поймете отличие DCL от DML.
Для закрепления знаний - тест.
В этой главе вы научитесь писать базовые SQL-запросы — но далеко не самые простые. Также вы освоите функции обработки текста, даты, времени, кастинга, крутые функции COALESCE/NULLIF, логические операторы, CASE и многое другое. Сортировка, горизонтальная фильтрация, поиск по шаблону, регулярки — все это в этой главе.
Для закрепления — домашнее задание.
Хоть вы только начали путь, вы уже будете решать реальные продуктовые задачи. Например: Соберете и подготовите базу для email-рассылок Посмотрите на пользователей в разрезе дат и погрузитесь в обработку даты-времени Произведете валидацию номеров телефонов Расклассифицируете задачи на платформе по группам в зависимости от определенного признака
Для отработки и закрепления результатов — тест + расчётные задания.
Вы научитесь группировать таблицу по определенным признакам и использовать агрегатные функции: от простейших AVG и MIN до экзотических mode WITHIN GROUP.
Для отработки навыков — домашнее задание.
После этого вы снова отработаете полученные знания на реальных кейсах. Например:
- Оцените распределение активности пользователей по часам/дням Сколько в среднем пользователь делает попыток для решения 1 задачи? А сколько людей решают задачи с первой попытки? А каково значение моды? Оцените MAU/WAU/DAU Посчитаете эффективность реферальной программы Посмотрите на то, как пользователи платформы тратят и копят CodeCoins
Для закрепления — домашнее задание.
После этого вы продолжите анализировать user experience платформы. Например:
- Посмотрите, кто не только решает задачи, но и участвует в других активностях Однозначно скажете – от какой компании сколько пользователей пришло и как они себя вели Оцените распределение решенных задач и тестов по тегам и категориям
Для закрепления — традиционная домашка.
После этого закрепите все на практике. Например:
- Посчитаете RETENTION/CR и подумаем над тем, как удержать пользователей Углубитесь в то, как пользователи решают задачи и проведете глубокое исследование Соберете всю статистику о пользователях в одном месте, чтобы показать ее рекрутерам
Для отработки — полноценное домашнее задание.
Затем вы снова вернетесь к работе над аналитикой платформы. Например:
- Снова рассмотрите вопрос retention и LTV, но под новым соусом Оцените динамику активностей, найдете участки спада и роста Посчитаете текущий баланс накопительным итогом по всем пользователям и найдете аномалии
Будете использовать: draw.io, DBeaver, MySQL + Workbench, сервисы-фейкеры.
В этой главе вы научитесь работать с psycopg2, mysql.connector, узнаете про шаблон проектирования Singleton, научитесь регистрировать собственные типы данных, работать с базой через Python, разберете ошибки типа Authentication plugin ′caching_sha2_password′ cannot be loaded и многое другое.
Для отработки — полноценное домашнее задание.
В результате вы получите:
- несколько готовых классов для подключения к основным СУБД, которые вы можете использовать потом на работе написанные Python-скрипты для экспорта-импорта данных из базы проект по выгрузке данных из базы и дальнейшей обработке в Pandas
На выходе вы будете иметь скрипты и инструкции для автоматизации задач с помощью cron, а также готовый проект с Python-кодом для ежедневного инсерта данных в БД.
SQL тесно связан с аналитикой и датавизом. В этой главе вы будете подключать базу к Power BI и Redash, чтобы строить ad-hoc отчеты и дашборды. Затронем тему подключения по ssh, построения дашбордов и поиска полезных инсайтов.
В результате этой главы вы решите реальное тестовое задание в крупную Edtech компанию на позицию аналитика.
В конце — небольшая ретроспектива всех ваших наработок, а также наши советы относительно тестовых заданий, best practices и дальнейшего развития. Полезные материалы, ссылки и непрошенные советы — то, что нужно в конце такого обучения.
Но на самом деле, это не конец, а только начало интересного пути Продажник:
Simulative / Симулятор SQL для анализа данных: Обучение на практике
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.