• Гигабайты ценной информации. Присоединяйся.
    У нас действительно всё бесплатно, включая ChatGPT/DALLE/VISION)

[BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

serafim

Житель Разулы
Команда форума
Разула в сердце
Регистрация
25 Апр 2016
Сообщения
78.845
Реакции
128.692
Ra
242.639
[BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

В этом модуле вы изучите:
  • подходы к Realtime-обработке; гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа"; Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream; архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей; семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация. отличия Key-Value хранилищ от реляционных БД; компактификация и её виды, CQLSH; архитектура Cassandra; обеспечение надёжности и высокодоступности в Key-Value хранилищах; интеграция Spark с Cassandra. как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках; trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные; форматы данных в Big Data: ORC vs Parquet, Avro, ...
Продажник:
Практический курс по Big Data | BigData Team
Скачать:
 
Сверху