[Анна Кузина] Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021)

DR.S

Живёт по соседству
Особенный
Спасибо от Разулы
Регистрация
13 Апр 2019
Сообщения
2.922
Реакции
51.209
Ra
16.491
Сбор данных с сайтов с использованием различных библиотек и фреймворков.

Описание курса:

Этот курс предназначен для тех, кто хочет научиться автоматизированному сбору информации с различных сайтов, то есть парсингу. Для прохождения курса требуются базовые знания питона.

На лекциях будут рассмотрены основные подходы к сбору данных с использованием таких библиотек, как requests, beautifulsoup4 и splash, а также фреймворков Scrapy и Selenium.

В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.

Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.

После прохождения курса студенты будут знать:

- Как найти и установить необходимые библиотеки для парсинга данных.
- Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.
- Для чего нужен файл robots.txt.
- Каким образом получать HTML сайта для извлечения необходимой информации.
- Как пользоваться xpath для указания точного расположения элементов на странице.
- Как переходить по страницам на многостраничном сайте.
- Как создавать проект и запускать «пауков» Scrapy.
- Как парсить всю информацию о каждом товаре на сайте.
- Как осуществлять переход на страницу каждого товара.
- Каким образом парсить сайты, использующие JavaScript при загрузке.
- Как авторизовываться на сайте, используя фреймворк Selenium.
- Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.


Войти или Зарегистрироваться чтобы увидеть скрытый текст.

 

Maksim

Разула в сердце
Живёт по соседству
Особенный
Спасибо от Разулы
Регистрация
14 Май 2016
Сообщения
11.162
Реакции
60.828
Ra
53.325
Запасная ссылка :


Зеркало (mail) :
 
Последнее редактирование:

Похожие темы

Теги по которым нашли тему

  1. Scrapy
  2. Парсинг
  3. PYTHON парсинг
  4. Анна Кузина
  5. кузина парсинг
Сверху