Parsing

1 — Intro to Web Scrapping

Опубликовано

Наверняка вы слышали о BigData — это наука занимающаяся обработкой больших данных. Но для того чтобы обрабатывать данные их для начала необходимо как-то собрать. Одним из способов является парсинг (parsing — разбор на составляющие) сайтов. Конечно можно и вручную составлять таблицы просматривая каждую страницу сайта, но это достаточно долго и утомительно. А если данные на сайте меняются каждый день, час? Или вы ждёте когда стоимость товара в магазине снизится? Слишком много времени будет занимать постоянный мониторинг вручную. Гораздо удобнее будет написать скрипт, который самостоятельно будет сканировать сайт и получать с него информацию. Для данных целей мы будем использовать библиотеку bs4 и инструмент BeautifulSoup . Использование данной библиотеки подразумевает, что вы знакомы с HTML структурой и принципами разметки на сайте. Поэтому прежде чем приступать к заданиям настоятельно рекомендуем пройти курс по HTML.

В этом курсе мы будем работать с сайтом koddom.com и попробуем получить различные данные для дальнейшей их обработки.