web parsing with python.

Что такое парсинг?

Если говорить простым языком, парсинг — это синтаксический разбор текста. Мы же будем заниматься разбором HTML текста. Это особый текст разметки который обрабатывает ваш браузер, чтобы показать вам красивую картинку сайта.

Для чего нужен парсинг?

Основная задача, это поиск информации. Используя парсинг можно написать алгоритм обрабатывающий большой объём информации. Например, можно собирать информацию о ценах на одинаковые товары в разных интернет-магазинах (Яндекс-маркет). Можно отслеживать динамику изменения валюты на фондовом рынке. Так же можно отслеживать понижение цены на какой-нибудь товар в магазине. Собирать данные и анализировать их на уникальность. Сценариев использования очень много. Главное что парсинг предоставляет возможность сбора информации, а то как обработать эту информацию, вы решаете сами.

А это вообще законно?

Всё зависит от тех ресурсов которые вы парсите, какую информацию достаёте и как используете. Поэтому будьте внимательны при создании парсера. Но могу сказать, что большинство информации в интернете распространяется для свободного чтения ( по крайней мере сайт koddom.com можете парсить сколько угодно ).

Что ж, если готовы можете приступать. Мы будем парсить используя библиотеку bs4.