Как и обещал – еще один парсер на Python.

«Beautiful Soup» — это HTML/XML парсер для Python, который может превратить даже невалидную разметку в удобное дерево для парсинга. Он предоставляет простые, идиоматические пути навигации, поиска и изменения дерева для парсинга. Данная библиотека способна сэкономить многие часы работы программиста. Существует также версия для «Ruby», под названием «Rubyful Soup».

В данной статье описаны все основные возможности библиотеки «Beautiful Soup», а также примеры работы.

После прочтения статьи вы поймёте как работает библиотека, как её использовать и как сделать так, чтобы библиотека выполняла нужную работу.

Источник: Лёгкий парсинг сайтов с помощью «Beautiful Soup» / Python / Хабрахабр.

См. также парсинг HTML

Лёгкий парсинг сайтов с помощью «Beautiful Soup» / Python / Хабрахабр
Метки: