Как и обещал – еще один парсер на Python. «Beautiful Soup» — это HTML/XML парсер для Python, который может превратить даже невалидную разметку в удобное дерево для парсинга. Он предоставляет простые, идиоматические пути навигации, поиска и изменения дерева для парсинга. Данная библиотека способна сэкономить многие часы работы программиста. Существует также версия для «Ruby», под названием «Rubyful Soup». В данной статье описаны все основные возможности библиотеки «Beautiful Soup», а также примеры работы. После прочтения статьи вы поймёте как работает библиотека, как её использовать и как сделать так, чтобы библиотека выполняла нужную работу. Источник: Лёгкий парсинг сайтов с помощью «Beautiful Soup» / Python / Хабрахабр. См. также парсинг HTML
Лёгкий парсинг сайтов с помощью «Beautiful Soup» / Python / Хабрахабр
Метки: