Парсинг html-стр.. сайта: "продвинутые" Python-модули

Вопросы по нескольким пакетам сразу, или вопросы, которые непонятно к какой ГИС отнести
Ответить
nickleb
Гуру
Сообщения: 968
Зарегистрирован: 22 май 2010, 20:20
Репутация: 154

Парсинг html-стр.. сайта: "продвинутые" Python-модули

Сообщение nickleb »

Здравствуйте. У кого есть опыт "разпарсивания" html-стр.. сайта, подскажите, пожалуйста, какие есть "продвинутые" Python-модули, библиотеки? По urllib2 скачивать умею. А чем далее лучше пользоваться: lxml? Скажем, мне надо сделать следующее: на страничке корневой есть button'ы по которым также надо получать ссылки.
Аватара пользователя
Denis Rykov
Гуру
Сообщения: 3376
Зарегистрирован: 11 апр 2008, 21:09
Репутация: 529
Ваше звание: Author
Контактная информация:

Re: Парсинг html-стр.. сайта: "продвинутые" Python-модули

Сообщение Denis Rykov »

Spatial is now, more than ever, just another column- The Geometry Column.
nickleb
Гуру
Сообщения: 968
Зарегистрирован: 22 май 2010, 20:20
Репутация: 154

Re: Парсинг html-стр.. сайта: "продвинутые" Python-модули

Сообщение nickleb »

Да, Денис, спасибо... "Эти велосипеды для других водителей" - это точно!: не решиться (пока) с многошаговостью и ресуроемкостью установки ScarPy в Windows и, собственно, с малым опытом в этой области. Поищу еще что-то c Grab'ом связанное - он у меня установился легко.
Ответить

Вернуться в «Общий - ПО»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя