Парсинг html-стр.. сайта: "продвинутые" Python-модули
-
- Гуру
- Сообщения: 968
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Парсинг html-стр.. сайта: "продвинутые" Python-модули
Здравствуйте. У кого есть опыт "разпарсивания" html-стр.. сайта, подскажите, пожалуйста, какие есть "продвинутые" Python-модули, библиотеки? По urllib2 скачивать умею. А чем далее лучше пользоваться: lxml? Скажем, мне надо сделать следующее: на страничке корневой есть button'ы по которым также надо получать ссылки.
- Denis Rykov
- Гуру
- Сообщения: 3376
- Зарегистрирован: 11 апр 2008, 21:09
- Репутация: 529
- Ваше звание: Author
- Контактная информация:
Re: Парсинг html-стр.. сайта: "продвинутые" Python-модули
Spatial is now, more than ever, just another column- The Geometry Column.
-
- Гуру
- Сообщения: 968
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Парсинг html-стр.. сайта: "продвинутые" Python-модули
Да, Денис, спасибо... "Эти велосипеды для других водителей" - это точно!: не решиться (пока) с многошаговостью и ресуроемкостью установки ScarPy в Windows и, собственно, с малым опытом в этой области. Поищу еще что-то c Grab'ом связанное - он у меня установился легко.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя