Grab - python web-scraping framework

Grab has been made to:

  • Extract data from web-site
  • Work with web-API
  • Automate human-like activity on web-site

https://travis-ci.org/lorien/grab.png?branch=v06 https://coveralls.io/repos/lorien/grab/badge.svg?branch=v06
https://pypip.in/download/grab/badge.svg?period=month https://pypip.in/version/grab/badge.svg
https://landscape.io/github/lorien/grab/v06/landscape.png https://readthedocs.org/projects/grab/badge/?version=latest

Web-Resources:

Github project: source code and issue tracker:
http://github.com/lorien/grab
English mailing list:
http://groups.google.com/group/grab-users
English documentation:
http://docs.grablib.org/en/latetst/
Russian mailing list:
http://groups.google.com/group/python-grab
Russian documentation:
http://docs.grablib.org/ru/latetst/
Russian skype chat:
join

Contribution to Grab project:

  1. Write publication about the Grab on your blog or on some pupular discussion board like reddit or hacker news
  2. Report a bug, describe details
  3. Create new feature and submit pull-request
  4. Hire me for web-scraping project getdata.pro
  5. Just send money


News

Development activity

Talks in grab-users [en]

Talks in python-grab [ru]

  • 15 July 10:14 : Парсинг всех линков с сайта
  • 12 July 13:33 : Не работает проксилист через g.proxylist.load_file
  • 05 July 11:14 : Как правильно организовать структуру или куда смотреть )
  • 17 June 20:40 : Re: doc.select работает не так как нужно
  • 16 June 12:46 : Ошибка TypeError: invalid arguments to setopt
  • 11 June 13:05 : Как открыть Grab, Как связать с python? Как начать парсить сайты?
  • 02 June 13:07 : Django и Grab
  • 25 May 09:34 : неверный HTTP-метод при запросе
  • 27 April 03:55 : Запуск grabctl
  • 26 April 10:16 : GrabNetworkError: [Errno 35] Unknown SSL protocol error in connection

Fork me on GitHub