Web Scraping com Python
Novembro/2017 - UFF Praia Vermelha
Ministrado por Paula Grangeiro
O que é Web Scraping?
Desafios do Web Scraping
Web Scraping vs. Web Crawling
Scrapy
Code Time!
Criando o nosso projeto
scrapy startproject <nome do projeto>
Criando nosso primeiro Spider
scrapy genspider <nome do spider> <url a ser crawleada>
Criando nosso primeiro Spider
Executando um Spider
scrapy crawl <nome do spider>
Code Time!
Programando o nosso Spider
Analisando o conteúdo a ser crawleado
Como capturar somente os dados relevantes?
Analisando o conteúdo a ser crawleado
Analisando o conteúdo a ser crawleado
scrapy shell <url a ser crawleada>
Alguns “macetes” do shell
Code Time!
Programando o nosso Spider
(Resolução no próximo slide)
Programando o nosso Spider
Armazenando dados em arquivos
scrapy crawl <nome do spider> -o <nome do arquivo>
Automatizando navegação
(Resolução no próximo slide)
response.follow(elemento, callback)
Onde:
Automatizando navegação
Login
Próximos passos?
Obrigada <3