Web Scraping

17
Evandro Souza Web Scraping

Transcript of Web Scraping

Page 1: Web Scraping

Evandro Souza

Web Scraping

Page 2: Web Scraping

O que é?

Web harvesting

Web data-extraction

Web crawler

Web Spider Robot

Knowbot

Web Scraping

Page 3: Web Scraping

O que é?

Web harvesting

Web data-extraction

Web crawler

Web Spider Robot

Knowbot

Web Scraping

Técnica para mapear\rastrear informações de web sites.Objetivos: • Navegar em páginas web de forma automatizada.• Mapeia todos os links das URLs recursivamente.• Utilizado normalmente em “motores de busca”.

Técnica para extrair informações de web sites.

Page 4: Web Scraping

Web scraping - Para que serve?• Transformar dados de web sites em estrutura de dados.

• Automatizar tarefas em web sites (simular um usuário)

Page 5: Web Scraping

Qualquer aplicação que necessite de dados extraidos de web sites:

Pesquisas academicas, marketing e ciêntifica

Análise de Mercado

Comparação de preços

Data mining

Casos de uso

Page 6: Web Scraping

Ferramentas

FiddlerFirefox\Chrome Dev tools

Page 7: Web Scraping

ConhecimentosRegular Expression XPath

Page 8: Web Scraping

Necessidadehttps://www.jucerja.rj.gov.br/JucerjaPortalWeb/Paginas/Informacoes/TabelaPrecosPWJ.aspx

Page 9: Web Scraping

Análise

• Fiddler• Dev Tools

Extrair HTML

• Requisições HTTP

Transformar

• HTML Parser• XPath• Regex

Os 3 passos

Page 10: Web Scraping

Exemplos C#HttpWebRequest/HttpWebResponse + Html Agility pack

Page 11: Web Scraping

Exemplos C#HttpWebRequest/HttpWebResponse + Html Agility pack

Page 12: Web Scraping

Exemplos C#HttpWebRequest/HttpWebResponse + Html Agility pack

Page 13: Web Scraping

Exemplos C#Scrapy Sharp

Page 14: Web Scraping

Exemplos C#Scrapy Sharp

Page 15: Web Scraping

Exemplos C#Scrapy Sharp

Page 16: Web Scraping

Exemplos C#HttpWebRequest/HttpWebResponse + AngleSharp

Page 17: Web Scraping

Obrigado!evandroferreiras

evandroferreiras

evandroferreiras