Skip to content

brunaMF/task_webcrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 

Repository files navigation

Task WebCrawler

Dadas as opções de máquinas nas páginas-alvo, o crawler deve extrair os seguintes atributos de cada opção de máquina:

  • CPU / VCPU
  • MEMORY
  • STORAGE / SSD DISK
  • BANDWIDTH / TRANSFER
  • PRICE [ $/mo ]

Páginas-alvo:

  1. https://www.hostgator.com/vps-hosting (Apenas tabela hardware)
  2. https://www.vultr.com/products/bare-metal/ (Tabela Bare Metal)

Ao executar um crawler, devem ser disponíveis as seguintes opções independentes entre si:

  • print: Imprime resultados na tela
  • save_csv: Salva dados em arquivo csv
  • save_json: Salva dados em arquivo json

Como executar

python3 script_crawler.py

Após a execução, deverá ser escolhido dentre as duas urls apresentadas e em seguida a opção que se deseja.

About

Apenas um teste de criação de webcrawer.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages