Wikipedia scraper

This is an excercise on how to scrape content from wikipedia.

For this excercise we used an API to get:

cookies
countries (codes: be, fr, ma, ru, etc...)
leaders per country
leader_id to get wikipedia webpage

After we got all the correct info we created a script that scraped each first paragraph for each leader. Then we stored all this information in a JSOn file called leaders.json

Deployment

To deploy this project run

  pip install -r /path/to/requirements.txt
  python main.py

API Reference

info about used API

https://country-leaders.onrender.com/docs

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
__pycache__		__pycache__
.gitignore		.gitignore
README.md		README.md
leaders.json		leaders.json
main.py		main.py
requirements.txt		requirements.txt
scraper.py		scraper.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Wikipedia scraper

Deployment

API Reference

info about used API

About

Releases

Packages

Languages

lefmannetje/wikipedia_scraper

Folders and files

Latest commit

History

Repository files navigation

Wikipedia scraper

Deployment

API Reference

info about used API

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages