Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Преобразовать таблицы из государственных докладов «О состоянии и об охране окружающей среды Российской Федерации» в открытые данные #24

Open
ivbeg opened this issue Jun 22, 2018 · 0 comments

Comments

@ivbeg
Copy link
Member

ivbeg commented Jun 22, 2018

Цель

На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/regulatory/list.php?part=1101 в которых приведены цифры и таблицы с состоянием окружающей среды по территориям, городам и индикаторам

Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.

Задача

  • выбрать язык программирования Python / R или иной, на выбор
  • проанализировать структуру докладов и описать её
  • написать парсер для докладов http://www.mnr.gov.ru/regulatory/list.php?part=1101
  • выгрузить все данные в формате CSV или JSON или XML
  • загрузить набор данных на хаб открытых данных hubofdata.ru

Требования

  • открытый исходный код в Github под свободной лицензией
  • открытые данные под лицензией Creative Commons

Пожелания

  • сделать описание к выгруженным данным. Структуры данных и набора целиком.

Оценки трудоёмкости

Ожидаемое время на задачу не более 3 недель

Вспомогательные материалы:

Вопросы

Вопросы можно писать на [email protected] или в комментариях к этой задаче

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant