Skip to content

Commit

Permalink
Добавлено описание библиотек общего вида
Browse files Browse the repository at this point in the history
  • Loading branch information
matyushkin committed Nov 28, 2020
1 parent b6fbf86 commit 7609006
Show file tree
Hide file tree
Showing 2 changed files with 17 additions and 4 deletions.
8 changes: 4 additions & 4 deletions books/books_big_data.md
Original file line number Diff line number Diff line change
@@ -1,9 +1,9 @@
## Книги по Big Data
- Wolohan J. T. Mastering Large Datasets with Python_ Parallelize and Distribute Your Python Code-Manning. Manning, 2020
- Су К., Ын А. Теоретический минимум по Big Data. Всё что нужно знать о больших данных. Питер, 2019
- Ульман Д. Д., Раджараман А., Лесковец Ю. Анализ больших наборов данных. ДМК Пресс, 2016
- Карау Х., Захария М., Венделл П., Конвински Э. Изучаем Spark. Молниеносный анализ данных. ДМК Пресс, 2015
- White T. Hadoop: The Definitive Guide
- Bengfort, Kim. Data Analytics with Hadoop
- Ульман Д. Д., Раджараман А., Лесковец Ю. Анализ больших наборов данных. ДМК Пресс, 2016
- Карау Х., Захария М., Венделл П., Конвински Э. Изучаем Spark. Молниеносный анализ данных. ДМК Пресс, 2015
- White T. Hadoop: The Definitive Guide
- Bengfort, Kim. Data Analytics with Hadoop
- Jean-Georges Perrin. Spark in Action, Second Edition

13 changes: 13 additions & 0 deletions software/software_data_science.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,19 @@
## Программное обеспечение, библиотеки и другие готовы решения для общих задач Data Science
- [Docker-образы для Data Science](https://github.com/yang-zhang/docker-setup)

### Классические библиотеки
- [NumPy](https://numpy.org/) – работа с многомерными массивами
- [SciPy](https://www.scipy.org/) – научные вычисления
- [SymPy](http://sympy.org/) – символьные вычисления
- [Pandas](pandas) – табличное представление данных и работа с датафреймами

### Библиотеки визуализации
- [Matplotlib](http://matplotlib.org/) – визуализация, преимущественно 2D
- [Seaborn](https://seaborn.pydata.org/) – базируется на Matplotlib, но оптимизирована под визуализацию задач Data Science
- [Bokeh](https://bokeh.org/) – визуализация данных для веба
- [Plotly](https://plotly.com/python/) – онлайн-инструмент интерактивной визуализации данных на серверной стороне (публикация в интернете)


### Блокноты Jupyter
- [Practical pandas projects](https://github.com/schlende/practical-pandas-projects) – 5 идей для совершенствования навыков Data Science
- [Ветка Reddit JupyterNotebooks](https://www.reddit.com/JupyterNotebooks)
Expand Down

0 comments on commit 7609006

Please sign in to comment.