From 7609006f191fa881fe1c98491d964c72f932957d Mon Sep 17 00:00:00 2001 From: matyushkin Date: Sat, 28 Nov 2020 22:44:59 +0300 Subject: [PATCH] =?UTF-8?q?=D0=94=D0=BE=D0=B1=D0=B0=D0=B2=D0=BB=D0=B5?= =?UTF-8?q?=D0=BD=D0=BE=20=D0=BE=D0=BF=D0=B8=D1=81=D0=B0=D0=BD=D0=B8=D0=B5?= =?UTF-8?q?=20=D0=B1=D0=B8=D0=B1=D0=BB=D0=B8=D0=BE=D1=82=D0=B5=D0=BA=20?= =?UTF-8?q?=D0=BE=D0=B1=D1=89=D0=B5=D0=B3=D0=BE=20=D0=B2=D0=B8=D0=B4=D0=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- books/books_big_data.md | 8 ++++---- software/software_data_science.md | 13 +++++++++++++ 2 files changed, 17 insertions(+), 4 deletions(-) diff --git a/books/books_big_data.md b/books/books_big_data.md index 55d543a..0a69cfa 100644 --- a/books/books_big_data.md +++ b/books/books_big_data.md @@ -1,9 +1,9 @@ ## Книги по Big Data - Wolohan J. T. Mastering Large Datasets with Python_ Parallelize and Distribute Your Python Code-Manning. Manning, 2020 - Су К., Ын А. Теоретический минимум по Big Data. Всё что нужно знать о больших данных. Питер, 2019 -- Ульман Д. Д., Раджараман А., Лесковец Ю. Анализ больших наборов данных. ДМК Пресс, 2016 -- Карау Х., Захария М., Венделл П., Конвински Э. Изучаем Spark. Молниеносный анализ данных. ДМК Пресс, 2015 -- White T. Hadoop: The Definitive Guide -- Bengfort, Kim. Data Analytics with Hadoop +- Ульман Д. Д., Раджараман А., Лесковец Ю. Анализ больших наборов данных. ДМК Пресс, 2016 +- Карау Х., Захария М., Венделл П., Конвински Э. Изучаем Spark. Молниеносный анализ данных. ДМК Пресс, 2015 +- White T. Hadoop: The Definitive Guide +- Bengfort, Kim. Data Analytics with Hadoop - Jean-Georges Perrin. Spark in Action, Second Edition diff --git a/software/software_data_science.md b/software/software_data_science.md index d98e9d1..beb11ae 100644 --- a/software/software_data_science.md +++ b/software/software_data_science.md @@ -1,6 +1,19 @@ ## Программное обеспечение, библиотеки и другие готовы решения для общих задач Data Science - [Docker-образы для Data Science](https://github.com/yang-zhang/docker-setup) +### Классические библиотеки +- [NumPy](https://numpy.org/) – работа с многомерными массивами +- [SciPy](https://www.scipy.org/) – научные вычисления +- [SymPy](http://sympy.org/) – символьные вычисления +- [Pandas](pandas) – табличное представление данных и работа с датафреймами + +### Библиотеки визуализации +- [Matplotlib](http://matplotlib.org/) – визуализация, преимущественно 2D +- [Seaborn](https://seaborn.pydata.org/) – базируется на Matplotlib, но оптимизирована под визуализацию задач Data Science +- [Bokeh](https://bokeh.org/) – визуализация данных для веба +- [Plotly](https://plotly.com/python/) – онлайн-инструмент интерактивной визуализации данных на серверной стороне (публикация в интернете) + + ### Блокноты Jupyter - [Practical pandas projects](https://github.com/schlende/practical-pandas-projects) – 5 идей для совершенствования навыков Data Science - [Ветка Reddit JupyterNotebooks](https://www.reddit.com/JupyterNotebooks)