- Wolohan J. T. Mastering Large Datasets with Python_ Parallelize and Distribute Your Python Code-Manning. Manning, 2020
- Су К., Ын А. Теоретический минимум по Big Data. Всё что нужно знать о больших данных. Питер, 2019
- Ульман Д. Д., Раджараман А., Лесковец Ю. Анализ больших наборов данных. ДМК Пресс, 2016
- Карау Х., Захария М., Венделл П., Конвински Э. Изучаем Spark. Молниеносный анализ данных. ДМК Пресс, 2015
- White T. Hadoop: The Definitive Guide
- Bengfort, Kim. Data Analytics with Hadoop
- Jean-Georges Perrin. Spark in Action, Second Edition