- Алекс Горелик. Корпоративное озеро больших данных. Новый подход к использованию Big Data и Data Science в бизнесе. Бомбора, 2023.
- Высоконагруженные приложения. Программирование, масштабирование, поддержка. Питер, 2022.
- Су К., Ын А. Теоретический минимум по Big Data. Всё что нужно знать о больших данных. Питер, 2019.
- Ульман Д. Д., Раджараман А., Лесковец Ю. Анализ больших наборов данных. ДМК Пресс, 2016.
- Big Data Analysis with Python. Packt Publishing, 2019. Рассматривается связка Python + Spark для больших данных
- Wolohan J. T. Mastering Large Datasets with Python. Parallelize and Distribute Your Python Code-Manning. Manning, 2020.
- Garry Turkington. Hadoop Beginner's Guide. Packt Publishing, 2024.
- Лэм Чак. Hadoop в действии. ДМК Пресс, 2019.
- Sridhar Alla. Big Data Analytics with Hadoop 3. Packt`, 2018.
- Pro Hadoop Data Analytics: Designing and Building Big Data Systems using the Hadoop Ecosystem. Apress, 2017.
- Dipayan Dev. Deep Learning with Hadoop. Packt Publishing, 2017.
- Hadoop Big Data Interview Questions You'll Most Likely Be Asked. 2017.
- Bengfort, Kim. Data Analytics with Hadoop. 2016.
- Antony B., Boudnik K., Adams C., Shao B., Lee C., Sasaki K`. Professional Hadoop. Wrox, 2017
- White T. Hadoop: The Definitive Guide. Четвертое издание 2015 г. есть в русском переводе под названием «Hadoop: Подробное руководство».
- Тандон А. и др. Расширенная аналитика с PySpark. БХВ, 2023.
- Jean-Georges Perrin. Spark in Action, Second Edition. 2020. Переводное издание: Перрен Жан. Spark в действии. ДМК Пресс, 2021.
- Rachel Warren, Holden Karau. High Performance Spark
- Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс. Spark для профессионалов. Современные паттерны обработки больших данных. Питер, 2017
- Карау Х., Захария М., Венделл П., Конвински Э. Изучаем Spark. Молниеносный анализ данных. ДМК Пресс, 2015.