Высокопроизводительные вычисления Больших данных
Copyright © 2022 Massachusetts Institute of Technology
![]() |
Данный документ предоставляется по лицензии Creative Commons Attribution 3.0 License, за исключением разделов со специальными оговорками. |
Первое издание на английском языке: август 2022
Все права защищены. Никакая часть этой книги не может быть воспроизведена, в какой- либо форме с помощью любых электронных или механических средств (включая фотокопирование, запись или хранение информации без письменного разрешения издателя.
MIT Press выражает благодарность анонимным рецензентам, предоставившим комментарии к черновикам данной книги. Щедрая работа академических экспертов необходима для установления авторитета качества наших публикаций. Мы с благодарностью признаём вклад этих не указанных в титрах читателей.
Опубликовано The MIT Press
Cambridge, Massachusetts
US
One Broadway
12th Floor
Cambridge, MA 02142
UK
Unit 57710
PO Box 6945
London W1A 6US UK
ISBN 9780262046855
2022-08-02
Мы благодарны нашим ученикам и сотрудникам Адитье Бхату, Раджарши Бисвасу, Шашанк Гугнани, Юджи Хуи, Нусрату Исламу, Хасибу Джаведу, Арджуну Кашьяпу, Куналу Кулкарни, Тяньси Ли, Юке Ли, Хао Ци, доктору Васи-ур-Рахману, Хайян Ши и Цзе Чжан за их совместную научную работу в течение последних десяти лет. Мы искренне благодарим Шашанк Гугнани, Хасибу Джаведу, Арджуну Кашьяпу, Юке Ли, Хао Ци и Хайян Ши за их вклад в этот сборник и за корректуру нескольких версий данной рукописи. Особая благодарность Мари Ли, Кейт Элвелл и Элизабет Суэйзи из MIT Press за их существенную помощь в публикации этой книги. Кроме того, мы обязаны Национальному научному фонду (NSF) за несколько грантов (например, IIS-1447804, OAC-1636846, CCF-1822987, OAC-2007991, OAC-2112606 и CCF-2132049). Эта книга была бы невозможна без такой поддержки.
Наконец, мы посвящаем эту книгу нашим любящим семьям (П. С. Панда, С. М. Панда, Дебашри Пати, Абха Панда, Цзунхе Лу, Хайинг Ю, Шерри Пэн, Ада Лу, Аливия Лу, Алан Лу, доктор Р. Шивашанкар, Г. С. Ушарани, и Манджу Г. Сиддаппа) за их любовь и понимание во время длительного процесса написания этой книги в течение последних пяти лет.
Дхабалешвар К. Панда, Сяойи Лу и Дипти Шанкар
19 марта 2022
Углублённый обзор новой области, объединяющей высокопроизводительные вычисления, обработку Больших данных и глубокое обучение.
За последнее десятилетие экспоненциальный взрыв данных, известных как Большие данные, изменил наши понимание и применение мощности данных. Новая область высокопроизводительных вычислений Больших данных, объединяющая высокопроизводительные вычисления (HPC), обработку Больших данных и Глубинное обучение, направлена на решение проблем, связанных с крупномасштабной обработкой данных. Эта книга предлагает подробный обзор высокопроизводительных вычислений Больших данных и связанных с ними технических вопросов, подходов и решений.
Книга охватывает основные концепции и необходимые базовые знания, включая структуры обработки данных, системы хранения и аппаратные возможности; предлагает подробное обсуждение технических вопросов ускорения вычислений Больших данных с точки зрения вычислений, взаимодействия, памяти и хранения, проектирования кода, характеристики рабочей нагрузки и сравнительного анализа, а также развёртывания системы и управления ею; также исследует эталонное тестирование и рабочие нагрузки для оценки систем промежуточного программного обеспечения Больших данных. В ней подробно обсуждаются вычислительные системы и приложения для Больших данных с высокопроизводительными сетевыми, вычислительными технологиями и технологиями хранения, включая самые современные разработки для систем обработки и хранения данных. Наконец, в книге рассматриваются некоторые передовые темы исследований в области высокопроизводительных вычислений Больших данных, в том числе разработка высокопроизводительных стеков глубинного обучения на основе Больших данных (DLoBD), а также технологий Облачных решений высокопроизводительных вычислений.
Глава 2. Модели и системы параллельного программирования
Глава 3. Параллельные и распределённые системы хранения
Глава 4. Архитектура и тенденции HPC
Глава 5. Возможности и проблемы ускорения вычислений Больших данных
Глава 6. Эталонное тестирование систем Больших данных
Глава 8. Ускорение при помощи многоядерных технологий и дополнительных вычислительных устройств
Глава 9. Ускорение при помощи технологий высокопроизводительного хранения
Глава 10. Глубинное обучение на основе Больших данных
Глава 11. Проектирование с применением технологий Облачных решений
Глава 12. Передовые исследования в области высокопроизводительных вычислений Больших данных
Об авторах
Дхабалешвар К. Панда профессор и почётный научный сотрудник в области вычислительных наук и инженерии в Университете штата Огайо.
Сяойи Лу доцент кафедры компьютерных наук и инженерии Калифорнийского университета в Мерседе.
Тайлер Леонхардт работает инженером-программистом в команде PowerShell около 2 лет, а в Microsoft — почти 3 года. Участник команды PowerShell.
Дипти Шанкар в настоящее время работает в SAP в Германии.
Об обложке
- Вводная часть
- Глава 1. Введение
- Глава 2. Модели и системы параллельного программирования
- Глава 3. Параллельные и распределённые системы хранения
- Глава 4. Архитектура и тенденции HPC
- Глава 5. Возможности и проблемы ускорения вычислений Больших данных
- Обзор
- C1: Проблемы вычислений
- C2: Проблемы взаимодействия и перемещения данных
- C3: Проблемы управления памятью и хранением
- C4: Проблемы совместной разработки систем и приложений Больших данных
- C5: Проблемы снятия характеристик и эталонного тестирования рабочей нагрузки Больших данных
- C6: Проблемы развёртывания и управления
- Выводы
- Глава 6. Эталонное тестирование систем Больших данных
- Глава 7. Ускорение RDMA
- Глава 8. Ускорение при помощи многоядерных технологий и дополнительных вычислительных устройств
- Глава 9. Ускорение при помощи технологий высокопроизводительного хранения
- Глава 10. Глубинное обучение на основе Больших данных
- Глава 11. Проектирование с применением технологий Облачных решений
- Глава 12. Передовые исследования в области высокопроизводительных вычислений Больших данных
- Дополнение A. Ссылки
- Указатель
-
Сетевые протоколы для профессионалов безопасности, Йорам Орзач, Дипаншу Ханна, Packt Publishing, октябрь 2022
-
JavaScript для хакеров. Научитесь думать как хакер, Гарет Хейс, Leanpub, декабрь 2022
-
Как заниматься взломом словно легенда. Прорываемся в Windows, Спарк Флоу, No Starch Press, октябрь 2022
-
Управление оперативной памятью в реляционных системах баз данных, Педро Мехия Альварес, Марсело Леон Айяла, Сусана Ортега Сиснерос, Springer, август 2022
-
Атакующий код запуска оболочки с нуля, Ришалин Пиллэй, Packt Publishing, май 2022
-
Linux подсистема Windows (WSL) для профессионалов, Хайден Барнс, Apress, июнь 2021
-
Внутреннее устройство CPython, Энтони Шоу, Real Python, январь 2021
-
Контейнеры Linux и Виртуализация: с точки зрения ядра, Шашанк Мохан Джейн, Apress, октябрь 2020
-
Изучаем подсистемы Windows для Linux, Прэйтик Сингх, Apress, сентябрь 2020
-
Всё что требуется для RabbitMQ, 2е изд., Ловайса Йохансон, Дэйвид Доссо, Packt Publishing, август 2020
-
Практика загрузки. Изучение процесса загрузки Linux, Windows и Unix, Йогеш Бабар, Apress, июль 2020
-
Распределённые системы для практиков, Даймос Раптис, Leanpub, май 2020
-
Практическая автоматизация предприятия в Linux, Джеймс Фриман, Packt Publishing, январь 2020, Действенное выполнение крупномасштабной автоматизации инфраструктуры Linux с применением Ansible.
-
Внутреннее устройство баз данных, Алекс Петров, O`Reilly Media, Inc., октябрь 2019
-
Книга рецептов параллельного программирования Python. 2е изд., Джанкарло Закконе, Packt Publishing, сентябрь 2019
-
Полное руководство Ansible. 3е изд., Джеймс Фриман и Джесс Китинг, Packt Publishing, март 2019
-
Книга рецептов NGINX Дерек ДеДжонге, O’Reilly Media, Inc, ноябрь 2018
-
Полное руководство Ceph, 2е изд. Ник Фиск, Packt Publishing, февраль 2019
-
Docker для разработчиков Rails Роб Айзенберг, The Pragmatic Programmers, LLC., февраль 2019, с дополнениями по настройкам Django и 100Gb IB
-
Глава 11. SQL Server и контейнеры (включая Kubernetes) Боб Вордс, "Профессиональный SQL Server поверх Linux", Apress, октябрь 2018
-
Полное руководство параллельного программирования на Python Куан Нгуен, Packt Publishing, ноябрь 2018
-
Asyncio в Python 3 Цалеб Хаттингх, O’Reilly Media, Inc, март 2018
-
RabbitMQ для профессионалов Гайвин Рой, Manning Publications, сентябрь 2017
-
Proxmox. Полное руководство. 3е изд Васим Ахмед, Packt Publishing, ноябрь 2017
-
Книга рецептов Ceph, 2е изд Викхайят Умрао,Мишель Хаккет,Каран Сингх, Packt Publishing, ноябрь 2017
-
Изучаем Ceph, 2е изд., Энтони Д`Атри, Вайбхав Бхембре, Каран Сингх, Packt Publishing, октябрь 2017
-
Книга рецептов виртуализации KVM Константин Иванов, Packt Publishing, июнь 2017
-
Полное руководство работы с сетями на Python. Эрик Чоу, Июнь 2017
-
Контейнеризация при помощи LXC Константин Иванов, Packt Publishing, март 2017
-
Proxmox. Полное руководство. 2е изд., Васим Ахмед, Packt Publishing, май 2016
-
Книга рецептов Ceph Каран Сингх, Packt Publishing, февраль 2016
-
Полная виртуализация. Базовая коммерческая редакция: Proxmox-freeNAS-Zentyal-pfSense. Ли Р. Сюрбер, февраль 2016
-
Zabbix. Полное руководство. 2е изд., Андреа Далле Ваккье, сентябрь 2015
-
Книга рецептов Proxmox. Главы 1-6, Дополнения: Преобразование OpenVZ в LXC, Организация ограждения Васим Ахмед, Packt Publishing, август 2015
-
Изучаем Ceph Каран Сингх, Packt Publishing, январь 2015
Дополнительные ссылки:
Перевод: Copyright © 2022 ![]() All rights reserved. Ссылки обязательны (Refs and links are obligatory). | http://www.mdl.ru портфолио SD DC |
HPE DL360 G10 since 4300$ |