NVIDIA Tesla P100 - Техническая спецификация

NVIDIA®

WP-08019-001_v01.1

 Содержание

Введение
Tesla P100: Революционные производительность и функциональность для GPU вычислений
Экстремальная производительность для высокопроизводительных вычислений и глубинного обучения
NVLink: Экстраординарная пропускная способность для связности множества GPU и GPU-ЦПУ
Высокоскоростная архитектура памяти HBM2
Упрощённое программирование для разработчиков с унифицированной памятью и вычислением вытеснения
Архитектура оборудования GP100 в глубину
Исключительные производительность и энергоэффективность
Потоковый мультипроцессор Pascal
Разработан для высокопроизводительных вычислений с двойной точностью
Поддержка арифметики FP16 ускоряет глубинное обучение
Лучшая атомарность
Изменения кэша L1/L2 в GP100
Расширения GPUDirect
Вычислительная совместимость
Tesla P100: Первое в мире GPU с HBM2
Эластичность памяти
Архитектура Tesla P100
Высокоскоростной интерконнект NVLink
Настройки NVLink
Связность NVLink GPU-с-GPU
Связность NVLink ЦПУ-с-GPU
Интерфейс NVLink с Tesla P100
Унифицированная память
История унифицированной памяти
Унифицированная память Pascal P100
Преимущества унифицированной памяти
Вычисление вытеснения
Суперкомпьютер глубинного обучения NVIDIA DGX-1
250 серверов в одной коробке
12ти кратное ускорение DNN за один год
Особенности программного обеспечения DGX-1
Техническая спецификация системы NVIDIA DGX-1
Выводы
Приложение A: Технология передачи сигналов и протоколов NVLink
Уровни контроллера NVLink
Физический уровень (PL)
Уровень канала данных (DL)
Транспортный уровень (TL)
Приложение B: Ускорение глубинного обучения и искусственного интеллекта при помощи GPU
Глубинное обучение в двух словах
GPU NVIDIA: механизм глубинного обучения
Tesla P100: Самый быстрый ускоритель для самообучаемых глубинных нейронных сетей
Решение проблем Больших данных при помощи NVIDIA GPU и DNN
Самоуправляемые автомобили
Роботы
Здравоохранение и наука о жизни

 . Введение

Примерно десятилетие назад NVIDIA® выступила пионером применения GPU для ускорения рабочих нагрузок с интенсивными вычислениями предложив G80 GPU и NVIDIA® CUDA® платформу параллельных вычислений. Сегодня NVIDIA® Tesla® GPU ускоряет тысячи приложений с высокопроизводительными вычислениями (HPC, High Performance Computing) во многих областях включая динамику течений, медицинские исследования, машинное видение, финансовое моделирование, квантовую химию, изучение энергии и ряд других.

Nvidia Tesla GPU установлены во многих топовых суперкомпьютерах по всему миру, ускоряя исследования и делая возможными всё более и более сложные моделирования во множестве областей. Центры обработки данных применяют Nvidia Tesla GPU для ускорения множества приложений HPC и Больших данных, а также делая возможными передовые системы Искусственного Интеллекта (ИИ, AI- Artificial Intelligence) и Глубинного обучения (Deep Learning).

Новый ускоритель NVIDIA, NVIDIA Tesla P100 (см. Рисунок 1) применяет новаторский новый GPU NVIDIA® Pascal GP100 переводит GPU вычисления на новый уровень. Данная статья освещает подробности и ускорителя Tesla P100 и архитектуру GPU Pascal GP100.

 

Рисунок 1


NVIDIA Tesla P100 с GPU Pascal GP100

Также предметом обсуждения является новый мощный сервер NVIDIA DGX-1, который использует восемь ускорителей Tesla P100, эффективный суперкомпьютер ИИ в одной коробке. DGX-1 специально разработан в помощь исследователям передовых технологий ИИ и учёным в области данных, которым необходима интегрированная система для Глубинного обучения. (Deep Learning).