NVIDIA Tesla P100 - Техническая спецификация

Copyright © 2016 NVIDIA®

WP-08019-001_v01.1

Содержание

Введение

Tesla P100: Революционные производительность и функциональность для GPU вычислений

Экстремальная производительность для высокопроизводительных вычислений и глубинного обучения
NVLink: Экстраординарная пропускная способность для связности множества GPU и GPU-ЦПУ
Высокоскоростная архитектура памяти HBM2
Упрощённое программирование для разработчиков с унифицированной памятью и вычислением вытеснения

Архитектура оборудования GP100 в глубину

Исключительные производительность и энергоэффективность

Потоковый мультипроцессор Pascal

Разработан для высокопроизводительных вычислений с двойной точностью

Поддержка арифметики FP16 ускоряет глубинное обучение

Лучшая атомарность

Изменения кэша L1/L2 в GP100

Расширения GPUDirect

Вычислительная совместимость

Tesla P100: Первое в мире GPU с HBM2

Эластичность памяти

Архитектура Tesla P100

Высокоскоростной интерконнект NVLink

Настройки NVLink

Связность NVLink GPU-с-GPU
Связность NVLink ЦПУ-с-GPU

Интерфейс NVLink с Tesla P100

Унифицированная память

История унифицированной памяти
Унифицированная память Pascal P100
Преимущества унифицированной памяти

Вычисление вытеснения

Суперкомпьютер глубинного обучения NVIDIA DGX-1

250 серверов в одной коробке
12ти кратное ускорение DNN за один год
Особенности программного обеспечения DGX-1
Техническая спецификация системы NVIDIA DGX-1

Выводы

Приложение A: Технология передачи сигналов и протоколов NVLink

Уровни контроллера NVLink

Физический уровень (PL)
Уровень канала данных (DL)
Транспортный уровень (TL)

Приложение B: Ускорение глубинного обучения и искусственного интеллекта при помощи GPU

Глубинное обучение в двух словах
GPU NVIDIA: механизм глубинного обучения
Tesla P100: Самый быстрый ускоритель для самообучаемых глубинных нейронных сетей
Решение проблем Больших данных при помощи NVIDIA GPU и DNN
Самоуправляемые автомобили
Роботы
Здравоохранение и наука о жизни

. Введение

Примерно десятилетие назад NVIDIA^® выступила пионером применения GPU для ускорения рабочих нагрузок с интенсивными вычислениями предложив G80 GPU и NVIDIA^® CUDA^® платформу параллельных вычислений. Сегодня NVIDIA^® Tesla^® GPU ускоряет тысячи приложений с высокопроизводительными вычислениями (HPC, High Performance Computing) во многих областях включая динамику течений, медицинские исследования, машинное видение, финансовое моделирование, квантовую химию, изучение энергии и ряд других.

Nvidia Tesla GPU установлены во многих топовых суперкомпьютерах по всему миру, ускоряя исследования и делая возможными всё более и более сложные моделирования во множестве областей. Центры обработки данных применяют Nvidia Tesla GPU для ускорения множества приложений HPC и Больших данных, а также делая возможными передовые системы Искусственного Интеллекта (ИИ, AI- Artificial Intelligence) и Глубинного обучения (Deep Learning).

Новый ускоритель NVIDIA, NVIDIA Tesla P100 (см. Рисунок 1) применяет новаторский новый GPU NVIDIA^® Pascal^™ GP100 переводит GPU вычисления на новый уровень. Данная статья освещает подробности и ускорителя Tesla P100 и архитектуру GPU Pascal GP100.

Рисунок 1

NVIDIA Tesla P100 с GPU Pascal GP100

Также предметом обсуждения является новый мощный сервер NVIDIA DGX-1, который использует восемь ускорителей Tesla P100, эффективный суперкомпьютер ИИ в одной коробке. DGX-1 специально разработан в помощь исследователям передовых технологий ИИ и учёным в области данных, которым необходима интегрированная система для Глубинного обучения. (Deep Learning).