- Введение
- Tesla P100: Революционные производительность и функциональность для GPU вычислений
- Экстремальная производительность для высокопроизводительных вычислений и глубинного обучения
- NVLink: Экстраординарная пропускная способность для связности множества GPU и GPU-ЦПУ
- Высокоскоростная архитектура памяти HBM2
- Упрощённое программирование для разработчиков с унифицированной памятью и вычислением вытеснения
- Архитектура оборудования GP100 в глубину
- Исключительные производительность и энергоэффективность
- Потоковый мультипроцессор Pascal
- Разработан для высокопроизводительных вычислений с двойной точностью
- Поддержка арифметики FP16 ускоряет глубинное обучение
- Лучшая атомарность
- Изменения кэша L1/L2 в GP100
- Расширения GPUDirect
- Вычислительная совместимость
- Tesla P100: Первое в мире GPU с HBM2
- Архитектура Tesla P100
- Высокоскоростной интерконнект NVLink
- Унифицированная память
- Вычисление вытеснения
- Суперкомпьютер глубинного обучения NVIDIA DGX-1
- Выводы
- Приложение A: Технология передачи сигналов и протоколов NVLink
- Приложение B: Ускорение глубинного обучения и искусственного интеллекта при помощи GPU
Примерно десятилетие назад NVIDIA® выступила пионером применения GPU для ускорения рабочих нагрузок с интенсивными вычислениями предложив G80 GPU и NVIDIA® CUDA® платформу параллельных вычислений. Сегодня NVIDIA® Tesla® GPU ускоряет тысячи приложений с высокопроизводительными вычислениями (HPC, High Performance Computing) во многих областях включая динамику течений, медицинские исследования, машинное видение, финансовое моделирование, квантовую химию, изучение энергии и ряд других.
Nvidia Tesla GPU установлены во многих топовых суперкомпьютерах по всему миру, ускоряя исследования и делая возможными всё более и более сложные моделирования во множестве областей. Центры обработки данных применяют Nvidia Tesla GPU для ускорения множества приложений HPC и Больших данных, а также делая возможными передовые системы Искусственного Интеллекта (ИИ, AI- Artificial Intelligence) и Глубинного обучения (Deep Learning).
Новый ускоритель NVIDIA, NVIDIA Tesla P100
(см. Рисунок 1) применяет новаторский новый
GPU NVIDIA® Pascal™
GP100
переводит GPU вычисления на новый уровень. Данная статья освещает подробности и
ускорителя Tesla P100 и архитектуру GPU Pascal GP100.
Также предметом обсуждения является новый мощный сервер NVIDIA DGX-1, который использует восемь ускорителей Tesla P100, эффективный суперкомпьютер ИИ в одной коробке. DGX-1 специально разработан в помощь исследователям передовых технологий ИИ и учёным в области данных, которым необходима интегрированная система для Глубинного обучения. (Deep Learning).