Обновление линейки GPU NVIDIA Quadro RTX

Обзор новейших GPU на базе архитектуры NVIDIA Ampere

Уже прошло два года с момента выхода первого поколения линейки NVIDIA Quadro RTX, основной которых служили GPU на базе архитектуры NVIDIA Turing. Это был прорыв в технологиях, на SIGGRAPH 2018, Дженсен Хуанг представил первый GPU и ускоритель с возможностью полноценной трассировки лучей в режиме реального времени NVIDIA Quadro RTX 8000.

Линейка GPU NVIDIA GeForce получила минорное обновление около года назад, также был представлен стек NVIDIA STUDIO и активно продвинули его в мобильных компьютерах, а затем в сегменте десктопа.

О платформе и стеке NVIDIA STUDIO я подробно писал в нескольких статьях:

Отличием архитектуры NVIDIA Turing от всех предыдущих архитектур GPU стало наличие специальных ядер RT Core, которые отвечали за реализацию трассировки лучей на аппаратном уровне и доступные в API NVIDIA OptiX, DirectX и Vulkan.

Линейка GPU NVIDIA Quadro уже давно позиционируется как решение для профессиональных пользователей, разработчиков специализированных аппаратно-программных комплексов, и решений корпоративного уровня. Отдельного внимания заслуживает применение NVIDIA Quadro для создания виртуализированных рабочих станций и рабочих столов, что позволяет централизованно управлять множеством виртуальных машин и распределять возможности системы для обеспечения высокой производительности конкретного пользователя. Также NVIDIA Quadro являются неотъемлемой частью рабочих станций не только для САПР и дизайна, но и рабочих станций для обработки данных (Data Science Workstations (DSWS), что позволяет полностью использовать возможности больших объемов графической памяти.

Для разработчиков специализированных приложений, предназначенных для вычислений с высокой точностью, GPU линейки NVIDIA Quadro предоставляют поддержку памяти стандарта ECC, что позволяет применять данные GPU для разработки приложений в научных лабораториях и аэрокосмической отрасли.

Эпоха архитектуры NVIDIA Ampere

Архитектура NVIDIA Ampere была представлена весной 2020 года и сразу представлена в высокопроизводительном решении DGX A100. Сама архитектура Ampere является продолжателем идей и возможностей, заложенных в архитектуре Volta, но с рядом возможностей, использованных в архитектуре Turing. Кдючевым приемущестаом Ampere является возросшая производительность на Ватт потребояемой энергии, за счет увеличения транзисторов, перехода на новый технологический процесс и оптимизации архитектуры в целом, GPU на основе архитектуры NVIDIA Amper показывают значительно большую производительность, в сравнении с архитектурами NVIDIA Pascal, NVIDIA Volta и NVIDIA Turing.

Важно отметить, что в первую очередь, новая архитектура ориентирована на применение в центрах обработки данных и облачной инфраструктуре, и уже после этого идет графика, о которой конечно же не забывают и дают пользователям новые возможности как для высококачественного гейминга, так и для профессиональных пользователей, занимающихся разработкой контента и обработкой данных.

Сейчас, ИИ и МО (Машинное обучение) входят в функционал многих пакетов для компьютерной графики и обработки изображений.

Буквально пару месяцев назад были представлены GPU семейства GeForce RTX 30-ой серии. Разработчики специально создали модификацию GPU GA102 с поддержкой ядер RTX и обеспечили двукратный прирост производительности в операциях с ИИ и МО, а также в трассировке луча. Но тогда, не было анонса моделей GPU профессиональной линейки NVIDIA Quadro и NVIDIA A40 A (ex. NVIDIA Tesla).

Презентация NVIDIA Quadro RTX A6000 и NVIDIA A40

В начале октября меня пригласили на пресс-брифинг посвященным новым анонсам на GTC 2020. В этом году, GTC проводится в online формате и все выступления проходят в виде заранее подготовленных записей и вебинаров.

Выпустив NVIDIA GeForce RTX 3080 и 3090, разработчики создали основу для разработки приложений с учетом современной архитектуры и её возможностей, но все GPU NVIDIA GeForce с большим трудом могут быть применимы для задач, выполняемых с использованием специализированного ПО и специальных программных решений, выполняющих специализированные задачи, например вычисления на суперкомпьютерах или виртуализация рабочих столов для множества пользователей.

5 октября, NVIDIA представила два GPU профессиональной линейки NVIDIA Quadro, а именно NVIDIA Quadro RT A6000 и GPU для центров обработки данных и облачной инфраструктуры - NVIDIA A40.

img_001.png

Рис. 1. Слайд из презентации, слева - NVIDIA Quadro RTX A6000, справа GPU NVIDIA A40.

На представленном вашему вниманию слайде приведены характеристики и изображения двух новых GPU. При кажущейся идентичности, данные модели обладают существенными отличиями, GPU NVIDIA Quadro RTX A6000 предназначен для высокопроизводительных рабочих станций, и представлен в виде модели с активной системой охлаждения в привычном для нас корпусе. Вторая модель, NVIDIA A40, является продолжателем линейки NVIDIA Tesla, и предназначена для применения в центрах обработки данных и облачных сервисов, а система пассивного охлаждения объединяется с активной системой охлаждения сервера и минимизирует вероятность выхода из строя GPU со стороны его системы охлаждения.

Оба GPU используют шину PCI Express 4.0 x16, что обеспечивает вдвое большую пропускную способность в сравнении с PCI Express 3.0 x16. Для хранения данных GPU предоставляет 48 Гб графической памяти стандарта GDDR6 с коррекцией ошибок (ECC). Выбор в сторону менее производительной но прошедшей сертификацию и широко распространенной памяти GDDR6 обусловлен тем, что память GDDR6X является своеобразным апдейтом данного стандарта и будет уместна в игровых решениях, но она не поддерживает ECC, а также не обладает сертификацией JEDEC, корпоративные клиенты всегда требовательны к таким моментам и предпочтут проверенные годами использования и сертифицированные решения, хоть и с меньшей производительностью. Помимо этого, GDDR6X разработана совместными усилиями NVIDIA и Micron, но это ограничивает широту выпускаемых компонентов и риски на получение брака.

В основе обеих моделей, лежит полноценный GPU GA102, аналогичный GPU используется и в NVIDIA GeForce RTX 3080 и 3090, но в них он обладает меньшим количеством ядер CUDA, RT Core и Tensor Core. Графический процессор используемый в Quadro A6000 и A40 содержит 10752 ядер CUDA, 84 ядра RT Core второго поколения и 336 ядра Tensor Core третьего поколения, что несколько больше, чем в игровых моделях.

Здесь хочется сделать небольшое отступление. Многие задаются вопросом о том, почему Quadro менее производительна в синтетических тестах при аналогичном GPU используемом в GeForce. По своей сути, GeForce обладает большей производительностью за счет увеличения частот и оптимизаций в BIOS графического ускорителя. Так как Quadro ориентированы на применение в продолжительный период, и при этом в режиме 24/7, а также учитывают возможность использования в центрах обработки данных, то увеличение частот, приведет к большему потреблению энергии, перегреву и меньшему сроку службы. Но при этом, за счет такого подхода, у Quadro есть достаточный запас для разгона и увеличения производительности.

При переходе на новый техпроцесс и обновлении архитектуры графического процессора разработчикам удалось получить двукратный прирост производительности шейдерных процессоров, увеличения производительности трассировки луча в два раза, и пятикратного прироста в производительности тензорных ядер.

img_002.png

Рис. 2. Архитектура NVIDIA Ampere предоставила прирост производительности в вычислениях и обеспечивает эффективность в потреблении энергии при достижении большого числа кадров.

Достижения баланса в производительности и потреблении энергии особенно востребованы в решениях для рабочих станций и серверов, когда расчет энергии и итоговой производительности очень важен. Ведь не каждой организации хочется переплачивать за потребляемую системами энергию. При возможности протестировать новые GPU я обязательно подробнее изучу данный вопрос.

Компания NVIDIA на текущий момент выделяет шесть областей применения профессиональных GPU линейки Quadro и A40.

img_003.png

Рис. 3. Области и направления применения GPU NVIDIA Quadro RTX A6000 и NVIDIA A40

Отрасль визуализации (rendering) остается ключевой для применения профессиональных GPU линейки NVIDIA Quadro, также для обеспечения высокой производительности и коллективной работы продолжают свое развитие решения для виртуализации рабочих станций (virtual workstations), по своей сути мы можем объединить, виртуальные рабочие станции и инструменты для визуализации в едином вычислительном кластере, что позволяет работать целым коллективам дизайнеров в централизованной среде.

К более практическим областям применения относятся моделирование физических явлений, обработка данных, вычисления общего назначения и применение в AR/VR областях.

image001.jpg

NVIDIA A40 GPU

image002.jpg

NVIDIA Quadro RTX A6000 GPU

Платформа NVIDIA Omniverse

Ключевым анонсом среди профессиональных решений для дизайнеров и профессиональных пользователей является представление и запуск открытого beta-тестирования платформы NVIDIA Omniverse. Разработка которой была запущена еще пару лет назад, с выходом первого поколения NVIDIA RTX.

img_004.png

Рис. 4. Платформа NVIDIA Omniverse позволяет упростить обмен данными между различными приложениями и специалистами при коллективной работе над проектом.

Платформа NVIDIA Omniverse представлена пятью элементами, отвечающими за определенные области. Элемент CONNECT обеспечивает модули к приложениям и SDK для интеграции возможностей Omniverse в любое приложение (САПР или DCC), элемент NUCLEOS предоставляет ядро сервисов и облачную инфраструктуру, элемент Create предоставляет инструменты для отображения, редактирования и обработки данных.

img_005.png

Рис. 5. ключевые элементы платформы NVIDIA Omniverse.

Элемент SIMULATE обеспечивает специалистов инструментами для моделирования различных физических явлений, анимации, искусственного интеллекта и поведения объектов. И финальным элементом является RTX RENDERER, включающий в себя возможности платформы NVIDIA RTX и обеспечивающий высококачественную визуализацию созданных коллективом пользователей моделей.

Для обмена данными разработчики используют формат USD (Universal Scene Description), разработанный анимационной студией PIXAR и активно внедряемый во множество приложений компьютерной графики и анимации.

Для работы с данными USD, в NVIDIA использовали модифицированную версию фреймворка Hydra, для оптимизации работы с современными GPU и их возможностями.

Для работы с NVIDIA Omniverse вам потребуется одно или несколько приложений, поддерживаемых Omniverse и учетная запись в облачном сервисе. Вы устанавливаете модуль Omniverse на вашу систему и работаете как удаленно, так и локально. Отмечу, что при использовании Omniverse вы можете использовать богатые возможности облачной визуализации с поддержкой RTX, так как для этого компания NVIDIA разработала сервер RTX SERVER, с несколькими GPU NVIDIA Quadro и ориентированный на применение в областях визуальных вычислений.

Сейчас вы можете оставить заявку на открытое beta-тестирование и получить доступ к возможностям платформы NVIDIA Omniverse.

Анонсы в NVIDIA BLOG

To 3D and Beyond: Pixar’s USD Coming to an Industry Near You

NVIDIA Ampere Architecture GPUs for Professional Designers Bring Unparalleled Performance to Desktop, Data Center and Cloud

New NVIDIA Studio Announcements at GTC Support Creators at Home and in Studio

NVIDIA Announces Omniverse Open Beta, Letting Designers Collaborate in Real Time — from Home or Around the World

0
RENDER.RU