Обновление линейки GPU NVIDIA Quadro RTX
Обзор новейших GPU на базе архитектуры NVIDIA Ampere
Уже прошло два года с момента выхода первого поколения линейки NVIDIA Quadro RTX, основной которых служили GPU на базе архитектуры NVIDIA Turing. Это был прорыв в технологиях, на SIGGRAPH 2018, Дженсен Хуанг представил первый GPU и ускоритель с возможностью полноценной трассировки лучей в режиме реального времени NVIDIA Quadro RTX 8000.
Линейка GPU NVIDIA GeForce получила минорное обновление около года назад, также был представлен стек NVIDIA STUDIO и активно продвинули его в мобильных компьютерах, а затем в сегменте десктопа.
О платформе и стеке NVIDIA STUDIO я подробно писал в нескольких статьях:
- Знакомимся с NVIDIA STUDIO (https://render.ru/ru/dimson3d/post/15850)
- MSI Prestige P65 Creator 9SF - инициатива RTX STUDIO в металле (https://render.ru/ru/dimson3d/post/16203)
- Тестирование мобильной рабочей станции MSI Mobile Workstation WS65 (https://render.ru/ru/dimson3d/post/16471)
- Взгляд на платформу NVIDIA STUDIO спустя год. Тест-драйв HYPERPC PRO T7 STUDIO (https://render.ru/ru/dimson3d/post/19530)
- Введение в решения для обработки данных (https://render.ru/ru/dimson3d/post/16588)
Отличием архитектуры NVIDIA Turing от всех предыдущих архитектур GPU стало наличие специальных ядер RT Core, которые отвечали за реализацию трассировки лучей на аппаратном уровне и доступные в API NVIDIA OptiX, DirectX и Vulkan.
Линейка GPU NVIDIA Quadro уже давно позиционируется как решение для профессиональных пользователей, разработчиков специализированных аппаратно-программных комплексов, и решений корпоративного уровня. Отдельного внимания заслуживает применение NVIDIA Quadro для создания виртуализированных рабочих станций и рабочих столов, что позволяет централизованно управлять множеством виртуальных машин и распределять возможности системы для обеспечения высокой производительности конкретного пользователя. Также NVIDIA Quadro являются неотъемлемой частью рабочих станций не только для САПР и дизайна, но и рабочих станций для обработки данных (Data Science Workstations (DSWS), что позволяет полностью использовать возможности больших объемов графической памяти.
Для разработчиков специализированных приложений, предназначенных для вычислений с высокой точностью, GPU линейки NVIDIA Quadro предоставляют поддержку памяти стандарта ECC, что позволяет применять данные GPU для разработки приложений в научных лабораториях и аэрокосмической отрасли.
Эпоха архитектуры NVIDIA Ampere
Архитектура NVIDIA Ampere была представлена весной 2020 года и сразу представлена в высокопроизводительном решении DGX A100. Сама архитектура Ampere является продолжателем идей и возможностей, заложенных в архитектуре Volta, но с рядом возможностей, использованных в архитектуре Turing. Кдючевым приемущестаом Ampere является возросшая производительность на Ватт потребояемой энергии, за счет увеличения транзисторов, перехода на новый технологический процесс и оптимизации архитектуры в целом, GPU на основе архитектуры NVIDIA Amper показывают значительно большую производительность, в сравнении с архитектурами NVIDIA Pascal, NVIDIA Volta и NVIDIA Turing.
Важно отметить, что в первую очередь, новая архитектура ориентирована на применение в центрах обработки данных и облачной инфраструктуре, и уже после этого идет графика, о которой конечно же не забывают и дают пользователям новые возможности как для высококачественного гейминга, так и для профессиональных пользователей, занимающихся разработкой контента и обработкой данных.
Сейчас, ИИ и МО (Машинное обучение) входят в функционал многих пакетов для компьютерной графики и обработки изображений.
Буквально пару месяцев назад были представлены GPU семейства GeForce RTX 30-ой серии. Разработчики специально создали модификацию GPU GA102 с поддержкой ядер RTX и обеспечили двукратный прирост производительности в операциях с ИИ и МО, а также в трассировке луча. Но тогда, не было анонса моделей GPU профессиональной линейки NVIDIA Quadro и NVIDIA A40 A (ex. NVIDIA Tesla).
Презентация NVIDIA Quadro RTX A6000 и NVIDIA A40
В начале октября меня пригласили на пресс-брифинг посвященным новым анонсам на GTC 2020. В этом году, GTC проводится в online формате и все выступления проходят в виде заранее подготовленных записей и вебинаров.
Выпустив NVIDIA GeForce RTX 3080 и 3090, разработчики создали основу для разработки приложений с учетом современной архитектуры и её возможностей, но все GPU NVIDIA GeForce с большим трудом могут быть применимы для задач, выполняемых с использованием специализированного ПО и специальных программных решений, выполняющих специализированные задачи, например вычисления на суперкомпьютерах или виртуализация рабочих столов для множества пользователей.
5 октября, NVIDIA представила два GPU профессиональной линейки NVIDIA Quadro, а именно NVIDIA Quadro RT A6000 и GPU для центров обработки данных и облачной инфраструктуры - NVIDIA A40.
Рис. 1. Слайд из презентации, слева - NVIDIA Quadro RTX A6000, справа GPU NVIDIA A40.
На представленном вашему вниманию слайде приведены характеристики и изображения двух новых GPU. При кажущейся идентичности, данные модели обладают существенными отличиями, GPU NVIDIA Quadro RTX A6000 предназначен для высокопроизводительных рабочих станций, и представлен в виде модели с активной системой охлаждения в привычном для нас корпусе. Вторая модель, NVIDIA A40, является продолжателем линейки NVIDIA Tesla, и предназначена для применения в центрах обработки данных и облачных сервисов, а система пассивного охлаждения объединяется с активной системой охлаждения сервера и минимизирует вероятность выхода из строя GPU со стороны его системы охлаждения.
Оба GPU используют шину PCI Express 4.0 x16, что обеспечивает вдвое большую пропускную способность в сравнении с PCI Express 3.0 x16. Для хранения данных GPU предоставляет 48 Гб графической памяти стандарта GDDR6 с коррекцией ошибок (ECC). Выбор в сторону менее производительной но прошедшей сертификацию и широко распространенной памяти GDDR6 обусловлен тем, что память GDDR6X является своеобразным апдейтом данного стандарта и будет уместна в игровых решениях, но она не поддерживает ECC, а также не обладает сертификацией JEDEC, корпоративные клиенты всегда требовательны к таким моментам и предпочтут проверенные годами использования и сертифицированные решения, хоть и с меньшей производительностью. Помимо этого, GDDR6X разработана совместными усилиями NVIDIA и Micron, но это ограничивает широту выпускаемых компонентов и риски на получение брака.
В основе обеих моделей, лежит полноценный GPU GA102, аналогичный GPU используется и в NVIDIA GeForce RTX 3080 и 3090, но в них он обладает меньшим количеством ядер CUDA, RT Core и Tensor Core. Графический процессор используемый в Quadro A6000 и A40 содержит 10752 ядер CUDA, 84 ядра RT Core второго поколения и 336 ядра Tensor Core третьего поколения, что несколько больше, чем в игровых моделях.
Здесь хочется сделать небольшое отступление. Многие задаются вопросом о том, почему Quadro менее производительна в синтетических тестах при аналогичном GPU используемом в GeForce. По своей сути, GeForce обладает большей производительностью за счет увеличения частот и оптимизаций в BIOS графического ускорителя. Так как Quadro ориентированы на применение в продолжительный период, и при этом в режиме 24/7, а также учитывают возможность использования в центрах обработки данных, то увеличение частот, приведет к большему потреблению энергии, перегреву и меньшему сроку службы. Но при этом, за счет такого подхода, у Quadro есть достаточный запас для разгона и увеличения производительности.
При переходе на новый техпроцесс и обновлении архитектуры графического процессора разработчикам удалось получить двукратный прирост производительности шейдерных процессоров, увеличения производительности трассировки луча в два раза, и пятикратного прироста в производительности тензорных ядер.
Рис. 2. Архитектура NVIDIA Ampere предоставила прирост производительности в вычислениях и обеспечивает эффективность в потреблении энергии при достижении большого числа кадров.
Достижения баланса в производительности и потреблении энергии особенно востребованы в решениях для рабочих станций и серверов, когда расчет энергии и итоговой производительности очень важен. Ведь не каждой организации хочется переплачивать за потребляемую системами энергию. При возможности протестировать новые GPU я обязательно подробнее изучу данный вопрос.
Компания NVIDIA на текущий момент выделяет шесть областей применения профессиональных GPU линейки Quadro и A40.
Рис. 3. Области и направления применения GPU NVIDIA Quadro RTX A6000 и NVIDIA A40
Отрасль визуализации (rendering) остается ключевой для применения профессиональных GPU линейки NVIDIA Quadro, также для обеспечения высокой производительности и коллективной работы продолжают свое развитие решения для виртуализации рабочих станций (virtual workstations), по своей сути мы можем объединить, виртуальные рабочие станции и инструменты для визуализации в едином вычислительном кластере, что позволяет работать целым коллективам дизайнеров в централизованной среде.
К более практическим областям применения относятся моделирование физических явлений, обработка данных, вычисления общего назначения и применение в AR/VR областях.
NVIDIA A40 GPU
NVIDIA Quadro RTX A6000 GPU
Платформа NVIDIA Omniverse
Ключевым анонсом среди профессиональных решений для дизайнеров и профессиональных пользователей является представление и запуск открытого beta-тестирования платформы NVIDIA Omniverse. Разработка которой была запущена еще пару лет назад, с выходом первого поколения NVIDIA RTX.
Рис. 4. Платформа NVIDIA Omniverse позволяет упростить обмен данными между различными приложениями и специалистами при коллективной работе над проектом.
Платформа NVIDIA Omniverse представлена пятью элементами, отвечающими за определенные области. Элемент CONNECT обеспечивает модули к приложениям и SDK для интеграции возможностей Omniverse в любое приложение (САПР или DCC), элемент NUCLEOS предоставляет ядро сервисов и облачную инфраструктуру, элемент Create предоставляет инструменты для отображения, редактирования и обработки данных.
Рис. 5. ключевые элементы платформы NVIDIA Omniverse.
Элемент SIMULATE обеспечивает специалистов инструментами для моделирования различных физических явлений, анимации, искусственного интеллекта и поведения объектов. И финальным элементом является RTX RENDERER, включающий в себя возможности платформы NVIDIA RTX и обеспечивающий высококачественную визуализацию созданных коллективом пользователей моделей.
Для обмена данными разработчики используют формат USD (Universal Scene Description), разработанный анимационной студией PIXAR и активно внедряемый во множество приложений компьютерной графики и анимации.
Для работы с данными USD, в NVIDIA использовали модифицированную версию фреймворка Hydra, для оптимизации работы с современными GPU и их возможностями.
Для работы с NVIDIA Omniverse вам потребуется одно или несколько приложений, поддерживаемых Omniverse и учетная запись в облачном сервисе. Вы устанавливаете модуль Omniverse на вашу систему и работаете как удаленно, так и локально. Отмечу, что при использовании Omniverse вы можете использовать богатые возможности облачной визуализации с поддержкой RTX, так как для этого компания NVIDIA разработала сервер RTX SERVER, с несколькими GPU NVIDIA Quadro и ориентированный на применение в областях визуальных вычислений.
Сейчас вы можете оставить заявку на открытое beta-тестирование и получить доступ к возможностям платформы NVIDIA Omniverse.
Анонсы в NVIDIA BLOG
To 3D and Beyond: Pixar’s USD Coming to an Industry Near You
New NVIDIA Studio Announcements at GTC Support Creators at Home and in Studio