Во время первого знакомства с видеокартами NVIDIA нового поколения мы сделали акцент на игровой производительности. Но видеокарты нужны не только для игрушек. Результаты в играх не отображают реальное быстродействие в рабочих программах. Например, в видеомонтаже, рендеринге и 3D-анимации. Эта область заслуживает отдельного изучения.
В случае видеокарт RTX 5000-й серии ситуация особенно острая. В этот раз «зелёные» сделали ставку не на сырую мощность (если не говорить про RTX 5090), а на технологии-читы, которые позволяют кратно увеличить кадровую частоту. DLSS 4 и мультигенерация кадров спасают новые карты в игровом сегменте, предлагая действительно впечатляющий прирост производительности. Наконец-то стало можно говорить о массовом 4К-гейминге. К сожалению, все эти «читы» неприменимы к рабочим программам. Но, возможно, в рабочих задачах оптимизации на уровне архитектуры проявят себя?
Архитектурные особенности
Учёный-статистик Дэвид Блэквелл, в честь которого названа архитектура
О ключевых нововведениях архитектуры Blackwell мы уже рассказали в обзоре GeForce RTX 5080. По второму кругу пересказывать тоже самое нет никакого смысла, ознакомьтесь с текстом по этой ссылке. Однако, есть несколько изменений, которые в разрезе рабочих задач стоит раскрыть подробнее.
Нейронный рендеринг
Нейронный рендеринг, или нейронные шейдеры — потенциально важная веха в развитии компьютерной графики. Идея в том, чтобы нейросети, работающие на специальных Tensor-ядрах, могли непосредственно участвовать в процессе рендеринга. При этом тренировка происходит на самом графическом процессоре. В некоторых случаях даже в режиме реального времени.
Особенно хорошо этот подход себя покажет при работе со сложными многослойными материалами и рассеиванием света в полупрозрачной среде. Например, при визуализации человеческой кожи, чтобы лицо не казалось «пластиковым».
Возможная сфера применения нейронного рендеринга очень обширна. Одно из направлений — помощь с традиционным рендерингом. Грубо говоря, Tensor-ядра, которые ранее работали только с ИИ и не принимали участие в рендере, теперь могут помогать. Суть не только в использовании простаивающих вычислительных блоков, но также в оптимизации процесса с помощью ИИ.
Однако есть нюансы. Пока совершенно непонятно, как такой «гибридный» подход к обработке и рендерингу повлияет на точность и качество за пределами видеоигр. Если в игре простительны и, в общем-то, незаметны небольшие ошибки рендера (вроде ореолов, артефактов и прочих ИИ-багов), то в случае рабочих приложений это критично. В любом случае никакого практического применения нейронного рендеринга пока нет, в том числе и в играх. Дополнительные детали про нейронный рендеринг здесь.
FP32 и INT32
В основе графических процессоров NVIDIA лежат CUDA-ядра (их также называют шейдерными ядрами) — основная и базовая вычислительная единица. В видеокартах GeForce RTX 3000 и RTX 4000 CUDA-ядра были разбиты на два блока. Половина могла выполнять только инструкции FP32, вторая половина — FP32 или INT32. По этой причине в спецификациях RTX 4090, особенно раньше, иногда указывали не 16 384 CUDA, а 2х8192 CUDA.
С появлением архитектуры Blackwell фундаментальное строение графического чипа не изменилось, но разделение на FP32/INT32 было упразднено. Теперь абсолютно все CUDA-ядра могут работать с обоими типами инструкций.
Нетрудно догадаться, что в вычислениях, использующих формат INT32, производительность фактически удвоилась. Стоит также отметить, что FP32 — наиболее распространённый формат, фактически стандарт индустрии. Его точности и скорости достаточно для большинства задач: рендеринга графики, обработки изображений и обучения нейросетей. Но помните, что при использовании INT32 видеокарты GeForce RTX 5000 будут намного предпочтительнее.
Новый медиадвижок
Графические процессоры семейства Blackwell получили продвинутые движки кодирования/декодирования видео — NVENC и NVDEC. Фактически это ключевое улучшение для контентмейкеров. Если другие нововведения «раскроются» только в будущем, а может и никогда, то прокаченные NVENC/NVDEC работают сразу «из коробки»… ну почти.
Стандарт 10 бит с цветовой субдискретизацией 4:2:2 давно и широко используется в профессиональных камерах. Он предлагает хороший баланс между качеством изображения, точностью цветопередачи и размером конечного файла. Такие камеры не всегда, но зачастую записывают медиаданные в кодеке All-Intra или LongGOP (H264) с дискретизацией 4:2:2. Проблема в том, что на аппаратном уровне поддержка кодирования/декодирования медиаданных для H264 4:2:2 просто отсутствовала на стороне видеокарт. Любых видеокарт. Да, есть «костыль» в виде технологии Intel Quick Sync. Но она накладывает дополнительные издержки и обязывает пользователя выбирать процессоры Intel, которые на фоне современных AMD смотрятся не так выигрышно. Пользователю приходилось выбирать между ускорением от IQC и общим «бустом» от процессоров AMD.
В данный момент Adobe Premiere Pro не поддерживает на программном уровне аппаратное декодирование H264 4:2:2. Разработчики обещают реализовать поддержку в течение марта-апреля. DaVinci Resolve декодирование поддерживает, но пока только в бета-версии, которая недоступна большинству пользователей. Проще говоря, это очень важное изменение, но разработчикам нужно немного времени, чтобы отладить ПО.
Ещё одно важное изменение — количество кодеров/декодеров. RTX 5090 выделяется тем, что впервые получила сразу три кодера, а ранее их было максимум два. Это напрямую влияет на скорость экспорта. Также в RTX 5090 и RTX 5080 впервые появилось два декодера (раньше был один). Для большинства задач достаточно по одному кодеру и декодеру. Но для тех, кто работает в условиях сжатых сроков, это изменение будет полезно.
Наконец, как заявляет NVIDIA, новый медиадвижок производительнее на 5%, обеспечивает на 5% лучшее качество, и на 5% лучше сжимает данные без ущерба качеству. Здесь не совсем понятно, что конкретно подразумевает NVIDIA. Вполне возможно, что речь просто про ускорение на 5%, а всё остальное — следствие этого изменения (то есть на 5% быстрее без потерь, либо с той же скоростью, но с ростом качества на 5%). Ещё открыт вопрос, каким образом NVIDIA оценивает качество в процентах.
Поддержка FP4
Последняя примечательная функция, интересная создателям контента — поддержка формата FP4. Генеративный ИИ получает всё большую популярность среди контентмейкеров. Обычно генерация изображений в том же Stable Diffusion происходит в формате FP16. FP16 — довольно большой объём данных. Он позволяет генерировать высокодетализированные изображения, обработка которых занимает много времени. В формате FP4 у ИИ меньше данных, из-за чего обработка происходит в несколько раз быстрее, но страдает детализация.
Проводя аналогии FP16 и FP4 — это как несжатый ролик с 10-битным цветом 4:2:2, и пережатый в 8 бит 4:2:0. В некоторых случаях, вроде изображений для социальных Сетей, в приоритете скорость, а не высокая детализация.
Также FP4 позволяет экономить видеопамять. К примеру, модель Black Forest Labs’ FLUX.1 с FP16 требует 23 ГБ видеопамяти. То есть её могут использовать только владельцы RTX 4090, RTX 5090 и профессиональных ускорителей с большим объёмом памяти. Генерация изображений занимает 15 секунд с 30 шагами. С FP4 потребление видеопамяти сокращается до 10 ГБ, что открывает доступ к работе с ИИ владельцам средних моделей с 12 ГБ видеопамяти, а время генерации уменьшается до 5 секунд. Остаётся только дождаться, когда формат FP4 внедрят в приложениях.
Модельный ряд и характеристики
На данный момент официально представлены три видеокарты нового поколения: RTX 5090, RTX 5080 и RTX 5070 Ti. Перед тестированием предлагаем детальнее взглянуть на их технические характеристики. Для общей информации также добавили в таблицу известные характеристики ещё не вышедших младших моделей.
Даже при поверхностном анализе флагманская RTX 5090 смотрится гораздо интереснее, чем аналог 4000-й серии. Количество CUDA-ядер увеличилось на 33% (частоты работы практически идентичны), пропускная способность памяти стала больше на впечатляющие 80%, а объём памяти вырос с 24 до 32 ГБ. Для пропустивших раздел про медиадвижок напомним, что RTX 5090 — первая видеокарта с 3 кодерами и 2 декодерами (раньше максимум было 2 кодера и 1 декодер). Конечно, за это приходится расплачиваться серьёзным ростом энергопотребления. Но на фоне других улучшений аппетиты оправданы.
А вот RTX 5080 выглядит довольно тускло. Сравнительно с картой предыдущего поколения, по характеристикам улучшение практически незаметно. CUDA-ядер больше всего лишь на 5%, частоты работы такие же, при этом аппетиты выросли незначительно — на 13%. Подсистема памяти может похвастать солидной пропускной способностью (+30%). Но 16 ГБ видеопамяти в 2025 году в видеокарте за рекомендованные 1000 долларов — настоящее разочарование. Многие ждали, что эта модель получит 24 ГБ, но NVIDIA смогла удивить. В требовательных к видеопамяти приложениях это станет «бутылочным горлышком». У RTX 5080 по 2 движка для кодирования и декодирования.
RTX 5070 Ti — вторая любопытная карта нового поколения. На 17% больше CUDA, память быстрее на 78%, а также 4 гигабайта дополнительной памяти. Да, потребление выросло до 300 ватт, но на это можно прикрыть глаза. Количество кодеров/декодеров такое же, как у RTX 4090 — 2 и 1 соответственно.
Подводя промежуточный итог, на данном этапе RTX 5090 смотрится совсем уверенно, RTX 5070 Ti — неплохо, RTX 5080 — похуже. Безусловно, увеличение пропускной способности памяти почти вдвое, дополнительные медиадвиждки и архитектурные улучшения свою лепту внесут, но вряд ли разница будет кардинальной.
Тестовый стенд и условия
С технической точки зрения правильно было бы тестировать видеокарты в рабочих задачах вместе со специальным процессором для рабочих задач — AMD Threadripper Pro класса HEDT. Однако, в действительности применение Threadripper оправдано только в случае продвинутых рабочих станций с несколькими графическими ускорителями и огромным количеством оперативной памяти. Большинство наших клиентов выбирает обычные «народные» процессоры. Такие системы способны покрыть 95% типичных задач. Второй момент — условно игровые Ryzen уже переехали на новую архитектуру Zen 5, а Threadripper — ещё нет.
Учитывая эти факторы, на этот раз тестирование проводилось с процессором Ryzen 9 9950X. 16 высокочастотных ядер гарантированно «раскроют» одну видеокарту. Владельцам процессоров предыдущих поколений, а также актуальных Threadripper, достаточно вычесть из результатов 1–2%
Второй момент — оперативная память. DDR5-6400 — далеко не предел возможностей современной ОЗУ, вплотную подбирающейся к 10 гигагерцам. Но на данный момент именно 6400 МГц являются чем-то вроде золотого стандарта. К тому же чипы AMD плохо «дружат» с более скоростной памятью. Если у вас память, скажем, DDR5-8000, в процессорозависимых приложениях можно рассчитывать на небольшую прибавку (речь примерно про 1%).
Тестовой стенд:
Процессор — Ryzen 9 9950X;
Процессорный кулер — СЖО с 360-мм радиатором;
Материнская плата — ASUS ProArt X670E Creator;
Оперативная память — DDR5-6000, 2х 32 ГБ (64 ГБ суммарно);
Видеокарта — разные GeForce RTX 5000;
Накопитель — Samsung 980 Pro 2 ТБ.
Рабочая станция DigitalRazor Performance Pro
Windows 11 обновили до последней версии (build 26100). В настройках профиля питания выбрали «сбалансированную» схему. Также включили функции Resizable BAR и Above 4G Decoding. Хотя они не влияют на быстродействие в рабочих задачах, нередко рабочие станции используют ещё и в качестве игровых ПК, где эти функции полезны. Естественно, перед началом работы никто их не отключает. Поэтому для приближения к реальным условиям эксплуатации решили оставить.
Мы знаем о проблеме недостающих ROP-блоков у некоторой части видеокарт GeForce RTX 5000. У наших образцов, как и у всех компьютеров DigitalRazor с новыми видеокартами, полноценные графические процессоры с полным набором ROP.
Что касается приложений, здесь есть нюансы, и много. На момент написания обзора не все программы поддерживают новые видеокарты. Как упоминалось в разделе про медиадвижок, DaVinci Resolve поддерживает новые возможности декодирования, но только в предварительной сборке, которую предоставили лишь приближённым к NVIDIA обозревателям. Также DaVinci Resolve 19.1 иногда зависает на процессе Neural Engine Optimization. Adobe Premiere Pro 25.1 работает нормально, но декодирование 10 бит 4:2:2 пока не поддерживается. В V-Ray CUDA-производительность ниже ожидаемого, при этом в V-Ray RTX всё в порядке. OctaneBench, RedShift и Cinebench в принципе не работают. Topaz Video работает через раз. Поэтому пришлось ограничиться теми приложениями, где у GeForce RTX 5000 нет явных проблем: Premiere Pro, After Effects и DaVinci Resolve, а также Unreal Engine, V-Ray RTX и Blender.
Adobe Premiere Pro
Большая часть функций Adobe Premiere Pro не поддерживает GPU-ускорение, поэтому близость результатов вполне ожидаема. В зависимости от кодека, RTX 5090 опережает RTX 4090 на 9–13%. RTX 5080 лучше RTX 4080 Super всего на 5–7%. В случае новой «тишки» речь идёт примерно о тех же цифрах. Сравнительно с картами 3000-й серии разница заметнее — до 40%.
Вышесказанное справедливо для кодеков LongGOP и RAW. С Intraframe разницы вообще нет, поскольку он практически полностью завязан на процессор.
Отличия более заметны при использовании GPU Effects. Как намекает название, эти функции как раз работают на видеокарте. Здесь RTX 5090 обходит предшественницу на 15%, RTX 5080 — на 7%, RTX 5070 Ti — на 10%. Неплохо, но солидное улучшение производительности прочувствуют только владельцы карт RTX 3000-й серии. К примеру, 3080 Ti отстаёт от RTX 5080 на 40%. В любом случае пакет Premiere Pro — не то приложение, где стоит делать упор на видеокарту.
Adobe After Effects
Исторически сложилось, что After Effects не использует мощности видеокарты. Однако в последние годы разработчики движутся в сторону GPU-ускорения. Постепенно в программе появляется больше функций, работающих на видеокарте.
При 2D-анимации разница между видеокартами на грани погрешности. Просто потому, что любая современная видеокарта NVIDIA с лёгкостью справляется с этой задачей. К слову, здесь начинает проявляться преимущество CUDA-архитектуры. Обратите внимание, что Radeon RX 7900 XTX значительно уступает даже морально устаревшей RTX 2080 Ti.
С переходом в 3D ситуация меняется кардинально, и наконец-то новые видеокарты показывают заметное преимущество. RTX 5090 опережает предшественницу на впечатляющие 35%. RTX 5080 быстрее RTX 4080 Super на 24%, и на 44% быстрее RTX 3080 Ti. Достойно смотрится и самый младший представитель новой линейки, наступая на пятки RTX 4090.
DaVinci Resolve Studio
В DaVinci Resolve ситуация 50/50. В отличие от предыдущих приложений, DaVinci намного активнее использует видеокарту. При работе с кодеками LongGOP явно проявляются преимущества дополнительных медиадвижков, хотя DaVinci ещё не может использовать их в полной мере. Но, даже несмотря на это, RTX 5000 сильно опережают предшественниц.
При использовании кодека RAW отличия на грани погрешности измерений. Вообще в DaVinci при работе с RAW ускорение на GPU частично задействуется, но результаты говорят об обратном. По-видимому, разработчики ещё не внедрили оптимизации для новых карт.
Как и в Premiere Pro, при работе с GPU-эффектами преимущество новых карт значительно. Любопытный момент: если между представителями 3000- и 4000-й серий разницы почти нет, то RTX 5000 обеспечивают качественный прирост.
Удивление вызывает скорость работы с ИИ. NVIDIA заявляла ускорение ИИ-операций в несколько раз, но этого нет. Да, новый флагман быстрее, но исключительно за счёт грубой вычислительной мощности, а не оптимизаций на уровне архитектуры. Особенно удивили RTX 5080 и RTX 5070 Ti, уступившие предшественницам 5–7% — не тот прогресс, который мы заслужили. Это также можно объяснить отсутствием программной поддержки на данный момент.
Unreal Engine
Тест в Unreal Engine объединяет ряд сцен с разными разрешениями и разными функциями, вроде трассировки лучей. Оценка основана не на абстрактных баллах, а на привычных кадрах в секунду. По сути, оценка в Unreal Engine — это показатель производительности в играх на базе этого движка.
При использовании растровой графики RTX 5090 быстрее RTX 4090 на 19%, с трассировкой — на 16%. Улучшение неплохое, но оно не оправдывает значительное увеличение цены. Апгрейд на RTX 5090 будет интересен только владельцам RTX 3090 Ti и более старых карт. Относительно них новый флагман производительнее на 81%.
Для владельцев RTX 4080 Super апгрейд на RTX 5080 — бесполезная затея. Прибавка около 8% совершенно не мотивирует. Зато она на 51% опережает RTX 3080 Ti. Наконец, RTX 5070 Ti производительнее RTX 4070 Ti на 22%.
V-Ray RTX и Blender
Для рендеринга на GPU мы смогли провести только 2 теста из 5, поскольку Redshift (Cinebench) и Octanebench попросту не запускаются на новых видеокартах. V-Ray (без RTX) запускается, но производительность на уровне RTX 3060 Ti как бы намекает, что есть какие-то проблемы совместимости.
Рендеринг на GPU — первая область, где новинки выглядят выигрышно. RTX 5090 быстрее почти на 50%, RTX 5080 — на 22%, а новая «тишка» опережает старую на 30%. Даже с учётом завышенных цен карты нового поколения выглядят заманчивым предложение. Правда, в Blender лишь RTX 5090 смотрится уверенно, а остальные новые карты быстрее всего на пару процентов.
Итоги
Если судить по фактическим результатам, то рекомендовать к приобретению можно только RTX 5090. Да и то исключительно потому, что она нарастила много вычислительной мощности. +33% CUDA-ядер и +80% пропускной способности памяти чисто математически не могли подкачать. Автомобиль с двигателем на 300 «лошадей» однозначно поедет веселее, чем на 200. Ну а RTX 5080 и RTX 5070 Ti не могут похвастать большой прибавкой вычислительной мощности. Отсюда закономерный итог.
Парадоксально, но перед нами случай, когда фактические результаты — не значит честные и справедливые. NVIDIA реализовала хорошие улучшения на уровне архитектуры для контентмейкеров, а разработчики программ ещё не успели внедрить их поддержку со своей стороны. Redshift и Octanebench вообще не запускаются. V-Ray RTX работает, но в V-Ray CUDA-производительность аномально низкая. В DaVinci Resolve случаются «вылеты». Поддержка аппаратного декодирования 10 бит 4:2:2, что вообще можно считать главной особенностью 5000-й серии и знаковым моментом в истории видеокарт, пока не реализована ни в одной программе. В DaVinci Resolve с использованием ИИ результаты двух младших карт оказались хуже, чем у прямых предшественниц. Всё это сильно смазывает впечатление. Просто нужно немного времени — типичная ситуация во время релиза такого калибра.
Глобальная рекомендация остаётся такой же, как и для игрового применения видеокарт NVIDIA. RTX 5090 — настоящий «монстр» с невиданными возможностями, который вызывает зависть у владельцев всех видеокарт попроще. Единственные пользователи, которым нет смысла обновляться — владельцы RTX 4090. Безусловно, прирост серьёзный, но RTX 4090 язык не повернётся назвать устаревшей.
Апгрейд с 4000-й серии разумен только со смещением на полторы-две ступени вверх по иерархии. Владельцам RTX 4060 Ti и «обычной» RTX 4070 стоит призадуматься о покупке RTX 5080. Но RTX 5080 и RTX 5070 Ti слабо мотивируют обновлять ПК тех, кто использует RTX 4070 Ti, не говоря уже про старшие модели. Повторимся, апгрейд на RTX 5090 рекомендуем всем, у кого есть финансовая возможность.
Совсем другое положение у тех, кто использует карты позапрошлого поколения. К примеру, разница между «восьмидесятками» от 57 до 191%. И это ещё без учёта причуд неоптимизированных программ. Здесь даже можно говорить об апгрейде со смещением вниз по иерархии: переход с RTX 3080 Ti на RTX 5070 Ti обеспечит значительное ускорение.
Цены новых видеокарт NVIDIA шокирующие не только на российском рынке, но и в других регионах. Но здесь у нас есть козырь. Также в магазине DigitalRazor можно приобрестирабочую станцию или GPU-сервер для масштабных проектов и крупных студий.
Рабочая станция DigitalRazor Performance Pro в Rack-формате