AMD Threadripper второго поколения, оценка работы над ошибками

В 2017 году компания AMD вывела на рынок линейку новейших процессоров для настольных компьютеров и рабочих станций на базе новейшей архитектуры AMD Zen. Линейка процессоров получила имя Ryzen, а топовые модели получили имя Ryzen Threadripper. Разработчик провел титаническую работу над новой архитектурой, которая практически не уступает архитектурам и решениям прямого конкурента в лице Intel. Совместно с компанией DIGITALRAZOR было проведено тестирование и сравнение первого поколения процессоров Ryzen, по результатам которого был подготовлен отчет.

В начале нашего сравнения, давайте вспомним, какие изменения претерпели процессоры на основе архитектуры Zen и какие возможности в них были реализованы создателями.

Микроархитектура AMD Zen

Микроархитектура AMD Zen была представлена в 2016 году, а представители компании в наглядной презентации продемонстрировали ее ключевые изменения.

img_001.png

Микроархитектура AMD Zen. Слайд из презентации с конференции HOT CHIPS 28.

Новая архитектура стала на 40 % эффективнее по сравнению со своими предшественниками, уходящими корнями в архитектуры Bulldozer и Excavator. За счет радикальной оптимизации и переработки ключевых элементов архитектуры, Zen стала гораздо более энергоэффективна и при этом, обеспечивает возможности, недоступные ранее в решениях компании AMD.

Высокоуровневая архитектура определила несколько ключевых векторов, которым следовали разработчики. Первое на что было обращено внимание - улучшения в движке вычислительного ядра, улучшенная поддержка операций с плавающей точкой, улучшения в системах кэширования, дизайн SMT для повышения пропускной способности и новые расширения ISA.

Как было сказано выше, новая микроархитектура обеспечивает выполнение на 40% больше инструкций за такт по сравнению с процессорами на основе архитектуры Excavator.При этом, в 40% прирост производительности и стабильную энергоэффективность, разработчики уместили три ключевых группы возможностей процессоров.

  • Улучшения ядра процессора
    • Два потока на ядро (у Intel - технология Hyper Threading)
    • Улучшение прогнозирования непредсказуемого ветвления
    • Улучшенное прогнозирование ветвления с двумя ветвями на входе BTB
    • Большой кэш операций
    • Широкая организация микро-операций 6 против 4
    • Большие планировщики инструкций. Целочисленные: 84 против 48 | с плавающей точкой: 96 против 60
    • Большой сброс 8 операций против 4-х
    • Четырехкратный вывод FPU
    • Более крупная очередь на сброс 192 против 128
    • Очередь большей загрузки 72 против 44
    • Большая очередь хранения 44 против 32
  • Улучшенная система кэширования
    • Отложенная запись кэша L1
    • Повышена скорость кэша L2
    • Повыше скорость кэша L3
    • Быстрая загрузка в FPU: 7 циклов против 9
    • Улучшенная предвыборка данных в кэше L1 и L2
    • Пропускная способность шин кэша L1 и L2 увеличена в 2 раза
    • Пропускная способность шины кэша L3 увеличена в 5 раз
  • Снижение энергопотребления
    • Агрессивное определение частоты с многоуровневыми регионами
    • Отложенная запись кэша L1
    • Большой кэш операций
    • Stack Engine
    • Исключение переходов
    • Фокус Мощности с начала проекта
    • Методологии Дизайна Низкого Энергопотребления

Микроархитектура поддерживает инструкции Fetch Four x86, инструкции Op Cache, четыре целочисленных блока, два блока загрузки/хранения, 2 блока с плавающей точкой на 128 FMACs, I-Cache 64K, D-Cache 32K, объем кэша второго уровня равен 512 Кб, большой расшаренный кэш L3 и 2 потока на ядро.

С точки зрения разработки и оптимизации программного обеспечения, процессоры на базе архитектуры AMD Zen предоставляют богатые возможности для создания программного обеспечения выполняющего обработку больших массивов данных и требующих высокой производительности.

Такие характеристики процессора востребованы в таких областях как работа с базами данных, математические вычисления, физические и химические исследования с большими массивами данных, медицина и поиск новых лекарственных препаратов, САПР и в области развлечений и графики.

Производительность процессоров Ryzen первого поколения
Первое поколение Ryzen Threadripper, а мы говорим именно о них, продемонстрировало великолепную производительность в большинстве синтетических тестов. Однако в ряде проведенных нами тестов, Threadripper первого поколения продемонстрировал крайне низкую производительность, особенно в вычислениях связанных с моделирование физических эффектов и жидкостей. Даже не помогло ускорение со стороны GPU.

Но в области компьютерной визуализации и при тестировании на реальных примерах, Threadripper показал не то что идентичный по сравнению с соперником результат, но и превзошел его.

Мы тестировали с помощью пакетов компьютерной графики Maya и Blender, а синтетические тесты выполнялись с помощью V-Ray Bench и Cinebench R15.

Давайте взглянем на результаты тестирования процессоров Ryzen 7 и Ryzen Threadripper первого поколения, а также Core i9-7900X, представленные в нашем предыдущем обзоре. В тестах принимали участие следующие процессоры:

table_001.png

В тестировании были использованы три процессора, два процессора AMD и один процессор Intel. В качестве графической подсистемы, были использованы GPU линейки NVIDIA Quadro P6000.

Система визуализации V-Ray от компании Chaos Group является одной из наиболее распространенных и известных на рынке инструментов визуализации. С ее помощью художники и дизайнеры выполняют визуализацию трехмерных сцен и анимации.

img_002.png

Тестирование с помощью V-Ray Benchmark в режиме CPU выявило достаточно интересную особенность в производительности процессоров. Конечно необходимо понимать, что многое программное обеспечение может значительно оптимизироваться под определенные архитектуры CPU, что может способствовать увеличению скорости выполнения алгоритмов визуализации.

На приведенном выше графике представлен результат тестирования процессоров AMD Ryzen и AMD Ryzen Threadripper. Соперником процессорам AMD стал десятиядерный Intel Core i9-7900X.

Что вполне ожидаемо, десятиядерный процессор с практически идентичной восьмиядерному процессору Ryzen 7 1800X частотой показал значительное превосходство в скорости визуализации сцены. Но порадовал результат теста полученный на AMD Ryzen Thredripper 1950X. Все возможности 16 ядер и 32 потоков показали хоть и небольшое, всего 11 секунд, превосходство над процессором Intel, но все же это хороший показатель.

Данный результат можно объяснить тем, что мы проводили тестирование на референсной материнской плате, с другой стороны, скорость визуализации, может зависеть и от методов оптимизации самого программного обеспечения.

Тестирование с помощью Cinebench стало стандартной практикой в задачах, которые решают современные разработчики компьютерного оборудования. Тестирование процессоров с помощью Cinebench является неотъемлемым показателем при демонстрации производительности новых решений.
Мы сравнили производительность процессоров AMD и Intel в тесте визуализации как в режиме многопоточности, так и в однопоточном режиме когда визуализация выполняется одним ядром процессора.

img_003.png

В результате тестирования, тест в многопоточном режиме визуализации превосходно продемонстрировал возможности процессора Threadripper 1950X, когда с применением 32 потоков его производительность была выше, по сравнению с конкурентом от Intel в лице Core i9-7900X. И в 1,5 раза выше по сравнению с процессором Ryzen 7 1800X.

Тестирование в однопоточном режиме, когда визуализацию сцены осуществляет всего одного ядро процессора, показало достаточно приближенный к единому показателю результат среди всех протестированных нами процессоров.

img_004.png

Результат данного теста зависит от оптимизации программного обеспечения и частоты процессора, на которой работают вычислительные ядра. Как видно из результата, в однопоточных задачах, процессоры AMD незначительно уступают решению от Intel.

Пакет компьютерной графики Blender с его динамично развивающимся ядром визуализации Blender Cycles завоевал популярность среди художников использующих свободное ПО. Возможности ядра Cycles дают художнику использовать наиболее распространенные методики визуализации изображений и анимации.

Я использовал несколько сцен, доступных для загрузки с официальной страницы Blender и которые используют те или иные возможности ядра Cycles.

Первый тест - визуализация сцены из проекта Gooseberry. В данной сцене используется несколько достаточно сложных для визуализации эффектов, это волосы и мех, а также подповерхностное рассеивание.

img_005.png

Благодаря данному тесту мы видим, что процессор AMD Ryzen 7 1800X уступает в производительности как процессору Intel, так и своему старшему брату в лице AMD Ryzen Threadripper 1950X. Но здесь есть важный момент, он заключается в том, что процессоры Threadripper 1950X и Core i9-7900X показали практически идентичный результат. Процессор Threadripper обошел процессор от Intel, буквально на пару минут. Я осмелюсь предположить, что данное расхождение и незначительный прирост производительности обусловлены особенностями оптимизации алгоритмов самого ядра Cycles.

Второй тест - тест сцены с интерьером учебного класса. Данная модель содержит множество текстурных карт и достаточно хорошо освещена, используя глобальное освещение и моделирование объемного света.

img_006.png

Как видно из диаграммы, в данном тесте был получен соответствующий нашим ожиданиям результат, в котором процессор Threadripper 1950X продемонстрировал лучший результат по сравнению с процессором Core i9-7900X. Но в целом, как и полагается подобным сравнениям, две модели одной архитектуры продемонстрировали расхождение почти в 2 раза.

Как и в первом примере, не такое разительное расхождение между ожидаемым и полученным после теста результата, может быть объяснено отсутствием оптимизации в программном обеспечении.

img_007.png

Третий тест - визуализация экстерьера. В данном тесте был получен идентичный предыдущим двум тестам результат. Из-за упоминаемых особенностей реализации программного обеспечения и за счет возможностей архитектуры, удается достичь определенного улучшения показателя производительности процессора Threadripper. Но обратите внимание на то, что скорость визуализации сцен интерьеров, выше, чем скорость визуализации сцен с экстерьерами.

Производительность процессоров Ryzen второго поколения
И вот, спустя ровно год с момента нашего предыдущего тестирования, у нас появился новейший процессор на базе архитектуры Zen+, которая обладает рядом оптимизаций и предоставляет возможности, недоступные ранее в настольных системах.

Перед тем как мы познакомимся с результатами тестов, а в этот раз мы больше внимания уделяли результатам тестирования в синтетических и тестах с охватом различных наиболее часто выполняемых задач, мы рассмотрим ключевые изменения в архитектуре Zen+, на основе которой созданы процессоры Ruzen второго поколения.

Некоторые из изменений мы собрали в единую таблицу.

table_002.png

Помимо уменьшения техпроцесса и реализации поддержки увеличенной частоты памяти, новая архитектура предоставляет пользователю возможность использовать до 64 параллельных потоков и повышенный объем кэш-памяти, что значительно выделяет процессор от AMD по сравнению с большинством моделей решений от прямого конкурента. При этом, выбрать подходящий процессор среди продуктовой линейки AMD гораздо проще, так как их не так много и они хорошо представлены на рынке.

Познакомившись с основными характеристиками новых процессоров, мы переходим к непосредственному тестированию новейшего 16-ти ядерного процессора AMD Ryzen Threadripper 2950X.

Описание процесса тестирования

Нами была подготовлена специальная модель рабочей станции компании DIGITALRAZOR с поддержкой процессоров AMD Ryzen Threadripper. Тестирование проводилось на базовых частотах допустимых процессору по умолчанию и не способных исказить результаты большинства тестов. С помощью утилиты AMD Ryzen Master, выбирались режимы работы из заранее подготовленных шаблонов.

Режим Creator оптимизирован для работы с многопоточными и требовательными к вычислениям задачам. Режим Gamer наоборот, оптимизирован для работы приложений задействующих небольшое количество ядер/потоков.

Мы отключали режим Simultaneous multithreading в случае тестирования производительности ядер визуализации и многопоточных приложений. Это показательный тест, благодаря которому мы выявили влияние технологии обработки двух потоков на каждом ядре, что должно повышать производительность в многопоточных вычислениях.

Помимо работы с многопоточными задачами и определения производительности процессора, мы сравнили влияние режима Memory Access Mode.

Мы проводили тестирование за счет поочередной смены режимов работы процессора и конфигураций профилей в утилите AMD Ryzen Master.

Так как тесты на основе реальных проектов зависят от множества факторов, мы постарались исключить вариативность, и выбрали в качестве программного обеспечения несколько известных и широкораспространенных набров тестов, а в качестве приложений были использованы популярные OpenSource решения.

Синтетические тесты:

  • CINEBENCH R15 (15.038)
  • Geekbench 4.1.0 (x64)
  • VrayBench 1.0.6
  • SPECwpc 2.1

Приложения:

  • Blender 2.78c
  • 7-Zip 16.04 x64
  • POV-Ray 3.7 x64

Визуализация в компьютерной графике

Одной из самых наиболее требовательных к многопоточным вычислениям областей является визуализация в компьютерной графике и обработке видео. Подавляющее большинство алгоритмов, используемых в визуализации достаточно хорошо распараллеливаются и поддержка большого количества потоков со стороны программного обеспечения, в значительной мере позволяет увеличить скорость вычислений.

Визуализация с помощью Blender Cycles

Пакет компьютерной графики Blender является одним из лидеров среди решений с открытым исходным кодом. Он позволяет создавать высококачественную компьютерную графику и анимацию, а также обладает мощным функционалом для высококачественной и фотореалистичной визуализации.
Мы провели сравнение производительности процессоров AMD Ryzen Threadripper с помощью ядра визуализации Blender Cycles, доступного в Blender 2.78c.
Как и в оригинальном тестировании, новый процессор Ryzen Threadripper 2950X мы протестировали на тех же сценах и сравнили с результатами предыдущего тестирования.

Первый тест который мы провели - визуализация комплексной сцены из анимационного проекта Gooseberry. Создатели проекта создали специальный тест, который вычисляет модель меха и волос, а также выполняет визуализацию мягкого освещения и рассеивание света в материалах

img_008.png

Новейший процессор AMD продемонстрировал не уступающий своему предшественнику и прямому конкуренту в виде Intel Core i9-7900X. Конечно, несколько больше оказалось затрачено времени на визуализацию в режиме Gamer, но в целом, процессор продемонстрировал высокую производительность в поставленной задаче.

img_009.png

Сцена Classroom демонстрирует работу с текстурами и эффектами постобработки полученного в процессе визуализации изображения. Здесь, процессор на основе архитектуры Ryzen+ показал лучший результат среди всех протестированных нами процессоров. Заметьте, что процессор обошел конкурента от Intel что и продемонстрировало потенциал новой архитектуры.

Следующий тест уже является классическим, так как включен во многие сравнения и тестирование как процессоров, так и GPU. Этим тестом является сцена с автомобилем BMW, созданная еще в одной из ранних версий Blender и оптимизированная для Blender Cycles.

img_010.png

Тест визуализации сцены BMW27 показывает явное улучшение и увеличение производительности новейшего процессора от AMD. Здесь я хочу сделать небольшую заметку, что в сцене используются основные модели затенения и освещения, без лишней работы с текстурами и обработки более сложных алгоритмов смешивания текстур, материалов и освещения. Но выигрыш в 30 секунд, по сравнению с Intel Core i9-7900X впечатляет. Эти 30 секунд могут оказать значительный вклад в прирост производительности при визуализации анимации.

img_011.png

Последний тест был посвящен визуализации комплексной сцены экстерьера. Также доступной для всех пользователей Blender. Здесь, используется как расчет GI, так и визуализация сцены на основе классического метода на основе разделения изображения на равномерные области - Bucket rendering.
Как видите, в данном примере новый процессор также показал хороший прирост в производительности, как по отношению к своему предшественнику, так и к своему конкуренту в лице Core i9-7900X, при этом, сцена была визуализирована на минуту быстрее.

В начале раздела я писал о том, что мы провели небольшое отдельное сравнение процессора и его возможностей в различных режимах работы и оптимизации, выполняемой с помощью утилиты AMD Ryzen Master. Здесь стоит сделать небольшое сравнение с процессором предыдущего поколения, в лице 8-ми ядерного AMD Ryzen 7 1800X. Это обусловлено тем, что процессор AMD Ryzen Threadripper 2950X, при выборе режима Gamer в утилите AMD Ryzen Master, отключает 8 ядер процессора, ограничиваясь только максимум 16 потоками. Это позволяет увеличить производительность в однопоточных приложениях и сбалансировать энергию для повышения частоты процессора.

img_012.png

По своей сути, переключение процессора в режим Gamer уменьшает простой лишних ресурсов в нетребовательных задачах. Таким образом, мы получаем простое решение с огромным потенциалом для настройки. На приведенном выше графике вы видите сравнение производительности процессора в работе в различных режимах. Если сравнивать с процессором предыдущего поколения, новый Threadripper практически не уступает по производительности в режиме Gamer. С другой стороны, когда мы активизируем все возможности CPU, мы получаем прирост производительности на 60%, и сокращение времени визуализации сцены. Если же активировать режим Memory Access Mode, то этот режим снижает скорость вычислений и визуализации, увеличивая время на 3,5 минуты.

img_013.png

Следующий тест - сцена с классом, здесь же мы видим иной результат. Различия заключаются в том, что процессор в сцене из проекта Gooseberry в первую очередь рассчитывает мех и волосы, а затем уже визуализирует финальное изображение.

В отличие от предыдущего теста, сцена с интерьером визуализировалась подольше в режиме Gamer. Время визуализации составило на одну минуту дольше, по сравнению с Ryzen 7 1800X.

А вот в режиме Memory Access Mode, мы видим небольшое повышение скорости визуализации сцены, что также может послужить основой для дальнейшей оптимизации сцены, в которой используется большое количество текстур и рассчитывается объемный свет.

Остальные тесты, проведенные нами в виде визуализации сцены с автомобилями и экстерьера, продемонстрировали аналогичный результат. Однако, в режиме Gamer новый процессор все же уступает своему предшественнику в виде Ryzen 7 1800X, и что самое интересное уступил именно на наиболее простой модели и тесте.

img_014.png

Результат визуализации сцены BMW27.

img_015.png

Результат визуализации сцены Barcelone.

Если говорить глобально, и обобщить итог первого теста, можно сказать, что в любой задаче, связанной со скоростью визуализации повышение количества вычислительных потоков, может существенно помочь решить вопрос в увеличении скорости визуализации сцен. Но стоит помнить о том, что любое повышение скорости будет замедленно тем, что в желании повысить качество изображения, время визуализации будет по прежнему возрастать.

Визуализация в многопоточном и однопоточном режимах CINEBENCH R15

Мы уже писали о том, что процесс визуализации может быть оптимизирован и распределен между несколькими отдельными потоками, но если говорить о классическом подходе к визуализации растрового изображения на основе векторных данных, на основе которых создается модель трехмерной сцены, программе ядра визуализации необходимо обработать каждый элемент сцены и выполнить его визуализацию в отдельном блоке изображения (backet). Чем больше блоков за раз мы можем обработать, тем больше возможностей для увеличения скорости визуализации мы получаем.

Набор тестов CINEBENCH предлагает возможность сравнить производительность процессора в визуализации с помощью ядра Cinema 4D Physical Render. Тест производится как в режиме многопоточной визуализации, так и в режиме визуализации на одном потоке/ядре.

img_016.png

На иллюстрации выше приведен пример визуализации сцены в тесте CINEBENCH R15 в режиме многопоточной визуализации. Все изображение было разделено на блоки которые соответствовали ядру/потоку процессора (в ОС Windows - логические процессоры).

Обратите внимание на результат тестирования в зависимости от выбранного режима работы CPU. Так как новый Threadripper 2950X мы тестировали в двух режимах, Creator и Gamer, мы наглядно можем увидеть, как влияет на производительность в визуализации применение только части потоков или всех потоков центрального процессора. Новый процессор опередил не только своего конкурента в лице Core i9-7900X, но также и своего предшественника, что делает этот процессор отличным решением для специалистов работающих с Cinema 4D и выполняющих визуализацию средствами встроенного ядра визуализации.

Отдельного внимания заслуживает тест в однопоточном режиме. Здесь у нас накопилась обширная база моделей процессоров, как вышедших 5 лет назад, так и современных моделей.

img_017.png

В однопоточном режиме визуализации, когда все вычисления на себя берет один логический процессор (одно ядро), возрастает цена частоты процессора. Чем выше частота на одно ядро, тем более производительным будет считаться процессор.

Процессор выпущенный 5 лет назад в виде Xeon E3-1240v2, всего на 35 баллов уступает лидеру в лице Core i9-7900X. При этом, протестированный нами процессор Threadripper 2950X, показал достойный результат в выполнении однопоточной задачи. Отключение нескольких ядер и оптимизация работы с памятью, дали небольшой прирост в производительности по сравнению с базовым уровнем, полученным в результате тестирования в режиме Creator.

Если планируется использовать алгоритмы не использующие многопоточность процессоров, или программы со смешанными алгоритмами, где используются и многопоточные алгоритмы и однопоточные, то использование режима Gamer в данном случае становится гораздо более актуальным, так как может помочь увеличить производительность.

Визуализация в многопоточном и однопоточном режимах POV-Ray

Ядро POV-Ray является одним из интересных тестов, выполняющих аналогичные задачи, что и тест CINEBENCH. Но в отличие от коммерческой системы визуализации, данный движок визуализации позволяет протестировать процессор не опираясь на особенности конкретного программного обеспечения. По сути, POV-Ray - ядро и язык описания данных сцены (спецификации), что позволяет их читать программе и выполнять визуализацию сцены.

img_018.png

Результат теста с помощью POV-Ray показал достаточно предсказуемый результат, но новый процессор от AMD показал реально интересный результат в работе с алгоритмами трассировки луча. Он опередил не только процессор Core i9-7900X, но также опередил своего предшественника, в лице Threadripper 1950X.

Что же касается режима Gamer, тут мы видим аналогичный всем предыдущим тестам результат. Если у процессора Threadripper 2950X мы уменьшим количество вычислительных потоков, мы получим двукратное увеличение времени визуализации. А результат будет сопоставим с аналогичным, полученным в тесте процессора Ryzen 7 1800X.

Вообще, обновление архитектуры Ryzen заметно показывает прирост производительности во многих ядрах визуализации, где востребована поддержка многопоточности и работы с большими массивами данных, формируемыми в процессе визуализации трехмерных моделей.

img_019.png

Ядро POV-Ray использует основные алгоритмы трассировки лучей и path tracing, что позволяет быстро модифицировать его и внедрять определенные модели затенения и освещения. В результате нашего тестирования мы получили превосходный результат, показавший хороший прирост производительности по сравнению с предыдущим поколением. Отмечу то, что мы тестировали процессоры теми же инструментами, что и год назад, а результат нас приятно воодушевил.

Визуализация с помощью V-Ray

Следующим тестом, стало тестирование на основе ядра визуализации V-Ray. Для тестирования мы использовали V-Ray Benchmark версии 1.0.6, за последний год было выпущено несколько обновлений, но мы оставили тестирование на основе более ранней версии, чтобы сравнить изменения в производительности.
На данный момент, ядро визуализации V-Ray значительно оптимизировано для работы с процессорами Intel. В нем реализована поддержка библиотеки Embree, которая активна по умолчанию.

img_020.png

Если присмотреться к графику, мы увидим, что по своей производительности при базовой конфигурации и без выполнения настроек с помощью дополнительных утилит, процессор Threadripper 2950X продемонстрировал идентичный своему предшественнику результат. Однако, при активизации режима Memory Access Mode, новый процессор показал хоть и незначительный, но прирост в скорости визуализации сцены. Если же использовать режим Gamer, мы увидим увеличение времени визуализации, но новый процессор от AMD, даже при таком ограничении, показывает более улучшенный результат, по сравнению с предшественником в лице Ryzen 7 1800X.

Компрессия и декомпрессия с помощью 7-Zip

Компрессия и декомпрессия файлов, являются одними из самых востребованных направлений в современных технологиях. Данные алгоритмы превосходно распараллеливаются и используя современные архиваторы, можно проанализировать, какова производительность у выбранного процессора.

img_021.png

Как и в случае с визуализацией, мы провели сравнительное тестирование на компрессию и декомпрессию с помощью архиватора 7-Zip. Мы вооружились стандартным тестом, который может быть выполнен с помощью интерфейса программы и проведя по 10 циклов, записали итоговый результат. Приведенный выше результат тестирования в общем, и наглядно продемонстрировал повышение производительности нового процессора в работе с алгоритмом LZMA.

img_022.png

Тестирование на компрессию с помощью алгоритма LZMA.

img_023.png

Тестирование на декомпрессию с помощью алгоритма LZMA.

Если сравнивать алгоритм компрессии и декомпрессии индивидуально, в каждом из них, новейший процессор AMD значительно превосходит как своих предшественников, так и конкурента в лице Core i9-7900X.

Полученный результат также воодушевляет, так как алгоритмы компрессии могут продемонстрировать тенденции в повышении производительности новых процессоров и алгоритмов.

Результаты нашего тестирования показали, что новейшая модель процессора на основе архитектуры Ryzen+ демонстрирует повышение производительности в алгоритмах компрессии и декомпрессии и превосходит своего конкурента практически в два раза в задачах декомпрессии файлов, и на 10% производительнее в задачах компрессии. При этом, новая модель процессора превосходит по производительности своего конкурента, что делает новый Threadripper 2950X гораздо привлекательней при работе с компрессией и большими объемами данных.

Все приведенные выше тесты, мы проводили на реальных приложениях, в следующих разделах, мы рассмотрим примеры тестов, проведенных с помощью наборов тестов, которые охватывают множества направлений, как в задачах из повседневной жизни, так и в задачах, связанных с вычислениями и обработкой больших массивов данных.

Результаты тестирования с помощью Geekbench 4
Набор синтетических тестов Geekbench 4 является одним из наиболее распространенных среди пользователей и авторов сравнительных тестов, как CPU, так и GPU. Мы используем тест Geekbench для оценки роста производительности новых моделей процессоров и сравнения их с продуктами других производителей.
В текущем обзоре, мы собрали больше подробной информации о производительности процессоров и объединили их в единых графиках. Мы не стали ограничиваться общими результатами в однопоточных и многопоточных тестах, а сделали больший охват областей.

img_024.png

Первая обширная группа тестов - тесты на производительность в однопоточном режиме. Мы подробнее рассмотрим каждую и четырех подгрупп. Тесты связанные с работой процессора и памяти (Memory Score), демонстрируют замечательную производительность процессоров AMD Ryzen, как первого поколения, так и второго. Здесь же отчетливо видно, что режим Memory Access Mode, доступный для конфигурации в утилите AMD Ryzen Master. Он показал наиболее производительный результат, по сравнению с прямым конкурентом.

В вычислениях постоянно используются величины с плавающей точкой, когда требуется обработать сложные числа, здесь же, в однопоточном режиме, процессор Intel Core i9-7900X продемонстрировал более лучший результат, по сравнению с решениями от AMD. Но здесь я сделаю небольшое отступление о том, что в многопоточном режиме, картина меняется кардинально.

Далее, мы видим результат тестирования в целочисленных операциях здесь в однопоточном режиме, решение от Intel также продемонстрировало великолепный результат.

Отдельного внимания заслуживает результат тестов алгоритмов шифрования. Данная область всегда славилась своими особенными подходами к разработке программного обеспечения и методов шифрования и дешифрования. Многие процессоры содержат в себе специальные модули, которые позволяют выполнять шифрование на аппаратном уровне, но в то же время, они не могут быть недоступны в решениях для массового потребительского рынка. Здесь, процессоры AMD показывают хорошую производительность и обеспечивают высокую скорость шифрования и дешифрования в однопоточном режиме.

Но как выглядят результаты тестирования в многопоточном режиме? Если в вычислениях с плавающей точкой мы наблюдаем значительное превосходство процессора от Intel.

img_025.png

В результате нашего тестирования с помощью Geekbench 4 в многопоточном режиме, мы получили очень интересный результат, демонстрирующий высокий потенциал процессоров AMD и новейшего Threadripper 2950X.

В случае тестов связанных с работой с памятью, мы не получили кардинальных различий, но что же касательно вычислений с целыми числами и числами с плавающей точкой, мы получаем полноценное лидерство у процессором AMD.

Такой результат обеспечен улучшенной поддержкой операций с плавающей точкой и целыми числами, о которых мы писали выше. Заметьте, что процессоры второго поколения, показали лучший результат по сравнению с процессорами первого поколения.

А вот в шифровании и дешифровании, мы получили немного иной результат, при этом если активировать Memory Access Mode, то производительность процессоров AMD снижается, чего нельзя сказать об процессорах Intel.

Результаты тестирования с помощью SPECwpc 2.1
Наборы тестов SPEC давно зарекомендовали себя среди исследователей, обзорщиков и сборщиков компьютерных систем. Они просты в установке и развертывании, а также хорошо документированы и создают взвешенные отчеты демонстрирующие производительность компьютерной системы в целом или её отдельных элементов.

Мы используем набор тестов SPECwpc версии 2.1. Данный набор тестов позволяет проанализировать производительность практически всех элементов системы, таких как CPU, GPU, память, жесткие и SSD диски.

img_026.png

Первая группа тестов - Media & Entertainment, в данной группе тестов производится тестирование дисковой подсистемы, производительности центрального процессора и графического процессора. Чем выше результат теста, тем лучше.

Итак, давайте рассмотрим результат теста приведенного на иллюстрации выше. Как и все предыдущие тесты, тест на визуализацию продемонстрировал большую скорость вычислений современных процессоров AMD, например тест в LuxRender проведенный на процессоре AMD Ryzen Threadripper 2950X продемонстрировал высокую производительность в задачах визуализации. В задачах кодирования видео, новейшие процессоры AMD также продемонстрировали хороший результат. Так, в тесте HandBrake процессор AMD Ryzen Threadripper 2950X продемонстировал замечательный результат в задачах кодирования видео, особенно это заметно в многопоточном режиме. Но в целом, все процессоры показывают практически идентичный результат.
Что же оказалось интересным - результат практического теста в Blender. Обратите внимание на то, что тест показал практически идентичный результат, но наиболее производительным оказался процессор от Intel, опередив всего на 0.01 балла своего конкурента, что в принципе можно считать незначительным выигрышем на общем фоне поразительной производительности того же конкурента. Здесь стоит заметить, что тесты проведенные нами лично, продемонстрировали практически аналогичный результат, но все же новейшие процессоры AMD показываю более хорошую производительность в данном тесте нежели процессоры Intel.

В тестах связанных с работой дисковой подсистемы, процессоры AMD вновь показали лучший результат. Очень порадовала скорость обработки данных считываемых и записываемых на SSD накопитель, это показывает результат теста IOmeter.

img_027.png

Отдельно, наше внимание привлек результат теста Maya, который основан на реализации графического ядра Autodesk Maya 2017 и комплексных моделей сцен с анимацией. Данный тест показал что процессоры Intel гораздо лучше справляются с обработкой многопоточных алгоритмов реализованных в программе нежели процессоры AMD. Здесь стоит заметить, что ама Autodesk Maya поддерживает многопоточные вычисления, но с определенной оптимизацией под возможности процессоров Intel. Поэтому, в данном тесте мы получили такой результат, в котором лидером оказался процессор от Intel.
Другая обширная и требовательная к вычислениям область - машиностроение и дизайн. В набор тестов SPECwpc включена группа тестов Product Development, в которой собраны тесты моделирующие определенные приложения САПР.

img_029.png

Первая группа тестов показывает определенные задачи, которые выполняются на многопоточных процессорах. Здесь стоит отметить, что мы давно заметили явный, проигрыш процессоров AMD в таких задачах как Computational Fluid Dynamics (CFD), в данной области вычислений, процессоры Intel проявляют себя значительно лучше, по сравнению с решениями AMD. На приведенном выше графике, видно что в тесте WPCcfd, основанном на возможностях библиотеки OpenFOAM лидирует именно процессор от Intel, но возможности данной библиотеки значительно оптимизированы для работы в системах с процессорами именно Intel. Еще один интересный тест - тест CalculiX, который основан на открытом и свободном программном пакете, предназначенном для решения линейных и нелинейных трехмерных задач механики твёрдого деформируемого тела и механики жидкости и газа с помощью метода конечных элементов. Здесь же все с точностью да наоборот, область решений практически схожа с тем же WPCcfd, но результат совершенно иной. Здесь, процессоры AMD показали поистине ошеломляющий результат, опередив процессор Intel практически в два раза.

Такое же повышение производительности мы видим и в тесте Rodinia. Данный тест моделирует гетерогенные вычисления и активно использует многопоточность как CPU, так и GPU. Здесь же мы также видим, что новейшая архитектура AMD показывает свои богатые возможности по распараллеливанию вычислений, а это очень хороший показатель для дата центров, где важно распараллеливание вычислений и оптимизация производительности в обработке больших массивов данных.

Приложение Solidworks достаточно инновационное и является одним из лидирующих инструментов среди машиностроителей и дизайнеров различных электронных и бытовых устройств. Данный пакет САПР давно зарекомендовал себя на рынке и интенсивно использует возможности современных процессоров и графических ускорителей. Как вы можете увидеть из приведенного выше графика, Solidworks (Sw-03) показал очень высокую производительность на процессоре Intel Core i9-7900X, что говорит о значительной оптимизации данного пакета под возможности процессоров Intel.

img_028.png

Следующий набор тестов из группы тестов Product Development также продемонстрировал превосходную производительность системы на базе процессора Intel, по сравнению с AMD. Но это чистые модели пакетов САПР, таких как Siemens NX, Showcase, Creo и Catia. По своей сути, данные приложения давно уже обладают значительной оптимизацией под архитектуры процессоров Intel. Но мы надеемся, что в скором времени, разработчики значительно оптимизируют свои продукты и под новейшую архитектуру AMD.

img_030.png

Следующий набор тестов показывает производительность систем в различных научных и исследовательских задачах. Здесь отчасти повторяются тесты из предыдущих наборов, особенно в области гетерогенных вычислниий и операций чтений и замписи, но они специально адаптированы под решение специальных задач, таких как медицинские исследования и моделирование молекулярной динамики. В тесте Medical при любом раскладе лидером оказался процессор Intel Core i9-7900X, но в то же время, в задачах чтения и записи, моделирования поведения молекул, в алгоритмах гетерогенных вычислений и в вычислении молекулярной динамики с помощью библиотеки namd, в лидеры выходил AMD Ryzen Threadripper 2950X. Это легко объяснить, так как процессор значительно оптимизирован для работы с многопоточными задачами, а моделирование биологических и химических процессов явялется хорошо распараллеливаемой задачей, что и позволило получить такой замечательный результат.

Следующий набор тестов посвящен вычислениям в области финансов и обработки транзакций. Здесь безоговорочным лидером оказался именно процессор от AMD практически во всех конфигурациях, опередив продукт Intel практически в два раза.

img_031.png

Как вы можете видеть, лидером в наиболее распространенных в экономическом анализе алгоритмах, наиболее производительным оказался процессор от AMD, что не случайно и также подтвердило высочайшую производительность новой архитектуры в многопоточных алгоритмах. Так тес Binominal реализует Биномиальную модель оценивания опционов и является широко распространенным, а с точки зрения прикладной математики достаточно простым и очевидным численным методом расчета цены опционов. Тест Black Sholes опирается на модель ценообразования опционов Блэка — Шоулза (англ. Black–Scholes Option Pricing Model, OPM) — это модель, которая определяет теоретическую цену на европейские опционы, подразумевающая, что если базовый актив торгуется на рынке, то цена опциона на него неявным образом уже устанавливается самим рынком. Данная модель получила широкое распространение на практике и, помимо всего прочего, может также использоваться для оценки всех производных бумаг, включая варранты, конвертируемые ценные бумаги, и даже для оценки собственного капитала финансово зависимых фирм.

И еще одним тестом, является тест Monte Carlo, на основе методов Монте-Карло — группа численных методов для изучения случайных процессов. Суть метода заключается в следующем: процесс моделируется при помощи генератора случайных величин. Это повторяется много раз, а потом на основе полученных случайных данных вычисляются вероятностные характеристики решаемой задачи. Например, чтобы узнать, какое в среднем будет расстояние между двумя случайными точками в круге, методом Монте-Карло, нужно взять много случайных пар точек, для каждой пары найти расстояние, а потом усреднить.

Как видите, эти задачи превосходно распараллеливаются и превосходно вычисляются с помощью процессоров на базе архитектуры Ryzen.
Хочется заметить, что многие алгоритмы расчета глобального освещения в компьютерной графике также опираются на методы Монте-Карло и их производные, что позволяет ускорить вычисления за счет применения процессоров на основе архитектуры Ryzen.

img_032.png

Общие операции, связанные с компрессией и декомпрессией, выполнением приложений на языках Python и Octave, вновь выводят процессоры AMD в лидеры. Но, что интересно, процессор AMD в режиме Creator, без дополнительных конфигураций процессора, показал наихудший результат в тесте, а мы его повторили трижды. Возможно это была ошибка самого теста, так как в остальных тестах, Octave показал хороший результат. Что также интересно - создание приложений на Python. Здесь тест показал хороший результат у всех процессоров, но что интересно, итоговый результат и наиболее производительный был у процессора Threadripper 2950X когда был отключен Simultaneous Multithreading и активен режим Memory Access Mode.

Энергетика является одной из самых требовательных к вычислениям областей. Обработка больших массивов данных, получаемых с помощью современных инструментов для геологических исследований и изысканий требует высокопроизводительных компьютерных систем, обладающих не только производительными центральными процессорами но и графическими ускорителями, а также большим объемом ОЗУ и жестких дисков.

img_033.png

Приведенный на иллюстрации выше график показывает результат теста Energy-01 из набора тестов SPECwpc. Тест Energy-01 является типичным приложением для обработки объемов в сейсмических и нефтегазовых месторождениях. Подобно медицинским изображениям, таким как МРТ или КТ, геофизические исследования генерируют срезы изображений подповерхностных слоев, которые представлены в виде трехмерной сетки. Объемная визуализация обеспечивает двумерную проекцию этой трехмерной объемной сетки для дальнейшего анализа и интерпретации.

В каждом кадре, в зависимости от положения наблюдателя, серия копланарных срезов, выровненных с углом обзора, вычисляется средствами центрального процессора, а затем отправляется на графический процессор для текстурирования и последующих вычислений, таких как поиск функции передачи, освещение и отсечение, чтобы выявить внутренние структуры. Наконец, срезы смешиваются вместе перед отображением изображения.

Данный тест наглядно продемонстрировал что наиболее производительным оказался процессор Intel Core i9-7900X, а вот процессор AMD Ryzen Treadripper 2950X при любой конфигурации возможностей процессора показал идентичный результат. Но что стоит заметить, процессор i9-7900X также незначительно различается в зависимости от выбранного режима работы, так, производительность при отключенном Hyper-Threading снижается незначительно, что может говорить о том, что алгоритм теста может не использовать все возможности многопоточных вычислений.

img_034.png

Другие тесты, проведенные нами в наборе тестов Energy показали, что возможности новой архитектуры AMD хорошо себя проявляют в ряде инструментов и библиотек, которые занимаются вычислениями и обработкой больших массивов данных.

Так в задачах на Распределение Пуассона, вычисляющих вероятностное распределение дискретного типа, и моделирующих случайную величину, представляющую собой число событий, произошедших за фиксированное время, при условии, что данные события происходят с некоторой фиксированной средней интенсивностью и независимо друг от друга. Наиболее производительным оказался процессор AMD Ryzen Treadripper 2950X. Данный тест показывает результат линейных вычислений. Однако, обратите внимание на тот факт, что в ряде конфигураций производительность процессора AMD, снижается. Но если переключить режим Memory Access Mode, то производительность алгоритма возрастает.

Очень сильно привлек наше внимание тест связанный с анализом сейсмических данных на основе алгоритмов и методов Kirchhoff Migration. Здесь безоговорочным лидером, оказались процессоры AMD.

В аналитических задачах связанных с вычислением рисков - тест srmp, наиболее производительным процессором оказался Core i9-7900X, с активным режимом Hyper-Threading, в то же время, процессор Threadripper 2950X показал высокую производительность при отключении режима Simultaneous Multithreading и переключении режима Memory Access Mode.

В задаче расчета Свёртки функций ( Convolution), которая является операцией в функциональном анализе. По всем результатам лидировал процессор AMD, что также очень хорошо продемонстрировало возможности в многопоточных операциях. По определению, свёртка — это математическая операция, примененная к двум функциям f и g, порождающая третью функцию, которая иногда может рассматриваться как модифицированная версия одной из первоначальных. По существу, это особый вид интегрального преобразования.

И завершающий тест - тест на вычисление Дискретных трансформаций Фурье, на основе библиотеки FFTW. Если вы присмотритесь к результатам теста FFTW, то также заметите, что лидеров в данном тесте стал процессор от AMD, особенно когда были активны все его возможности в работе с многопоточными вычислениями. Что интересно, в данном тесте даже при отключении многопоточности, процессор от AMD не уступал в производительности своему конкуренту. Только если было условие, что были активными всего 8 вычислительных ядер и 16 логических потоков, тогда процессор показал наименьшую производительность.

Вопрос экономики

Одним из самых интересных вопросов, который затрагивает большинство пользователей - цена. Вообще, такие характеристики, как мы получаем у процессоров AMD, в реализации Intel обойдутся в круглую сумму. Мы составили небольшую таблицу процессоров и их характеристик, и указали цену каждого из них. Опираясь на результаты нашего тестирования вы можете самостоятельно сформировать свое видение в выгоде приобретения процессора для решения своих задач.

table_003.png

Согласно проведенному нами исследованию, и приведенным в данной статье результатам, можно сделать вывод что за приемлемые деньги, мы получаем высокопроизводительный процессор, дающий широкий потенциал как для работы с ресурсоемкими вычислительными задачами, так и разгона для повышения производительности в играх.

Если мы приобретем такой процессор как Intel Core i9-7900X, то он будет ниже по производительности по сравнению с эквивалентным ему более производительным AMD Ryzen Threadripper 2950X. О повышенной производительности в большинстве задач и алгоритмов, которые мы протестировали написана данная статья.

Отдельным плюсом являются и более привлекательные технические характеристики, доступные в новейших процессорах Ryzen. Однако, в угоду характеристикам и производительности, при приобретении рабочей станции или ПК на базе CPU AMD, придется задуматься о надежной и хорошей системе охлаждения, так как тепловыделение у процессоров AMD выше, по сравнению с конкурентом.

Отдельно хочется подметить, что если доплатить буквально 10 тысяч, мы можем получить еще более производительный вариант, в лице AMD Ryzen Threadripper 2970WX. О модели 2970WX написано многое, но здесь, в задачах требовательных к производительности и в многопоточных вычислениях,

данный процессор составляет значительную конкуренцию таким процессорам, как Intel® Core i9-7960X и Intel® Core i9-7960X.

Если подвести итог, при желании собрать производительную рабочую станцию для работы под Windows или Linux, но при этом сэкономить, решения AMD выглядят очень хорошим вариантом для выбора, как с технической точки зрения, так и с экономической.

Резюме

Компания AMD славится своей интересной историей, в первой половине 2000-х она стала занимать одно из значимых мест благодаря выпуску архитектуры x64 для настольных PC, это позволило опередить Intel и дать пользователям инструмент, который сможет позволить обрабатывать огромные массивы данных и предоставит возможности использовать большие объемы оперативной памяти, что так востребовано во многих областях, таких как работа с базами данных, обработка больших массивов данных, вычисления, проектирование и визуализация.

Как мы помним, со временем Intel обошел AMD в гонке за лидерство. Но взявшись за разработку новейшей архитектуры и исправление множества ошибок предыдущих поколений, AMD выпускает продукт, который в очередной раз выводит ее если не в лидеры, то на один уровень со своим прямым конкурентом, предоставляя возможности доступные по цене и функционалу огромному количеству пользователей.

Еще год назад, мы были приятно удивлены результатам нашего тестирования, я писал, что AMD удалось создать продукт достойный составить конкуренцию Intel, Но повторив тестирование на основе новой архитектуры, нам понравилось еще больше!

Улучшения в архитектуре Zen+ позволяют повышать производительность в таких ресурсоемких задачах, как визуализация компьютерной графики, обработка видео (кодирование и декодирование), математические вычисления, моделировать естественные процессы, использовать полноценную поддержку множества GPU (благодаря 64 линиям PCI-E) и управлять функционалом процессора, с помощью простого и понятного интерфейса, значительно расширяют области применения новейших процессоров AMD.

Благодаря проведенному нами тестированию, мы выделили следующие направления, где процессоры AMD точно проявят себя и покажут высокую производительность.

  • Обработка изображений
  • Обработка видео
  • Создание 3D графики и анимации
  • Кодирование и декодирование видео
  • Компрессия файлов, обработка архивов
  • Молекулярное моделирование
  • Геологические исследования
  • Гидрогазодинамика

Еще одним интересным моментом оказалась высокая производительность в Linux системах, когда производительность приложений с открытым исходным кодом, выше на процессорах AMD нежели на процессорах Intel. Это также является хорошим примером результата тесной работы между производителями оборудования и программного обеспечения.

Благодарности

Благодарим компанию DIGITALRAZOR за предоставленную возможность провести полноценное тестирование и сравнение процессоров AMD и Intel. За техническое обеспечение тестирования и консультации.
Выбрать компоненты и создать свою рабочую станцию на базе процессоров AMD Ryzen Threadripper 2950X вы можете с помощью КОНФИГУРАТОРА DIGITALRAZOR.
Благодарим компанию AMD за дополнительную информацию и материалы посвященные архитектурам процессоров Zen и Zen+

710 0 850 3
3
2018-12-11
Сижу, как на иголках. Надо обновляться до НГ, но не знаю, что брать: 2950х, 9900к, 9900x, 7900х или 7920х... Или вообще новых интелов ждать. Понаплодили процессоров, фиг определишься! )) Интересно, как Тредриппер себя покажет в Арнольде и Вирей Некст.
2018-12-11
Влад Константинов (Swordlord)Сижу, как на иголках. Надо обновляться до НГ, но не знаю, что брать: 2950х, 9900к, 9900x, 7900х или 7920х... Или вообще новых интелов ждать. Понаплодили процессоров, фиг определишься! )) Интересно, как Тредриппер себя покажет в Арнольде и Вирей Некст.
Да, Арнольд и Вирей Некст мы еще не тестировали, но думаю, что в новых релизах, должен показать хорошо свой потенциал.
2018-12-12
>данный процессор составляет значительную конкуренцию таким процессорам, как Intel® Core i9-7960X и Intel® Core i9-7960X.
Опечаточка - два одинаковых процессора перечислили :)
RENDER.RU