Render.ru

Тест GPU и CPU на iray

3DKing

Мастер
Рейтинг
124
что то новенькое
какие например?
тоесть ты утверждаешь что GPU рендеринг сбасобен взаимодействовать с RAM, тоесть теперь нету ограничения по видео памяти, раз GPU использует не только сваю но и RAM память?
Какой рендер такие чудеса тварит?
Ни IRay ни Octan уж точно
1. Распределение данных между видео памятью и оперативной памятью это задача софта, а не железки. Т.о. GPU рендер работать так, как его задумали разработчики. И если они задумали использовать видео память для актуальных данных, а оперативную для кэша - так оно работать и будет.
2. Какой рендер? CentiLeon например. Он находится в разработке и выйдет в след. году.
 
Рейтинг
405
ну когда выдит тогда и поглядим, на это гибридное сочитание
а пока я исхожу из существующиего софта, а не из обещаний сказки в будущем
Сам тестировал данный софт или исходя из рекламы сделал выводы о его шикарности?
 

Вбд Унит (VBDUnit)

Активный участник
Рейтинг
15
Ребят, ребят. Попробуем посмотреть на задачу с теоретической стороны. Проблема использования RAM состоит в том, что канал связи видеокарты и RAM крайне узок, и будет все замедлять, помимо этого, RAM и память видеокарты имеют несколько разную структуру, и это тоже влияет. В связи с этим, если мы захотим задействовать RAM чтобы разгрузить видеокарту, нам нужно либо какое-то аппаратное решение (или какая-нибудь там новая архитектура), ускоряющее доступ к RAM из видеокарты (минуя шину PCIE, например), либо делить сцену на части и часть рендерить видеокартой, часть процессором. Первое сложно и нестандартно, можно и дорого. Второе имеет в себе проблему - пока не отрендерил, непонятно, какая часть текстурок/полигонов/шейдеров влияет на какую часть и как их разделить (привет, отражения, каустика, подповерхностное рассеяние, преломление и прочая дурь), и вообще, можно ли их как-то разделить так, чтобы рендерить независимо, чтобы не надо было видеокарте с ОЗУ общаться. Ведь, если, скажем, поделить картинку на две части, то пока мы не порендерили, нам не понятно, какие текстуры и полигоны видны в той или иной части картинки, и не понятно что куда качать.

Поэтому есть проблема расширения памяти видеокарты рамой.

С другой стороны, существует такая фишечка, как аппаратное сжатие текстур. В случае с процессором, это будет жрать процессор, ибо рама есть унифицированная память и таких фишек не делает. А в видеокарте могут засадить отдельный аппаратный конвейер для сжатия текстуры на лету, в результате чего скорость работы не пострадает, а вот размер текстур уменьшится. Разумеется, этот способ несет в себе джпег головного мозга, со всеми вытекающими, однако он более-менее позволяет без потери производительности засунуть в карточку текстурки в 10 Гб, которые в RAM будут занимать 50 Гб. Но это если у нас попа связана именно с объемом текстур. Полигоны сжимать тоже наверно можно, но здесь нетривиальность будет переть из всех щелей.

Помимо этого, вроде как в таких хороших вещах, как Quadro и Tesla память вполне себе суммируется, потому как эти карты полноценно умеют друг с другом общаться и спрашивать что у кого там лежит. Знание это подчерпнуто из турториала из ютуба, где у чувака две разных квадры, и та, которая жрет и делает больше, включается только когда у первой кончается память и/или производительность. Извинитененашел. Пруфы в документации к квадрам. Вот.

Еще можно придумать видеокарту с разъемами для плашек памяти, чтобы кто-нибудь поставил в нее 10 Тб и был доволен, однако смысл видеокарты в том числе в особой структуре ее памяти, которая серьезно отличается от классической ОЗУ и во многом обеспечивает ту самую большую производительность ГПУ. Поэтому плашки тут не помогут, и, скорее всего, по этой же причине, не поможет выделенная шина связи между GPU и ОЗУ - архитектура памяти тоже влияет.

Между тем, я дичайше уверен, что если взять iray и закатать его в плату как ПЛМ/ПЛИС или как их там, то он будет просто рвать всё в радиусе 100 километров и рендерить вышеобозначенную сцену с частотой 30 к/с. Однако, я думаю, проще будет подождать, пока карточки станут быстрее и на них эта штука начнет летать. Собственно, когда придумали 3д-ускоритель, они так и сделали, но засунули в карточку рендеринг проекцией. А тут можно именно под ирей сделать.

И наконец, можно крайне хитропопо устроить рендеринг. А именно запихать в видеокарту часть сцены, которая влезает, и затем, если надо-что то, чего нет, докачивать с компа, перемешивая данные между ОЗУ и памятью видеокарты по такому принципу, чтобы наиболее часто используемые данные оставались в видеокарте, а все остальные, которые не влезли - в раме. Вот тогда, теоретически, можно разделить данные между карточкой и рамой, и это даст прирост в производительности. И то, далеко не во всех сценах. А еще архитектура этого рендера будет очень занимательна.

Вообще не факт, что чтобы отрендерить сцену, нам нужно обязательно всю ее загрузить в память. Посмотрите на современные игры. Battlefield, или, к примеру, GTA 5. Гигантский мир, однако работает в реалтайме. Метод рендеринга другой, конечно, но в любом случае, есть текстуры и полигоны. Как это работает быстро? Оно оптимизированно и подгружает только то, что нужно, и удаляет из видеокарты то, что не нужно. Поэтому и работает. С рендером можно замутить также, хотя это и на порядки сложнее. Например, можно уменьшить точность просчета отражений на дальних объектах. Ну и так далее.

Резюмируя, хочу сказать такое. История движется по спирали. Сначала запилили универсальный процессор, потом аппаратный 3д ускоритель, потом сделали 3д ускоритель универсальным. Сейчас есть вероятность, что вот этот вот unbiased рендеринг сделают неунифцированно и аппаратно, ибо элементная база позволяет. Ну или не сейчас.
 
Последнее редактирование:
Рейтинг
58
А именно запихать в видеокарту часть сцены, которая влезает, и затем, если надо-что то, чего нет, докачивать с компа... Вообще не факт, что чтобы отрендерить сцену, нам нужно обязательно всю ее загрузить в память. Посмотрите на современные игры. Battlefield, или, к примеру, GTA 5. Гигантский мир, однако работает в реалтайме.
В играх не unbiased рендеринг. Насколько я понимаю всю интригу unbiased, то нужна инфа от всех элементов в сцене, даже тех, что не видны в камеру и находятся хоть где, потому что вклад в цветность конкретного пикселя картинки дает вся сцена, и именно поэтому её нужно запихнуть в видюху всю без остатка.

Имхо, да, проблема озу в том, что связь медленнее. Я предполагаю, что-то вроде - есть cuda процессор, у него есть формула вычисления цвета в конкретной точке, в этой формуле возвращаются все значения элементов сцены. Часть этих элементов в видюхе, часть в рам, видюха с ума сойдет бегать за данными туда сюда, задержи и простои слишком затратны... и не возможно освободить память видюхи для подгрузки, ведь сцена - это неубираемые данные. Короче, аналогия с файлом подкачки на жестком, но только если бы он не исчезал, когда оперативка освободится, а был всегда и тормозил софт.

Оно оптимизированно и подгружает только то, что нужно, и удаляет из видеокарты то, что не нужно.
Нужно всё, в этом фишка. (моё имхо, хотя может всё и не так)
 
Последнее редактирование:
Рейтинг
405
Мы тут воздух сотрясаем своими догатками по поводу возможно надо так или этак.
Там сидят далеко не глупые люди что пишут данный софт и поверте, они уже все это по сто раз обдумывали и видимо все это либо технически не возможно, либо просто не оправдывается в производительности.

По поводу взаимодействия RAM и GPU рендеринга - RAM память в разы медленнее той что установлена на видео карте(тут еще от карты зависит, их тоже не мало разновидностей) по этой пречине и не создают гибридность между GPU рендерингом и связью RAM, так как смысла тогда в GPU рендеринге просто не будет. Связь видео карты с RAM памятью сильно ударит по скорости и кому тогда нужна разработка рендеринга на GPU если она не особо шустрее CPU будет? Разве что интузиастам.
Сама аснова GPU рендеринга именно в том - что видео карта выступает как отдельный, полноценный, мощьный элеме. Отсюда и производительность, что все операции вращаются и обрабатываются именно внутри карточки. Как мы знаем - процессоры виде карточек в разы мощьнее чем центральный CPU и память у неё шустрее чем обыкновынный RAM - вот это и послужило основой для GPU рендеринга. GPU + быстрая память видео карты - эта основа. Запхайте в это звено простой RAM и производительности как не бывало, жалкие проценты по сравнению CPU.
К тому же в случае с Iray тут еще надо учесть политику Nvidia, которая на целенна не только на продажу софта, а скоро он наверняка будет продаваться отдельно, но и продажу своих топовых карт.
Тоесть супер скорость софта на супер карте и RAM сюда явно не впишится.

По поводу игр - как я уже сказал, GPU в разы быстрее чем CPU и надо учесть что всеже в играх шейдервы света и матов попроще чем мы привыкли использовать в своих 3D пакетах. Отсюда и баталфилд и прочее - процессор карты в разы быстрее, шейдинг и текстуры проще, да и сами модельки там тоже ооочень оптимезированны, без лишниго полика.
Так что гейм дейв к нам отнашения не имеет )

Надо подождать и глянуть на чудо рендер GPU + RAM, на этот CentiLeon, думаю там тоже не будет все так гладко. В рекламах нам всегда показывают красоту, а вот как показывает практика - в реале надо готовиться всеже к более низкому результату.
 

Вбд Унит (VBDUnit)

Активный участник
Рейтинг
15
К примеру, можно те объекты, которые далеко и имеют малый размер (и еще ряд признаков), рендерить проекцией как в играх, а ближние - унбиасед.

Вообще, я считаю, что не стоит прямо так однозначно отодвигать спосбы решения проблем в рендеринге, которые используются в играх. Понятное дело, что требования к скорости/качеству и условия там совсем иные, но все-таки, я думаю, из них можно что-нибудь подчерпнуть.
 
Последнее редактирование:
Рейтинг
405
Все это усложняет про счет во первых, что скажется на скорости и не понятно по каким критериям будет разделяться на близка-далеко
а во вторых - ни кто не будет пихать в один движок 2 алгоритма, так как разные части картинки просчитанные разными алгоритмами будут отличаться друг от друга
 

Вбд Унит (VBDUnit)

Активный участник
Рейтинг
15
Фишка в том, что и алгоритмы унбиасед-рендеринга, и алгоритмы рендеринга в играх стремятся к реализму, то есть одному и тому же результату, поэтому через определенное время разница между результатами достигнет такого уровня, что достаточно их будет совмещать с небольшим плавным переходом, обмазанным цветокоррекцией. :)

А вот критерии, конечно, безусловно сложны. Можно тупо уменьшать точность рендеринга для объектов, находящихся далеко, или имеющих малый размер по площади в кадре. Проблемы начинаются с отражениями и преломлениями, а так же другими видами поверхностей, где не очень понятно, как она в конце концов будет выглядеть. То есть это такое усовершенствованное BSP дерево. Которое, может быть, нужно запилить аппаратно, чтобы оно работало быстро и в этом был смысл.

К примеру, вот эта самая спонза для теста может быть вполне себе довольно реалистично отрендерена Quicksilver'ом, ибо там сплошные диффузные отражения. Однако для этого понадобится куча источников света в коридорах.

Исходя из этого, можно рассуждать, что возможно сделать систему, определяющую сложность сцены и при возможности расставляющую где надо источники света, и рендерящую простую часть этой сцены при помощи тупой проекции. Только вот расставлять эти источники света сможет, скорее всего, не математический алгоритм, а нейросетевой, выведенный путем обучения на готовых сценах, сделанных профессионалами.

Короче, мне кажется, тут нужна штука, которая может поверхностно оценивать необходимый уровень точности для тех или иных элементов сцены, а это, скорее всего, рациональнее реализовывать через нейронную сеть. Кстати, недавнее поделие от гугла вполне наверно на это способно. К примеру часть сцены рендерить, а всякие мелочи пусть дорисовывает нейросеть, вместо того, чтобы тратить 100500 ядер на подсчет диффузных отражений на листике в гуще листвы. То есть, вполне возможно, что задачи вида распределить по методам рендеринга куски сцены смогут решить нейросетевые решения, которые сейчас только-только появляются. И вообще, это, по ходу, новый вид получения изображений. То есть есть вариант - нарисовать, есть вариант сфотографировать, есть вариант сделать 3Д. А появится еще один - синтезировать с помощью нейронной сети. И самая мякотка - это комбинация методов, в частности, 3Д и нейросетей.
 
Последнее редактирование:

3DKing

Мастер
Рейтинг
124
GTX 980Ti: 1мин 16сек
Считаю это самый оптимальный ускоритель на сегодня по соотношению Цена / Скорость
 
Рейтинг
405
Согласен
980TI почти тот же титан Х, малость подрезанный что не совсем существенно и памяти в 2 раза меньше, если это не кретично то конешно TI самая оптимальная
 

mikinik

Знаток
Рейтинг
36
народ вы тут рассуждаете влезет, не влезет, а юзал кто ни будь октан или редшифт? там проблем нет с текстурами и памятью, все текстуры грузятся в озу обычную, а геометрия в видюшную. при этом это происходит прозрачно и без какой либо просадки по скорости рендера.
тестил старую 680 когда вышла в октане, чистой геометрии без проксей в два гига видюшной памяти влазит 20 лямов, при том что моник тоже на ней был, Hunter-X экстерьеры твои что на предыдущей странице отрендерятся влет.
в октане это так выглядит -
123.jpg


в редшифте работает подефолту без каких либо настроек.
_____________________
вот кстати старый ролик в октане сделаный, фул цг -
 
Последнее редактирование:

3DKing

Мастер
Рейтинг
124
народ вы тут рассуждаете влезет, не влезет, а юзал кто ни будь октан или редшифт? там проблем нет с текстурами и памятью, все текстуры грузятся в озу обычную, а геометрия в видюшную. при этом это происходит прозрачно и без какой либо просадки по скорости рендера.
тестил старую 680 когда вышла в октане, чистой геометрии без проксей в два гига видюшной памяти влазит 20 лямов, при том что моник тоже на ней был, Hunter-X экстерьеры твои что на предыдущей странице отрендерятся влет.
в октане это так выглядит -
Посмотреть вложение 210713

в редшифте работает подефолту без каких либо настроек.
_____________________
вот кстати старый ролик в октане сделаный, фул цг -
очень круто! Надо смотреть и тестить...
 
Рейтинг
405
а может кто нибудь покажет мне моштабные картинки сделаные своими руками?
а то чета слов много в пользу GPU, а в пример старонние, рекламные работы приводятся
не то что бы я был против GPU рендеринга, просто я рекламе не верю, а верю своим глазам, когда вижу лог ошибок с обозначением что GPU память кончилась и теперь все считается на CPU
это про Iray, так как тема тут всетаки про него
про октан надо у таварища поинтересоваться по поводу памяти
 

mikinik

Знаток
Рейтинг
36
просто я рекламе не верю, а верю своим глазам, когда вижу лог ошибок с обозначением что GPU память кончилась и теперь все считается на CPU
это про Iray,
странная позиция, смотри и дальше на ошибки ирея и ни кому не верь. только рендеры эти продают за деньги, и не обмана ради рекламу делают.
картинки свои народ тут показывает http://render.otoy.com/forum/viewforum.php?f=5
и тут https://vk.com/album-17913093_172155483

тема по моему про тесты видях, а не про ирей.
 
Последнее редактирование:

mikinik

Знаток
Рейтинг
36
нда, первую часть названия темы в расчет не берешь? не догадываешься почему автор именно ирей выбрал? потому что он есть у всех, а не потому что тема про него.
я не догоняю чего ты прицепился к ирею и названию темы выше сам же писал - "Надо подождать и глянуть на чудо рендер GPU + RAM,.." я тебе написал что это за рендеры и показал картинки с видосом даже, ты теперь говоришь что это все фуфло и будешь с каким то авторитетом своим разговаривать, и тема оказывается теперь про ирей только. в чем логика вообще?
 
Последнее редактирование:
Рейтинг
405
С таким подходом можно и по буквам разобраь не то что по чястям.
Каждый видит и трактует как ему выгодно.
Да я писал что надо ждать и тестить, я от этого вроди не отказываюсь.
По поводу рекламы - это жизненый опыт, кучу роликов видал с чудо производительностью где просто не уточнялось на какой карте и на каком их колличестве все это в реал тайме крутится, а по факту когда получаешь софт в руки, то продукт оказывается далек от ожидаемого и чтобы не быть голословным по этому и сказал что спрошу про октан у таварища который является оф пользователем. А были посты в которых говарили про еще и не вышедший софт.
По поводу того, почему именно ирай и почему речь именно о нем - так ту все логично, человек зашел за саветом в тему про тесты на Iray и просит савета по железу для GPU рендерингаю. Логично что он ориентируется на Iray в работе, в пративном случае зачем задовать вопрос о староннем софте в данной теме. Отсюда я ему и обьсняю что видео память в данном случае, на Iray будет узким местом в моштабных проектах, так нет набежали вы и начинаете про актан и прочий еще не вышедший софт разьяснять.
К чему собственно вообще видео ролики, картинки?
Тут ориентир на Iray, тут тесты все в ирае и не важно платный он или бесплатный, речь именно о Iray, ни октан ни прочее.
Такое чувство как будто ветка про ментал, а мы спорим про вирей и каждый вносит свою лепту с своим софтом который считает лучшим.
Все в заголовке темы написанно.
Для этого и подписывапется тема, чтоб болагана не было. Чтоб ментал обсуждали в своей ветке, вирей в своей и прочее, а вы про октан и прочий софт.
 

mikinik

Знаток
Рейтинг
36
человек не конкретно про ирей спрашивал, а вобщем про гпу рендеринг, или в блендере тож ирей также как и в синеме он есть, да? в теме этой вопрос потому что тут про тесты гпу и цпу.
Отсюда я ему и обьсняю что видео память в данном случае, на Iray будет узким местом в моштабных проектах,
ну, ок, а я объясняю что у октана и редшифта этой проблемы нет. и редшифт вышел и под макс есть в альфа версии, просто попросить надо. под майу продают уже давно. я щупал и его и октан есть лицушный, ты же говоришь, подозреваю, не видев в глаза ни то ни это.
По поводу взаимодействия RAM и GPU рендеринга - RAM память в разы медленнее той что установлена на видео карте(тут еще от карты зависит, их тоже не мало разновидностей) по этой пречине и не создают гибридность между GPU рендерингом и связью RAM, так как смысла тогда в GPU рендеринге просто не будет.
помоему просто кто-то не в теме, а пытается показать обратное.
 
Последнее редактирование:
Рейтинг
405
не видев в глаза ни то ни это.
оно мне не нужно.
Пишу про то что знаю.

в теме этой вопрос потому что тут про тесты гпу и цпу.
Будет тема - "дрифт на BMW"
Будешь заходить про мерсы спрашивать?
Есть же слово ДРИФТ в первой части заголовка.

Вообще спор не о чем.
Повторюсь - мне не интересен не октан ни редшифт. Отсюда и познания о них такие.
Обсалютно не вижу в этом ничего предосудительного, не нужно и не знаю.
Помойму все логично и не думаю что подлежит упреку.
 

mikinik

Знаток
Рейтинг
36
не корректное сравнение. согласен что спор ни о чем.
главный вопрос не задали, что человек собирается рендерить на гпу. если предметку и экстерьеры то можно попробовать. если интерьеры то из всех гпу рендеров только редшифт подойдет, тк только он на гпу биасед движками считает, и средний интерьер в фулхд на одной видяхе считается за 4 минуты, без шума и косяков. все остальные гпу анбиас рнедеры совсем не для интерьеров, ждать долго надо будет.
____
хотя нет, во врае можно попробовать еще, тк с версии 3.2 можно рендерить бф+лк на гпу, и это сильно быстрей будет чем обычный бф+бф ртешный врайский.)
 
Последнее редактирование:
Сверху