Сегодня переписал код под приложение чтоб уйти от майки. И дал более жизненную задачу. 9 массивов по 2097152 из которых по формуле пишется 4й.
Вот только результаты странные
Попытался разложить под SSE (в формуле правда ошибся но не суть, кол - во операций тоже самое) Прироста 0, даже медленнее стало.
АМР вообще тащиться в конце
Если будет время и желание глянь, мож что увидишь ; В архиве исходник и скомпиленый экзешник
Ну и сами результаты
---Размер массивов-- : 2097152
________________________Проверка значений_______________________________________
x = 27.6 : y = 22.8 :z = 18
*******************************************************************
Стандартный алгоритм без многоядерности
---Время выполнения-- : 0.044сек
________________________________________________________________________________
________________________Проверка значений_______________________________________
x = 27.6 : y = 22.8 :z = 18
*******************************************************************
Стандартный алгоритм с многоядерностью
---Время выполнения-- : 0.013сек
________________________________________________________________________________
________________________Проверка значений_______________________________________
x = 12 : y = 26.4 :z = 108.48
*******************************************************************
SSE с Многоядерностью
---Время выполнения-- : 0.013сек
________________________________________________________________________________
________________________Проверка значений_______________________________________
x = 12 : y = 26.4 :z = 108.48
*******************************************************************
SSE с Одноядерный
---Время выполнения-- : 0.06сек
________________________________________________________________________________
Девайс:
NVIDIA GeForce GTX 780
___________________________________________
________________________Проверка значений_______________________________________
x = 27.6 : y = 22.8 :z = 18
*******************************************************************
AMP алгоритм
---Время выполнения-- : 0.072сек
________________________________________________________________________________
Копирование в память 0.006сек
Арифметика 0.05сек
test.zip