|
Производительность современных GPU при вычислении FFT |
|
|
|
 |
Ответов
|
Apr 7 2018, 08:15
|
Частый гость
 
Группа: Участник
Сообщений: 112
Регистрация: 27-12-08
Пользователь №: 42 786

|
Цитата(rloc @ Apr 6 2018, 18:54)  Так нужны не расчеты. Любая инженерно-техническая задача начинается с расчета (оценки), исходя из расчета выбираются пути реализации. Если вам подходит стандартный БПФ, то он есть в примерах CUDA, можете скачать, поставить, запустить и посмотреть на цифры. Цитата(Serg76 @ Apr 6 2018, 22:07)  Сначала я тоже так думал, но практика, а также профайлеры показали, что проблема именно в копировании между устройствами. В вашем конкретном случае может это и так, не зная подробностей задачи и железа и не посмотрев в код ничего внятного сказать нельзя. Но меня жизнь научила, что в 90% случаев "дело не в бобине". Раз производители делают PCIe на много линий, значит железо в состоянии их утилизировать, т.е. для современной видеокарты скорости обмена в десятки гигабит в секунду - нормальный режим работы.
|
|
|
|
|
Apr 7 2018, 11:49
|
Профессионал
    
Группа: Участник
Сообщений: 1 050
Регистрация: 4-04-07
Пользователь №: 26 775

|
Цитата(stealth-coder @ Apr 7 2018, 11:15)  В вашем конкретном случае может это и так, не зная подробностей задачи и железа и не посмотрев в код ничего внятного сказать нельзя. Но меня жизнь научила, что в 90% случаев "дело не в бобине". Раз производители делают PCIe на много линий, значит железо в состоянии их утилизировать, т.е. для современной видеокарты скорости обмена в десятки гигабит в секунду - нормальный режим работы. В этом тесте ничего сложного нет, 3 строчки кода: копирование на карту, FFT и копирование с карты на хост, все библиотечные оптимизированные функции, хотя свой код FFT тоже пробовал. В результате получам 2,5 Гбит/с на том железе, что у меня есть. если убрать копирование с карты на хост, то получаем 3 Гбит/с,т.е. 15 % ресурсов «жрет» тривиальная функция копирования!!! Не много ли?
|
|
|
|
Сообщений в этой теме
rloc Производительность современных GPU при вычислении FFT Apr 4 2018, 21:05 Serg76 Занимался подобной проблемой, результат неутешител... Apr 5 2018, 06:27 rloc Цитата(Serg76 @ Apr 5 2018, 09:27) главно... Apr 5 2018, 07:00  _pv ещё новые шарки SC58x у AD c FFT ускорителями обещ... Apr 5 2018, 08:59   rloc На DSP закладываться опасно, основная проблема - в... Apr 5 2018, 09:22  Serg76 Цитата(rloc @ Apr 5 2018, 10:00) Перейду ... Apr 5 2018, 10:43 krux длинные поточные FFT удобно делать на ПЛИСах.
под ... Apr 5 2018, 06:40 _pv за/против GPU ещё наверное зависит от того есть ли... Apr 5 2018, 13:09 rloc В моем случае данных в хосте изначально нет, снача... Apr 5 2018, 13:23 _pv 2 квадратурных канала сбора данных по 16 бит, част... Apr 5 2018, 13:44 RobFPGA Приветствую!
Цитата(_pv @ Apr 5 2018, 16... Apr 5 2018, 14:29 rloc Цитата(_pv @ Apr 5 2018, 16:44) 2*16*500 ... Apr 5 2018, 17:21  RobFPGA Приветствую!
Цитата(rloc @ Apr 5 2018, 2... Apr 5 2018, 18:20   rloc Цитата(RobFPGA @ Apr 5 2018, 21:20) Моско... Apr 6 2018, 05:49 Serg76 Цитата(stealth-coder @ Apr 6 2018, 18... Apr 6 2018, 19:07 faa Вот тут английский самоделкин на GPU от Raspberry ... Apr 7 2018, 13:00 rloc Цитата(faa @ Apr 7 2018, 16:00) На GPU в ... Apr 7 2018, 16:44  faa Цитата(rloc @ Apr 7 2018, 19:44) Есть два... Apr 7 2018, 17:57  RobFPGA Приветствую!
Цитата(rloc @ Apr 7 2018, 19... Apr 7 2018, 20:20   rloc Цитата(RobFPGA @ Apr 7 2018, 23:20) будем... Apr 7 2018, 22:45    RobFPGA Приветствую!
Цитата(rloc @ Apr 8 2018, 0... Apr 7 2018, 23:25    faa Цитата(rloc @ Apr 8 2018, 01:45) Очень тя... Apr 8 2018, 10:13  blackfin Цитата(rloc @ Apr 7 2018, 19:44) Подумал,... Apr 8 2018, 04:52   rloc Цитата(blackfin @ Apr 8 2018, 07:52) Pipe... Apr 8 2018, 07:18 thermit Странные показатели у вас.
gtx1060 complex fft 64... Apr 7 2018, 13:04 blackfin Цитата(thermit @ Apr 7 2018, 16:04) Стран... Apr 7 2018, 13:34 thermit Очевидно, что не успевает.
Честно говоря, обработ... Apr 7 2018, 13:59
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|