реклама на сайте
подробности

 
 
> Ищу любые вычислительные проекты для FPGA, помогите, кто чем может
Alexium
сообщение Mar 10 2011, 21:24
Сообщение #1


Частый гость
**

Группа: Участник
Сообщений: 88
Регистрация: 3-03-10
Пользователь №: 55 790



Здравствуйте.
Пишу диплом магистра. Тема - ускорение вычислений (реконфигурируемый сопроцессор на ПЛИС).
Сейчас делаю собственно сопроцессор (фреймворк, в некотором роде). Потом надо будет исследовать производительность разных задач на ПЛИС, сравнивать с чисто программной реализацией.
Проблема в том, что время уже ой как поджимает, а еще сам фреймворк не готов. Времени писать для ПЛИС решения каких-то практически значимых задач нет вообще. Может, кто-то поделится каким-нибудь проектом? Или кто-то где-то что-то видел и даст ссылку...
Понимаю, что вряд ли кто-то поделится со мной своей интеллектуальной собственностью, но если вдруг - конфиденциальность я, разумеется, гарантирую. В отчет пойдет только краткое описание решаемой задачи и графики производительности.

Сообщение отредактировал Alexium - Mar 10 2011, 21:27
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Alexium
сообщение Mar 11 2011, 14:34
Сообщение #2


Частый гость
**

Группа: Участник
Сообщений: 88
Регистрация: 3-03-10
Пользователь №: 55 790



Цитата(bogaev_roman @ Mar 11 2011, 15:53) *
Я вот тоже - не знаю, может ли GPU FFT считать, а если может - то с цифрами какой разрядности оперирует и максимальным окном. Если у Вас задача стоит чего-нить наваять и сравнить, а насколько это быстрей будет подсчитано в ПЛИС, чем в процессоре, то сделать все довольно просто.
Сколько в Вашей ПЛИСке встроенных умножителей?
Создаете FIR фильтр с порядком, равным кол-ву аппаратных умножителей и распаралеливаете структуру фильтра, а процессору даете формулу для расчета в лоб - пусть загибается.
Ну и получится, что в ПЛИС результат на выходе будет через latency, но каждый такт, а процессор все вычислит если у него одна оперция за такт через Nx2-1 тактов минимум, N - порядок фильтра. При порядке 51 процессор должен сделать 51 умножений и 50 сложений.

Отлично, спасибо за подсказку насчет FIR-фильтра!
Умножителей у меня, кажется, 20. Т.е. макс. порядок - 19 (если я правильтно понял). Процессор умножает, я думаю, тактов за 7, складывает - за 1 (мы ведь о целых числах говорим?). Итого - чуть больше 150 тактов на итерацию, или в 150 раз медленнее ПЛИС. При частоте ПЛИС 50 МГц ЦП с ней сравняется на частоте больше 7 ГГц. Но у процессора может быть 4 ядра, и он может пользоваться параллелизмом уровня команд. И у него быстрый доступ к памяти (узкое место моего проекта). Но можно ведь умножители и на LUT сделать. Конечно, тактовая частота упадет, но зато степень параллелизма вырастет...

Насчет GPU: FFT они считают вполне неплохо. Конкретных цифр не скажу (еще не изучал), но в принципе - GPU работают с целыми 32-битными числами, 32- и 64-битными с плавающей запятой.
Есть исследование производительности GPU NVidia GT200, дочитаю - опишу результаты, если интересно.
Кстати, я не учел, что процессор использует конвейер, так что для выполнения 20 умножений нужно гораздо меньше 20х7 тактов. Скорее, 7 + 19х(1 или 2).
UPD: посмотрел таблицу. Процессор Core 2, операция 32-битного умножения: latency - 5, throughput - 1.5. Так что даже в такой задаче небольшим ПЛИС приходится туго.

Сообщение отредактировал Alexium - Mar 11 2011, 14:40
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- Alexium   Ищу любые вычислительные проекты для FPGA   Mar 10 2011, 21:24
- - DmitryR   На Opencores посмотрите - там математики всякой хв...   Mar 11 2011, 06:14
- - Alexium   Смотрел, конечно. Мало там подходящих для меня про...   Mar 11 2011, 06:44
|- - DmitryR   Там есть как минимум (из законченного): - CORDIC -...   Mar 11 2011, 06:58
- - Alexium   Нет, шифрование и хэширование - это то, что надо. ...   Mar 11 2011, 07:33
|- - bogaev_roman   Цитата(Alexium @ Mar 11 2011, 10:33) Мне ...   Mar 11 2011, 12:24
- - jojo   >Сейчас делаю собственно сопроцессор (фреймворк...   Mar 11 2011, 07:39
- - Alexium   Цитата(jojo @ Mar 11 2011, 09:39) А что т...   Mar 11 2011, 08:06
- - Kirill_Good   Restricted Boltzmann Machines   Mar 11 2011, 11:38
- - Alexium   Цитата(Kirill_Good @ Mar 11 2011, 13:38) ...   Mar 11 2011, 13:09
|- - bogaev_roman   Цитата(Alexium @ Mar 11 2011, 16:09) а во...   Mar 11 2011, 13:16
- - Alexium   Цитата(bogaev_roman @ Mar 11 2011, 15:16)...   Mar 11 2011, 13:35
|- - bogaev_roman   Цитата(Alexium @ Mar 11 2011, 16:35) Чест...   Mar 11 2011, 13:53
|- - iiv   Цитата(bogaev_roman @ Mar 11 2011, 17:53)...   Apr 12 2011, 20:52
|- - bogaev_roman   Цитата(Alexium @ Mar 11 2011, 17:34) UPD:...   Mar 11 2011, 15:25
- - bav   ЦитатаЧестно - не знаю. Просто мне так кажется поч...   Mar 11 2011, 14:49
- - Alexium   Во-первых: с GPU, конечно, спавнивать тяжело. А во...   Mar 11 2011, 15:29
- - bav   ЦитатаСказать, что в таких-то задачах такие-то FPG...   Mar 11 2011, 15:47
- - Alexium   Цитата(bav @ Mar 11 2011, 17:47) чип, опт...   Mar 11 2011, 15:53
- - bav   ЦитатаНе знаю, правда, рассчитаны ли они на послед...   Mar 11 2011, 16:29
- - Alexium   Цитата(bav @ Mar 11 2011, 18:29) может, я...   Mar 11 2011, 19:08
- - jojo   >Во-первых: с GPU, конечно, спавнивать тяжело. ...   Mar 11 2011, 20:23
|- - iiv   Цитата(jojo @ Mar 11 2011, 23:23) Сейчас ...   Apr 12 2011, 23:55
|- - Maverick   Цитата(iiv @ Apr 13 2011, 02:55) не первы...   Apr 13 2011, 05:20
||- - iiv   Цитата(Maverick @ Apr 13 2011, 08:20) Да ...   Apr 13 2011, 07:09
|- - jojo   Цитата(iiv @ Apr 13 2011, 03:55) Уважаемы...   Apr 13 2011, 08:35
- - Alexium   Цитата(jojo @ Mar 11 2011, 22:23) Сейчас ...   Mar 11 2011, 20:46
- - Alexium   Доделал базовый функционал сопроцессора, а что уск...   Apr 12 2011, 19:52
- - Alexium   Рискну предположить, что современная емкая ПЛИС ти...   Apr 13 2011, 05:54
|- - bogaev_roman   Цитата(Alexium @ Apr 13 2011, 09:54) Увы,...   Apr 13 2011, 06:41
|- - iiv   Цитата(bogaev_roman @ Apr 13 2011, 09:41)...   Apr 13 2011, 06:56
- - Alexium   Цитата(bogaev_roman @ Apr 13 2011, 09:41)...   Apr 13 2011, 06:48
|- - bogaev_roman   Цитата(Alexium @ Apr 13 2011, 10:48) Что ...   Apr 13 2011, 06:57
|- - iiv   Цитата(bogaev_roman @ Apr 13 2011, 09:57)...   Apr 13 2011, 07:31
- - Alexium   Цитата(iiv @ Apr 13 2011, 09:56) А вот пр...   Apr 13 2011, 07:18
|- - Maverick   Цитата(Alexium @ Apr 13 2011, 10:18) Что ...   Apr 13 2011, 07:26
|- - bogaev_roman   Цитата(Alexium @ Apr 13 2011, 11:18) Что ...   Apr 13 2011, 07:35
- - Alexium   Цитата(iiv @ Apr 13 2011, 10:31) ИМХО, 2 ...   Apr 13 2011, 07:42
|- - Maverick   Цитата(Alexium @ Apr 13 2011, 10:42) К со...   Apr 13 2011, 08:05
- - Alexium   Цитата(Maverick @ Apr 13 2011, 11:05) Или...   Apr 13 2011, 09:54
|- - Maverick   Цитата(Alexium @ Apr 13 2011, 12:54) От с...   Apr 13 2011, 10:00
|- - iiv   Цитата(Maverick @ Apr 13 2011, 13:00) Был...   Apr 13 2011, 12:34
|- - jojo   Цитата(iiv @ Apr 13 2011, 16:34) ИМХО, вр...   Apr 13 2011, 14:59
- - Ethereal   Я с ГПУ не сталкивался, но можно вставить маленько...   Apr 14 2011, 09:14
- - S_Hawk   перебор ключей криптоалгоритма DES - вот та задача...   Apr 20 2011, 19:55
- - mohny   Есть задачи которые отлично решаются с помощью ПЛИ...   Dec 4 2012, 05:05
- - Swup   Я бы посоветовал ТС тоже самое, что уже говорилось...   Dec 5 2012, 09:26
- - _Anatoliy   Цитата(Swup @ Dec 5 2012, 11:26) По тако...   Dec 5 2012, 10:28
- - Swup   Цитата(_Anatoliy @ Dec 5 2012, 14:28) По ...   Dec 5 2012, 11:50
- - _Anatoliy   Цитата(Swup @ Dec 5 2012, 13:50) Спасибо,...   Dec 5 2012, 12:27


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 22nd July 2025 - 19:53
Рейтинг@Mail.ru


Страница сгенерированна за 0.01397 секунд с 7
ELECTRONIX ©2004-2016