|
Computing FPGA, Не большая вычислительная система на ПЛИС |
|
|
2 страниц
1 2 >
|
 |
Ответов
(1 - 21)
|
Jan 21 2010, 11:04
|
Группа: Новичок
Сообщений: 2
Регистрация: 18-01-10
Пользователь №: 54 878

|
|
|
|
|
|
Jan 21 2010, 11:21
|
Местный
  
Группа: Свой
Сообщений: 279
Регистрация: 2-07-08
Из: Новосибирск
Пользователь №: 38 699

|
Цитата(Mihail Gluhowchenko @ Jan 21 2010, 15:14)  Интересен порядок цен на такие вещи. Нужно повозиться с массивом матриц на пару 10-ков гигабайт целочисленных. Вот и интересно сравнить кластерное решение и вот такой модуль. Конечно на ~50к можно уже серьезную кластерную систему построить так что не устраивает. Тут более актуально не куча FPGA и процессор, а ФПГА и куча памяти (именно, физически куча микросхем памяти) - чтобы можно было поток данных большой принимать / писать. А иначе заткнется система по пропускной способности памяти
|
|
|
|
|
Jan 22 2010, 07:25
|
Знающий
   
Группа: Свой
Сообщений: 758
Регистрация: 11-07-05
Из: Понаехал (Мск)
Пользователь №: 6 688

|
Цитата(Mihail Gluhowchenko @ Jan 22 2010, 05:41)  Параллелизм просто идеальный как в классических задачах по параллельным вычислениям. Перемножение матриц 10000 х 10000 элементов в каждой, или сравнение таких матриц. CUDA уже работает. тут есть один момент = у Cuda плавающая точка, а в FPGA плавающая точка будет в разы медленнее. ну сколько Mhz максимум умножитель будет работать в FPGA? 250 где то... в Tesla умножение будет быстрее происходить.
|
|
|
|
|
Jan 22 2010, 09:17
|
Местный
  
Группа: Свой
Сообщений: 322
Регистрация: 2-07-04
Из: Minsk
Пользователь №: 240

|
скоростное чудо - http://www.copacobana.org/взять в аренду  вот только судя по всему - там нет памяти. матрицы негде будет хранить. кстати, откуда расчёты, что 4 FPGA и только один гигабитный свитч? а не будет ли гигабитный линк - узким местом в такой системе?
|
|
|
|
|
Jan 22 2010, 15:43
|
Местный
  
Группа: Свой
Сообщений: 464
Регистрация: 1-10-04
Из: Челябинск
Пользователь №: 751

|
Цитата тут есть один момент = у Cuda плавающая точка, а в FPGA плавающая точка будет в разы медленнее. ну сколько Mhz максимум умножитель будет работать в FPGA? 250 где то... в Tesla умножение будет быстрее происходить. Года 3-4 назад до кризиса участвовал в проекте, перемножали разряженную матрицу на вектор, тн свертка. Вся арифметика в double (64 бит). Железо было свое, на Strarix-II c 3 блоками внешней статической и динамической памяти DDR2. В итоге тактовая вычислителя получилась 280 MHz. По результату - на маленьких матрицах время сравнимо с Core2, а чем матрица больше, тем железо сильнее натягивало PC. Сейчас уже деталей не помню.
|
|
|
|
|
Jan 24 2010, 13:11
|
Местный
  
Группа: Свой
Сообщений: 464
Регистрация: 1-10-04
Из: Челябинск
Пользователь №: 751

|
Цитата(SFx @ Jan 23 2010, 20:00)  FPGA, да будет быстрее чем коре2 перемножает, за счет параллельности. но вот на CUDE FPGA выходит в аутсайд из-за того что FPU в GPU много штук и они еще и работают в разы быстрее из-за того что они железные Они все железные. ПК начинает сильно отставать как только матрица не помещается в кэше. На больших матрицах видели падение производительности до порядка 60 - 30 MMAC (это на CORE 2), в тоже время наше железо на тех же данных показывало 280 ММAC. На малых матрицах производитедьность ПК была немного повыше. Видимо и FPU в GPU не намного поднимут призводительность матричных вычислений, все упрётся в доступ к данным.
|
|
|
|
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0
|
|
|