реклама на сайте
подробности

 
 
 
Reply to this topicStart new topic
> В каких ПЛИС больше арифметики на бакс?
Shtirlits
сообщение Apr 5 2011, 18:23
Сообщение #1


Знающий
****

Группа: Свой
Сообщений: 845
Регистрация: 18-10-04
Из: Pereslavl-Zalessky, Russian Federation
Пользователь №: 905



Всем добрый день!

Скажите, не появлялось ли в последнее время чего-то выдающегося программируемого логического с
целочисленными сумматорами, может быть даже умножителями, такого, что по цене операции
может конкурировать с GPU на тех же разрядностях ?

Интересует только цена;
габарит, потребление, температура, коммерческий-военный-промышленный - неважно.
Go to the top of the page
 
+Quote Post
Methane
сообщение Apr 5 2011, 18:33
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 3 615
Регистрация: 12-01-09
Из: США, Главное разведовательное управление
Пользователь №: 43 230



Супротив GPU в плане числодробилки, вариантов нет.
Go to the top of the page
 
+Quote Post
jojo
сообщение Apr 5 2011, 19:01
Сообщение #3


Знающий
****

Группа: Свой
Сообщений: 574
Регистрация: 9-10-04
Из: FPGA-city
Пользователь №: 827



>такого, что по цене операции может конкурировать с GPU на тех же разрядностях ?

Большие Spartan-6 или средние Virtex-6 успешно конкурируют с GPU.
Что лучше - зависит напрямую от алгоритма и реализации.
Вы на какие алгоритмы нацелились?
Go to the top of the page
 
+Quote Post
Methane
сообщение Apr 6 2011, 02:22
Сообщение #4


Гуру
******

Группа: Свой
Сообщений: 3 615
Регистрация: 12-01-09
Из: США, Главное разведовательное управление
Пользователь №: 43 230



Цитата(jojo @ Apr 5 2011, 22:01) *
>такого, что по цене операции может конкурировать с GPU на тех же разрядностях ?

Большие Spartan-6 или средние Virtex-6 успешно конкурируют с GPU.

Я так понимаю спрашивали о цене.
Go to the top of the page
 
+Quote Post
jojo
сообщение Apr 6 2011, 06:23
Сообщение #5


Знающий
****

Группа: Свой
Сообщений: 574
Регистрация: 9-10-04
Из: FPGA-city
Пользователь №: 827



>Я так понимаю спрашивали о цене.

С ПЛИС можно сравнивать GPU верхнего уровня цен.
Например, С2070 и Virtex-6 130. Дело в алгоритме, который мы пока не знаем.
Go to the top of the page
 
+Quote Post
Shtirlits
сообщение Apr 6 2011, 06:36
Сообщение #6


Знающий
****

Группа: Свой
Сообщений: 845
Регистрация: 18-10-04
Из: Pereslavl-Zalessky, Russian Federation
Пользователь №: 905



Алгоритм я и сам еще не знаю и не факт, что до него дело дойдет.
Вопрос именно о чем-то необычном, вдруг я пропустил какой-нибудь ClearSpeed или Achronix.
Go to the top of the page
 
+Quote Post
jojo
сообщение Apr 6 2011, 06:50
Сообщение #7


Знающий
****

Группа: Свой
Сообщений: 574
Регистрация: 9-10-04
Из: FPGA-city
Пользователь №: 827



>ClearSpeed или Achronix.
Это "менеджЕрские" девайсы.

Реальные девайсы, по степени крутизны: x86_64 -> GPU -> FPGA с LUT6.
Go to the top of the page
 
+Quote Post
iiv
сообщение Apr 6 2011, 09:56
Сообщение #8


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Цитата(jojo @ Apr 6 2011, 09:50) *
Реальные девайсы, по степени крутизны: x86_64 -> GPU -> FPGA с LUT6.

Позвольте с Вами не согласиться, FPGA->x86_6->GPU

Нормальный 5970 радеон за штуку бакс дает пиковых 1.1терафлопс на дабле, 600 терафлопс на дабле на тестовых и 400 на реальных получается.
Итого 1 гигафлоп за бакс в пике и 0.4 гигафлопа за бакс в реале на дабле, причем это уже со стоимостью всего обвеса.

Я конечно смог однажды на третьем стратиксе так отконвертить алгоритм, что его аналог на целочисленной арифметике функционировал с 900гфлопс эквивалентной производительности, но 150 стратикс все-таки не совсем дешев, итого те же 0.4гигафлопа за бакс, причем здесь только можно сказать об эквивалентных гигафлопах - в алгоритме умножение одно было отскалировано на сдвиг, все операции в целых числах, но именно этот алгоритм на ГПУ не через даблы был не реализуем.

А если даблы на плиски честные делать, то, исходя из сегодняшних цен, если и 0.05гигафлопа за бакс получится, то сильно здорого. Если взять средний четырехядерный АМДшник, который стоит около 100 бакс, и на нем реально получить 20 гигафлопс на дабле ну совсем не напрягаясь (0.2гигафлопа на бакс), ИМХО, плискам пока только удел в интерфейсах, и энергоэкономных, переносимых, военных отраслях числа перемалывать.

ЗЫ Что-то я задумался о своем, и не заметил, что топикстартер только о целочисленных операциях вопрошал. Почти все мною вышесказанное, переноситься из дабла и на целочисленные операции. На том же радеоне в целочисленной арифметике я терамипс на реальной задаче получал, а его пик, сложно подумать, 5.5терамипсов.

Сообщение отредактировал iiv - Apr 6 2011, 10:02
Go to the top of the page
 
+Quote Post
Oldring
сообщение Apr 8 2011, 09:30
Сообщение #9


Гуру
******

Группа: Свой
Сообщений: 3 041
Регистрация: 10-01-05
Из: Москва
Пользователь №: 1 874



Цитата(iiv @ Apr 6 2011, 13:56) *
терамипс


?


--------------------
Пишите в личку.
Go to the top of the page
 
+Quote Post
iiv
сообщение Apr 8 2011, 13:12
Сообщение #10


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Цитата(Oldring @ Apr 8 2011, 13:30) *
"Терамипс"
?

Вот представьте, что Вы хотите сказать то, о чем мы все подумали и у Вас получается или "типс" (то есть чаевые по-английски) или "тераипс" (при произношении "и" однозначно превратится в "е", а то и "ё"). Согласитесь, и то и другое очень не созвучно и на русском, и на английском языках. Так как в русском языке два корня в словах обычно объединяются гласной "о" из-за того, что эти корни оканчиваются на согласные, а, в нашем случае, имеет место полностью противоположная ситуация, вводим новое правило объединения корней русских заимствованных слов и используем красивую по звучанию буковку "м" получая терамипс! А Вам не наравится?

Сообщение отредактировал iiv - Apr 8 2011, 13:14
Go to the top of the page
 
+Quote Post
Victor®
сообщение Apr 8 2011, 13:35
Сообщение #11


Lazy
******

Группа: Свой
Сообщений: 2 070
Регистрация: 21-06-04
Из: Ukraine
Пользователь №: 76



Цитата(iiv @ Apr 8 2011, 16:12) *
Вот представьте, что Вы хотите сказать то, о чем мы все подумали и у Вас получается или "типс" (то есть чаевые по-английски) или "тераипс" (при произношении "и" однозначно превратится в "е", а то и "ё").


По сравнению с yobibit звучит по-ангельски. rolleyes.gif


--------------------
"Everything should be made as simple as possible, but not simpler." - Albert Einstein
Go to the top of the page
 
+Quote Post
Мур
сообщение Apr 8 2011, 13:50
Сообщение #12


Знающий
****

Группа: Свой
Сообщений: 815
Регистрация: 7-06-06
Из: Харьков
Пользователь №: 17 847



А свежий взгляд на свою железку может увидеть и "из пушки по воробъям".
Можно загрузить и дурной работой, неправильно определившись с методом решения...
Так что прежде чем браться за ПЛИС стоит усвоить ТЗ и не ломиться "в лоб"... Просто поиграть в Матлабе с вариантами. Глядишь ,- можно будет использовать ресурс многократно. ....Время позволяет? Так что - удешевление зависти от метода решения задачи.
Go to the top of the page
 
+Quote Post
Anatol'
сообщение May 19 2011, 06:19
Сообщение #13


Участник
*

Группа: Свой
Сообщений: 74
Регистрация: 28-01-10
Из: Новосибирск
Пользователь №: 55 106



Цитата(iiv @ Apr 6 2011, 16:56) *
ЗЫ Что-то я задумался о своем, и не заметил, что топикстартер только о целочисленных операциях вопрошал. Почти все мною вышесказанное, переноситься из дабла и на целочисленные операции. На том же радеоне в целочисленной арифметике я терамипс на реальной задаче получал, а его пик, сложно подумать, 5.5терамипсов.

А вот целочисленные не надо валить в ту же кучу. Про плавающую запятую в принципе согласен, но дальше... Дальше всё очень сильно зависит алгоритма.
Я как раз сейчас заканчиваю магистерскую на эту тему. Так вот, на вполне реальных задачах с целочисленной арифметикой из (к примеру) позорного XC6SLX9 за 500 рублей можно выжать штук 200 ваших "эквивалентных" гигафлопс. Ну или если я запутался в ваших единицах, то он тянет примерно 1/3 Tesla C1060.

А если копнуть ещё чуть поглубже, и взять "алгоритмы-битоковырялки" (то есть не с целочисленной арифметикой, а с упором на сравнение/перестановку/операции с отдельными битами и малыми группами), то тот же чип может стать эквивалентом 10-20 (!) Tesla C1060. И это тоже на реальных задачах.

Короче, есть задачи, на которых FPGA рвут GPU в клочья, и задач этих не так мало, поверьте.
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 29th June 2025 - 08:35
Рейтинг@Mail.ru


Страница сгенерированна за 0.02459 секунд с 7
ELECTRONIX ©2004-2016