|
|
  |
В каких ПЛИС больше арифметики на бакс? |
|
|
|
Apr 6 2011, 09:56
|
вопрошающий
    
Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436

|
Цитата(jojo @ Apr 6 2011, 09:50)  Реальные девайсы, по степени крутизны: x86_64 -> GPU -> FPGA с LUT6. Позвольте с Вами не согласиться, FPGA->x86_6->GPU Нормальный 5970 радеон за штуку бакс дает пиковых 1.1терафлопс на дабле, 600 терафлопс на дабле на тестовых и 400 на реальных получается. Итого 1 гигафлоп за бакс в пике и 0.4 гигафлопа за бакс в реале на дабле, причем это уже со стоимостью всего обвеса. Я конечно смог однажды на третьем стратиксе так отконвертить алгоритм, что его аналог на целочисленной арифметике функционировал с 900гфлопс эквивалентной производительности, но 150 стратикс все-таки не совсем дешев, итого те же 0.4гигафлопа за бакс, причем здесь только можно сказать об эквивалентных гигафлопах - в алгоритме умножение одно было отскалировано на сдвиг, все операции в целых числах, но именно этот алгоритм на ГПУ не через даблы был не реализуем. А если даблы на плиски честные делать, то, исходя из сегодняшних цен, если и 0.05гигафлопа за бакс получится, то сильно здорого. Если взять средний четырехядерный АМДшник, который стоит около 100 бакс, и на нем реально получить 20 гигафлопс на дабле ну совсем не напрягаясь (0.2гигафлопа на бакс), ИМХО, плискам пока только удел в интерфейсах, и энергоэкономных, переносимых, военных отраслях числа перемалывать. ЗЫ Что-то я задумался о своем, и не заметил, что топикстартер только о целочисленных операциях вопрошал. Почти все мною вышесказанное, переноситься из дабла и на целочисленные операции. На том же радеоне в целочисленной арифметике я терамипс на реальной задаче получал, а его пик, сложно подумать, 5.5терамипсов.
Сообщение отредактировал iiv - Apr 6 2011, 10:02
|
|
|
|
|
Apr 8 2011, 13:12
|
вопрошающий
    
Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436

|
Цитата(Oldring @ Apr 8 2011, 13:30)  "Терамипс" ? Вот представьте, что Вы хотите сказать то, о чем мы все подумали и у Вас получается или "типс" (то есть чаевые по-английски) или "тераипс" (при произношении "и" однозначно превратится в "е", а то и "ё"). Согласитесь, и то и другое очень не созвучно и на русском, и на английском языках. Так как в русском языке два корня в словах обычно объединяются гласной "о" из-за того, что эти корни оканчиваются на согласные, а, в нашем случае, имеет место полностью противоположная ситуация, вводим новое правило объединения корней русских заимствованных слов и используем красивую по звучанию буковку "м" получая терамипс! А Вам не наравится?
Сообщение отредактировал iiv - Apr 8 2011, 13:14
|
|
|
|
|
May 19 2011, 06:19
|
Участник

Группа: Свой
Сообщений: 74
Регистрация: 28-01-10
Из: Новосибирск
Пользователь №: 55 106

|
Цитата(iiv @ Apr 6 2011, 16:56)  ЗЫ Что-то я задумался о своем, и не заметил, что топикстартер только о целочисленных операциях вопрошал. Почти все мною вышесказанное, переноситься из дабла и на целочисленные операции. На том же радеоне в целочисленной арифметике я терамипс на реальной задаче получал, а его пик, сложно подумать, 5.5терамипсов. А вот целочисленные не надо валить в ту же кучу. Про плавающую запятую в принципе согласен, но дальше... Дальше всё очень сильно зависит алгоритма. Я как раз сейчас заканчиваю магистерскую на эту тему. Так вот, на вполне реальных задачах с целочисленной арифметикой из (к примеру) позорного XC6SLX9 за 500 рублей можно выжать штук 200 ваших "эквивалентных" гигафлопс. Ну или если я запутался в ваших единицах, то он тянет примерно 1/3 Tesla C1060. А если копнуть ещё чуть поглубже, и взять "алгоритмы-битоковырялки" (то есть не с целочисленной арифметикой, а с упором на сравнение/перестановку/операции с отдельными битами и малыми группами), то тот же чип может стать эквивалентом 10-20 (!) Tesla C1060. И это тоже на реальных задачах. Короче, есть задачи, на которых FPGA рвут GPU в клочья, и задач этих не так мало, поверьте.
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|