Цитата(SFx @ Jan 23 2010, 20:00)

FPGA, да будет быстрее чем коре2 перемножает, за счет параллельности. но вот на CUDE FPGA выходит в аутсайд из-за того что FPU в GPU много штук и они еще и работают в разы быстрее из-за того что они железные
Они все железные.
ПК начинает сильно отставать как только матрица не помещается в кэше. На больших матрицах видели падение производительности до порядка 60 - 30 MMAC (это на CORE 2), в тоже время наше железо на тех же данных показывало 280 ММAC. На малых матрицах производитедьность ПК была немного повыше.
Видимо и FPU в GPU не намного поднимут призводительность матричных вычислений, все упрётся в доступ к данным.