Делал но на Spartan3, длиной 32-1024 отсчета, 18 бит, 6нс (можно до 5нс довести но мне было не нужно) на точку (или 12нс на бабочку разрядности 2), соответственно 1024 точки 10*1024*6нс+6нс*длину конвейера (у меня порядка 10)+загрузка/выгрузка (у меня одновременно, порядка 6нс*(1024+5)). Занимает это все у меня 4 умножителя, 3 блока памяти и 600lut. В виртексе кмк должно быть сильно быстрее все. Если хочется еще быстрее нужно ставить бабочки в параллель (для начала radix4 сделать).
|