нужно получить максимальное количество преобразований в секунду, при этом lattency может быть достаточно большим (даже 100мкс для 2048 точек не страшно)
это подсчет сверток, поток входных данных достаточно узкий (предполагаемая схема без особой хитрости fft->(N).*ref->(N)ifft->max search), опорные последовательности загружаются заранее
таких блоков M
ну и М*N*(1/T) должно быть максимально для ПЛИС и может занимать все ресурсы ПЛИС
входные данные малоразрядные, но это вроде и не важно так как прямых fft мало, для ifft получаетсю 16разрядными, выход можно 16-ти разрядным с округлением/масштабированием в процессе
пока не могу соотнести два fft даташита ксайлинский и альтеровский
кажется, что V5 должен быть значительно лучше (ну что-то типа 400МГц против 100 у циклона, а стандартный алгоритм реализован наверно одинаково)
но из-за квартуса, было бы конечно удобнее пользовать циклон
но в даташитах
----------------
берем
Streaming Data Flow Engine 1024 точки width 16
для циклона 3 (второго там нет, ) в ug_fft.pdf написано в табл 1-3
Transform
Time (μs)
4.33 (fMAX (MHz) 237, тактов 1,024)
для ксайлинса xfft_ds260.pdf табличка 8
1k Str N 16 16 - частота 445МГц, но циклов 2171 и Latency (μs) = 4.88
то есть хуже чем для циклона
что за фигня???
V5 получается медленнее при том что это топ и умножители у него целый DSP48 блок?
-----------------
что я не понял? как-то плохо соображаю - нужна подсказка