|
FFT корки из мегавизарда/корегена : как конфигурить?, выбор между V5 FX70 и СII 70 - стоит ли брать ксайлинкс? |
|
|
|
Dec 8 2010, 12:44
|
Гуру
     
Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640

|
нужно получить максимальное количество преобразований в секунду, при этом lattency может быть достаточно большим (даже 100мкс для 2048 точек не страшно) это подсчет сверток, поток входных данных достаточно узкий (предполагаемая схема без особой хитрости fft->(N).*ref->(N)ifft->max search), опорные последовательности загружаются заранее таких блоков M ну и М*N*(1/T) должно быть максимально для ПЛИС и может занимать все ресурсы ПЛИС входные данные малоразрядные, но это вроде и не важно так как прямых fft мало, для ifft получаетсю 16разрядными, выход можно 16-ти разрядным с округлением/масштабированием в процессе
пока не могу соотнести два fft даташита ксайлинский и альтеровский кажется, что V5 должен быть значительно лучше (ну что-то типа 400МГц против 100 у циклона, а стандартный алгоритм реализован наверно одинаково) но из-за квартуса, было бы конечно удобнее пользовать циклон
но в даташитах
---------------- берем Streaming Data Flow Engine 1024 точки width 16
для циклона 3 (второго там нет, ) в ug_fft.pdf написано в табл 1-3 Transform Time (μs) 4.33 (fMAX (MHz) 237, тактов 1,024)
для ксайлинса xfft_ds260.pdf табличка 8 1k Str N 16 16 - частота 445МГц, но циклов 2171 и Latency (μs) = 4.88
то есть хуже чем для циклона
что за фигня???
V5 получается медленнее при том что это топ и умножители у него целый DSP48 блок?
-----------------
что я не понял? как-то плохо соображаю - нужна подсказка
|
|
|
|
|
 |
Ответов
|
Dec 9 2010, 11:16
|
Гуру
     
Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640

|
еще раз спасибо,
что я понял :
в потоковом ресурсов больше и так (DSP) и этак (BRAM) : память там есть в каждой ступеньке, а в burst реализациях одна память и туда-сюда
пока непонятно - зачем альтеровцам burst реализации, потребляющие кучу ресурсов и имеющее маленькое внутреннее время преобразования, при том, чтобы выкачать данные все-равно надо N+ тактов?
также минусом альтеры считаю автоматическое внутреннее маштабирование - что там с шумами будет? мне, как человеку плавающему в тематике, это не понятно. и еще для алгоритмов поиска придется нормировать выход БПФ как-то это пугает
-----
у ксайлинса очень понравилось скэйлинг скедьюл и выход overflow - то есть по-моему все правильно (это Scaling), и ресурсов жреть меньше и промоделировать можно. ну а если совсем понадобится - то и скэйлингом этим можно управлять
======
по поводу задачи - ну это поиск по задержки, поэтому считать просто свертки или согласованным фильтром - получается хуже по ресурсам и по времени согласованный фильтр такой лезет в эти ПЛИС 1-2 шт и скорость у него поменьше, а FFT+IFFT лезет штук 5 (и при этом логики остается) если делать сумматор не пирамидальным, а на DSP блоках многотактным, то это еще по производительности проигрыш вобщем пока БПФ кажется самое подходящее
|
|
|
|
Сообщений в этой теме
yes FFT корки из мегавизарда/корегена : как конфигурить? Dec 8 2010, 12:44 vadimuzzz Цитата(yes @ Dec 8 2010, 18:44) что за фи... Dec 8 2010, 12:56 VladimirB Цитата(yes @ Dec 8 2010, 15:44) нужно пол... Dec 8 2010, 15:19 yes спасибо
как я понял, мне нужна streaming (конвейе... Dec 8 2010, 16:15  dmitry-tomsk Если сигнал узкополосный, то делать свертку через ... Dec 9 2010, 06:49  VladimirB Цитата(yes @ Dec 8 2010, 19:15) спасибо..... Dec 9 2010, 07:15 RobFPGA Приветствую!
В общем случае памяти в бурст и ... Dec 9 2010, 11:39 yes Цитата(RobFPGA @ Dec 9 2010, 14:39) А что... Dec 9 2010, 12:31
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|