реклама на сайте
подробности

 
 
> FFT корки из мегавизарда/корегена : как конфигурить?, выбор между V5 FX70 и СII 70 - стоит ли брать ксайлинкс?
yes
сообщение Dec 8 2010, 12:44
Сообщение #1


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



нужно получить максимальное количество преобразований в секунду, при этом lattency может быть достаточно большим (даже 100мкс для 2048 точек не страшно)
это подсчет сверток, поток входных данных достаточно узкий (предполагаемая схема без особой хитрости fft->(N).*ref->(N)ifft->max search), опорные последовательности загружаются заранее
таких блоков M
ну и М*N*(1/T) должно быть максимально для ПЛИС и может занимать все ресурсы ПЛИС
входные данные малоразрядные, но это вроде и не важно так как прямых fft мало, для ifft получаетсю 16разрядными, выход можно 16-ти разрядным с округлением/масштабированием в процессе

пока не могу соотнести два fft даташита ксайлинский и альтеровский
кажется, что V5 должен быть значительно лучше (ну что-то типа 400МГц против 100 у циклона, а стандартный алгоритм реализован наверно одинаково)
но из-за квартуса, было бы конечно удобнее пользовать циклон

но в даташитах

----------------
берем
Streaming Data Flow Engine 1024 точки width 16

для циклона 3 (второго там нет, ) в ug_fft.pdf написано в табл 1-3
Transform
Time (μs)
4.33 (fMAX (MHz) 237, тактов 1,024)

для ксайлинса xfft_ds260.pdf табличка 8
1k Str N 16 16 - частота 445МГц, но циклов 2171 и Latency (μs) = 4.88

то есть хуже чем для циклона

что за фигня???

V5 получается медленнее при том что это топ и умножители у него целый DSP48 блок?

-----------------

что я не понял? как-то плохо соображаю - нужна подсказка




Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Shtirlits
сообщение Dec 9 2010, 07:39
Сообщение #2


Знающий
****

Группа: Свой
Сообщений: 845
Регистрация: 18-10-04
Из: Pereslavl-Zalessky, Russian Federation
Пользователь №: 905



А в потоковом память-то зачем вообще?

Если в virtex-5 память почти не тормозит по сравнению с максимумом клокового дерева, то в третьем циклоне память заметно медленнее. Stratix-IV в плане умножителей и памятей выглядит не столь привлекательно, как virtex-5.
Go to the top of the page
 
+Quote Post
yes
сообщение Dec 9 2010, 11:16
Сообщение #3


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



еще раз спасибо,

что я понял :

в потоковом ресурсов больше и так (DSP) и этак (BRAM) : память там есть в каждой ступеньке, а в burst реализациях одна память и туда-сюда

пока непонятно - зачем альтеровцам burst реализации, потребляющие кучу ресурсов и имеющее маленькое внутреннее время преобразования, при том, чтобы выкачать данные все-равно надо N+ тактов?

также минусом альтеры считаю автоматическое внутреннее маштабирование - что там с шумами будет? мне, как человеку плавающему в тематике, это не понятно. и еще для алгоритмов поиска придется нормировать выход БПФ
как-то это пугает

-----

у ксайлинса очень понравилось скэйлинг скедьюл и выход overflow - то есть по-моему все правильно (это Scaling), и ресурсов жреть меньше и промоделировать можно. ну а если совсем понадобится - то и скэйлингом этим можно управлять

======

по поводу задачи - ну это поиск по задержки, поэтому считать просто свертки или согласованным фильтром - получается хуже по ресурсам и по времени
согласованный фильтр такой лезет в эти ПЛИС 1-2 шт и скорость у него поменьше, а FFT+IFFT лезет штук 5 (и при этом логики остается)
если делать сумматор не пирамидальным, а на DSP блоках многотактным, то это еще по производительности проигрыш
вобщем пока БПФ кажется самое подходящее


Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 23rd July 2025 - 17:19
Рейтинг@Mail.ru


Страница сгенерированна за 0.01373 секунд с 7
ELECTRONIX ©2004-2016