реклама на сайте
подробности

 
 
> FFT корки из мегавизарда/корегена : как конфигурить?, выбор между V5 FX70 и СII 70 - стоит ли брать ксайлинкс?
yes
сообщение Dec 8 2010, 12:44
Сообщение #1


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



нужно получить максимальное количество преобразований в секунду, при этом lattency может быть достаточно большим (даже 100мкс для 2048 точек не страшно)
это подсчет сверток, поток входных данных достаточно узкий (предполагаемая схема без особой хитрости fft->(N).*ref->(N)ifft->max search), опорные последовательности загружаются заранее
таких блоков M
ну и М*N*(1/T) должно быть максимально для ПЛИС и может занимать все ресурсы ПЛИС
входные данные малоразрядные, но это вроде и не важно так как прямых fft мало, для ifft получаетсю 16разрядными, выход можно 16-ти разрядным с округлением/масштабированием в процессе

пока не могу соотнести два fft даташита ксайлинский и альтеровский
кажется, что V5 должен быть значительно лучше (ну что-то типа 400МГц против 100 у циклона, а стандартный алгоритм реализован наверно одинаково)
но из-за квартуса, было бы конечно удобнее пользовать циклон

но в даташитах

----------------
берем
Streaming Data Flow Engine 1024 точки width 16

для циклона 3 (второго там нет, ) в ug_fft.pdf написано в табл 1-3
Transform
Time (μs)
4.33 (fMAX (MHz) 237, тактов 1,024)

для ксайлинса xfft_ds260.pdf табличка 8
1k Str N 16 16 - частота 445МГц, но циклов 2171 и Latency (μs) = 4.88

то есть хуже чем для циклона

что за фигня???

V5 получается медленнее при том что это топ и умножители у него целый DSP48 блок?

-----------------

что я не понял? как-то плохо соображаю - нужна подсказка




Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
VladimirB
сообщение Dec 8 2010, 15:19
Сообщение #2


Знающий
****

Группа: Свой
Сообщений: 614
Регистрация: 12-06-09
Из: рядом с Москвой
Пользователь №: 50 219



Цитата(yes @ Dec 8 2010, 15:44) *
нужно получить максимальное количество преобразований в секунду, при этом lattency может быть достаточно большим (даже 100мкс для 2048 точек не страшно)
...
но в даташитах...

Если пошевелить мозгами то по-моему Альтера смухлевала.

У Альтеры, во всех таблицах для преобразования с длиной выборки N, число циклов, требуемых на преобразование, тоже равно N, а время преобразования тупо вычисляется как N делённое на тактовую частоту. В тоже время, для того чтобы преобразование началось мне нужно загрузить в ядро блок данных длиной N, что как раз и займёт столько же времени.

ИМХО варианта два: 1) Альтера не учитывает время загрузки данных, 2) либо она только его и учитывает (что судя по красивым цифрам - наиболее вероятно).

А по частоте как и положено Виртекс в 2 раза лучше Циклопа. Только ещё надо учесть, что у Виртекса самый медленный спидгрейд, а для какой скорости Циклопа меряла Альтера - ХЗ.

P.S. Альтера меряла для 6-й скорости Циклопа, которая судя по ценам самая быстрая. Мухлют буржуи sm.gif

P.P.S. У ксилинка написано что латентность меряется от начала загрузки первого байта данных до выдачи последнего байта преобразования.
А у Альтеры слово "latency" встречается всего 9 раз и все не в тему.

P.P.P.S. bb-offtopic.gif Поэтому я и не перевариваю даташиты от Альтеры - мутные они какие-то, кругом пальцы да ноги.
Go to the top of the page
 
+Quote Post
yes
сообщение Dec 8 2010, 16:15
Сообщение #3


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



спасибо

как я понял, мне нужна streaming (конвейерная/потоковая) реализация, которая имеет максимальную производительность (throughput)
там работает пайплайн и можно предположить, что для ксайлинса тоже будет 1024 такта для длины 1024,
при этом латентность (которая мне вобщем не критична) у альтеры скрыта(?), а у ксайлинса она побольше 1024

при этом у меня циклон 2 и по результатам синтеза/P&R в квартусе получается приблизительно вдвое меньше (90-110МГц), чем в даташите для C3

в то же время у виртекса получается 350-400 (тоже меньше, но по абсолютной величине получше sm.gif )

----------

но вопросы:
streaming жрет существенно больше ресурсов, чем burst
если я поставлю 2 burst-овых БПФера не получится ли так, что они посчитают быстрее, чем streaming посчитает 2 преобразования?
(по даташиту получается, что по скорости burst по основанию 4 в 3 раза медленнее, а ресурсов жрет в 1.5 раз меньше для моего случая, поэтому я и выбрал для начала потоковый, но может что-то упускаю?)

перебрать все варианты так сразу как-то трудно, хотелось бы получить пинок в нужном направлении

у ксайлинса вроде бы более разумно даташит написан - поэтому взял понятия оттуда

-----------

при этом альтеровские burst реализации пожирают больше ресурсов (QUAD OUTPUT память, а NUMBER OF ENGINES умножители и логику) при этом по даташиту затрачивают больше тактов, чем потоковая реализация
то есть вот так по даташиту вообще непонятно - нафига они нужны

скорее всего многоэнжинные бёрст реализации как раз таки дают выигрыш в латенси, который не показан для таблички streaming
но и у них DATA LOAD &TRANSFORM CALCULATION в тактах все-равно больше чем длина преобразования, а перекрытие блоков (конвееризация) достаточно маленькое - поэтому получается Nтактов=Msavples+ некая добавка
что тогда означаетотдельно TRANSFORM CALCULATION (который приблизительно пропорционален Msamples/Kengines)??? это только внутреняя гордость альтеровских бпфписателей?

======

как это пишут - дисклеймер : я не хочу опорочить альтеру, нужно понимать разницу в стоимости и прочем между виртексом 5 и циклоном 2. даже более - я бы предпочел циклон из-за квартуса и удобства железки.
но хотелось бы понять - как много я потеряю выбрав циклон
у меня два кИта, то есть стоимость железа не играет роли и вопрос, по-моему, имеет смысл

Go to the top of the page
 
+Quote Post
dmitry-tomsk
сообщение Dec 9 2010, 06:49
Сообщение #4


Знающий
****

Группа: Свой
Сообщений: 672
Регистрация: 18-02-05
Пользователь №: 2 741



Если сигнал узкополосный, то делать свертку через fft вообще смысла нет, делайте напрямую с прореживанием, умножителей в xilinx хватит.
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 19th July 2025 - 19:40
Рейтинг@Mail.ru


Страница сгенерированна за 0.01451 секунд с 7
ELECTRONIX ©2004-2016