Обращение матриц на ПЛИС - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Photo

Forum

Reviews

Help (!)

Форум разработчиков электроники ELECTRONIX.ru > Программируемая логика ПЛИС (FPGA,CPLD, PLD) > Работаем с ПЛИС, области применения, выбор

Обращение матриц на ПЛИС

Опции

jojo Просмотр профиля	Feb 3 2006, 18:29 Сообщение #1
Знающий Группа: Свой Сообщений: 574 Регистрация: 9-10-04 Из: FPGA-city Пользователь №: 827	Обращение матриц на ПЛИС Тут надо комплексную матрицу 16x16 обратить (эрмитову). Формат исходных данных int32, результат - не хуже float, лучше - double. Есть ли готовые мегафункции, не обязательно нелицензионные? Если кто-то делал похожее, интересно, сколько заняло ресурсов и какое быстродействие получилось. В нынешней реализации обращения на DSP используются квадратный корень и деление (вещественные), сложение, вычитание и умножение (комплексные). Хочу уменьшить нагрузку на DSP и разместить обращение матрицы в относитильно защищенной от взлома ПЛИС.

Ответов

Harbour Просмотр профиля	Feb 11 2006, 12:46 Сообщение #2
Местами Гуру Группа: Validating Сообщений: 1 103 Регистрация: 5-12-04 Пользователь №: 1 323	Прикинул на пальцах Ваши матрицы, вот чего вышло : - float был переделан в fixed point 32 бита (16/16) - sqrt был заменен заглушкой [ float sqrt(float v) { return v; } ] - под рукой не оказалось подходящей реализации - интерфейс к массивам был оставлен single-port async ram и выведен на пины (изврат конечно, никто не спорит) - для оценки взят камень EP1C20F400C6, так как пинов получилось в районе 256 : - clk - reset - start_processing - processing_inv_is_done - float d[32] out - просто регистр - float A[32] out - float A[32] in - A_addr[8] - A_we - float S[32] out - float S[32] in - S_addr[8] - S_we - float K[32] out - float K[32] in - K_addr[8] - K_we - async_ram_en - обчая линия - замечания по f() : - переменные kr и ki используются с неопределенным значением - опущены последние 4 строки f() Без какой либо особой оптимизации по скорости - for ex. 1 цикл остался тупо линейным, у меня вышло 2911 тактов на оценочной частоте 50Mhz. Предварительная оценка (т.е. максимум) данной f() по ресурсам такова : Device Utilization for EP1C20F400C: Resource Used Avail Utilization ----------------------------------------------- IOs 258 301 85.71% LCs 14216 20060 70.87% в квартусе : +--------------------------------------------------------------------------------+ ; Fitter Resource Usage Summary ; +---------------------------------------------+----------------------------------+ ; Resource ; Usage ; +---------------------------------------------+----------------------------------+ ; Total logic elements ; 13,909 / 20,060 ( 69 % ) ; ; -- Combinational with no register ; 13443 ; ; -- Register only ; 8; ; -- Combinational with a register ; 458; ; ;; ; Logic element usage by number of LUT inputs ;; ; -- 4 input functions ; 2577; ; -- 3 input functions ; 7711; ; -- 2 input functions ; 3472 ; ; -- 1 input functions ; 148 ; ; -- 0 input functions ; 1 ; ; ; ; ; Logic elements by mode ; ; ; -- normal mode ; 7024 ; ; -- arithmetic mode ; 6885 ; ; -- qfbk mode ; 102 ; ; -- register cascade mode ; 0 ; ; -- synchronous clear/load mode ; 466 ; ; -- asynchronous clear/load mode ; 0 ; ; ; ; ; Total LABs ; 1,528 / 2,006 ( 76 % ) ; ; Logic elements in carry chains ; 7119 ; ; User inserted logic elements ; 0 ; ; Virtual pins ; 0 ; ; I/O pins ; 258 / 301 ( 86 % ) ; ; -- Clock pins ; 2 / 2 ( 100 % ) ; ; Global signals ; 1 ; ; M4Ks ; 0 / 64 ( 0 % ) ; ; Total memory bits ; 0 / 294,912 ( 0 % ) ; ; Total RAM block bits ; 0 / 294,912 ( 0 % ) ; ; PLLs ; 0 / 2 ( 0 % ) ; ; Global clocks ; 1 / 8 ( 13 % ) ; +---------------------------------------------+----------------------------------+ Заводится эта фигня, если верить precision'у, а оснований не верить у нас нет, где-то на 65.062MHz, min period - 15.370 ns, квартус как всегда более консервативен : ; Worst-case tsu ; N/A ; None ; 26.537 ns S_rsc_singleport_data_out[3] ; inv_inv_proc_1\|slc_i32_l90_cse_24_ ; -- ; clk ; 0 ; ; Worst-case tco ; N/A ; None ; 164.411 ns ; inv_inv_proc_1\|div_div_b_17_ ; K_rsc_singleport_data_in[0] ; clk ; -- ; 0 ; ; Worst-case tpd ; N/A ; None ; 35.901 ns ; K_rsc_singleport_data_out[0] ; S_rsc_singleport_data_in[17] ; -- ; -- ; 0 ; ; Worst-case th ; N/A ; None ; -2.489 ns ; d[5] ; inv_inv_proc_1\|inv_d_5_ ; -- ; clk ; 0 ; ; Clock Setup: 'clk' ; 0.256 ns ; 50.00 MHz ( period = 20.000 ns ) ; 50.65 MHz ( period = 19.744 ns ) ; inv_inv_proc_1\|slc_i32_l90_cse_18_ ; inv_inv_proc_1\|inv_ai_1_26_ ; clk ; clk ; 0 ; ; Clock Hold: 'clk' ; 0.633 ns ; 50.00 MHz ( period = 20.000 ns ) ; N/A ; inv_inv_proc_1\|inv_q_1__4_1_0_ ; inv_inv_proc_1\|inv_q_1__4_1_0_ ; clk ; clk ; 0 ; ; Total number of failed paths ; ; ; ; ; ; ; ; 0 Если взять cyclone-2 (так как в проекте заюзаны mul и div), данные засунуть в internal dual-port ram, да еще потратить время на оптимизацию, то результат по ресурсам обычно можно сократить вдвое, а скорость поднять в 4 - 10 раз. Также приделывается нормальный интерфейс к данным и т.д. и т.п., короче шлифовать можно до опупения. Итого получаем грубо 2911 * 19.75ns = ~57.5 мкс (без учета sqrt) на _всю_ операцию в FGPA. Ваш ход, принц

Сообщений в этой теме

jojo Обращение матриц на ПЛИС Feb 3 2006, 18:29

cdg ИМХО если не за 1 такт надо, то с ПЛИС и не стоит ... Feb 7 2006, 08:58

jojo Да, я все больше убеждаюсь, что ПЛИС "дороже ... Feb 7 2006, 10:46

cdg В пору аспирантской юности, помнится сталкивался с... Feb 7 2006, 15:26

Harbour На плис проект будет работать все равно быстрее че... Feb 8 2006, 07:35

des00 Цитата(Harbour @ Feb 8 2006, 02:35) На пл... Feb 8 2006, 08:52

Harbour Это правда если сравнивать современные DSP с доист... Feb 9 2006, 09:34

dxp Цитата(Harbour @ Feb 9 2006, 15:34) Это п... Feb 9 2006, 10:57

jojo Думаю, по меньшей мере последние этапы обращения м... Feb 9 2006, 11:17

Harbour Цитата(dxp @ Feb 9 2006, 12:57) Цитата(Ha... Feb 9 2006, 14:48

dxp Цитата(Harbour @ Feb 9 2006, 20:48) Ну-ну... Feb 10 2006, 05:25

des00 Цитата(dxp @ Feb 10 2006, 00:25) И если у... Feb 10 2006, 06:07

des00 Ну в качестве примера, RLE кодирование большого ма... Feb 9 2006, 15:33

Harbour Как по мне так RLE параллелится, это сильно зависи... Feb 9 2006, 18:45

Harbour Цитата(dxp @ Feb 10 2006, 07:25) Цитата(H... Feb 10 2006, 06:53

dxp Цитата(Harbour @ Feb 10 2006, 12:53) Ну-у... Feb 10 2006, 07:18

des00 Цитата(Harbour @ Feb 10 2006, 01:53) Как ... Feb 10 2006, 08:09

Harbour Статей про распараллеливание рле полно в инете, во... Feb 10 2006, 10:50

des00 ЦитатаСтатей про распараллеливание рле полно в ине... Feb 10 2006, 11:49

Harbour Цитата(des00 @ Feb 10 2006, 13:49) Тут сл... Feb 10 2006, 12:56

jojo #include <math.h> Обращение выполняется за ... Feb 10 2006, 13:35

Harbour Прикинул на пальцах Ваши матрицы, вот чего вышло :... Feb 11 2006, 12:46

psL Код-----------------------------------------------... Feb 11 2006, 13:36

jojo В процессоре этап 1 выполняется за 14.3 мкс (7128 ... Feb 11 2006, 17:09

jojo Вытащил из процессора таблицу начальных приближени... Feb 13 2006, 10:53

« Предыдущая тема · Работаем с ПЛИС, области применения, выбор · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 12th August 2025 - 08:17