Цитата(AlexanderX @ Nov 22 2005, 05:51)

Угу, все так и выглядит. В первом блоке 4 умножителя, столько же во втором. Pipeline составляет 4 такта на каждый коеффициент, суммарно, на два блока с учетом транспонирования - около 80 тактов. Данные на вход могут подаваться без пауз. Рабочая частота для Cyclone II 8 speed grade составляет 160MHz и ограничивается умножителями. Код синтезируется и под Xilinx и под Altera.
Транспонирование на регистрах - забавно, каких-нибудь 1400 триггеров, плюс некоторое количество мультиплексоров и логика управления всем этим хозяйством - не, мы лучше как-нибудь с памятью поработаем

Хммм странно странно, что то в тактах много получаеться
насчет регистров забыл что у вас не 4*4 а 8*8 матрицы, если мне память не изменяет.
Я делал на ксалинксе ДКТ, 4*4 транспонировать матрицу на регистрах получилось быстрее и меньше по совокупному объему

(2 перемножителя + транспонирование).
правда дкт то было для h.264
считало это все с задеркой 8 тактов, расчитанно что матрица прилетает построчно
Кстати можно обойтись и без транспонирования вобще, да и над структурой матрицы немного репу почесать

)