реклама на сайте
подробности

 
 
> Создание своего Floating-Point Unit, Стоит ли?
BlackOps
сообщение May 30 2012, 15:01
Сообщение #1


Знающий
****

Группа: Свой
Сообщений: 618
Регистрация: 7-06-08
Из: USSR
Пользователь №: 38 121



Я сейчас использую FPU модули от Xilinx в разных проектах, там их можно в коргене конфигурировать, скажем например умножение двух 32bit FPU чисел с использованием четырей хард мультипликаторов в чипе занимает 12 клоков, работать может примерно на чуть больше 200МГц.


Думаю как появится свободное время написать свои, но мне интерестно а стоит ли? т.е. инженеры в Xilinx уже выжали максимум при составлении этих FPU корок или же если постаратся можно сделать свой который будет работать быстрее? Скажем хотябы 300МГц или чтото вроде того?


тоже самое хотелось бы узнать и про Альтеру и их корки.

одними словом, стоит ли сделать унифицированные FPU корки которые бы работали быстрее чем заводские? или максимум там уже достигнут?

(смотрел в нете тоже, но там они какие то корявые и непонятно написанные)

кто нибудь писал свои ФПУ корки, достигал скорости быстрее корок Ксайлинкс?


--------------------
Нажми на кнопку - получишь результат, и твоя мечта осуществится
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Timmy
сообщение Jun 2 2012, 07:15
Сообщение #2


Знающий
****

Группа: Участник
Сообщений: 835
Регистрация: 9-08-08
Из: Санкт-Петербург
Пользователь №: 39 515



Цитата(BlackOps @ May 30 2012, 19:01) *
Я сейчас использую FPU модули от Xilinx в разных проектах, там их можно в коргене конфигурировать, скажем например умножение двух 32bit FPU чисел с использованием четырей хард мультипликаторов в чипе занимает 12 клоков, работать может примерно на чуть больше 200МГц.

кто нибудь писал свои ФПУ корки, достигал скорости быстрее корок Ксайлинкс?

Это под какой чип? На Spartan3e-5 максимальная латентность умножителя 6 клоков, чтоб была 12, надо включить ещё и мультицикл 2. Ксайлинковский перемножитель реализуется неоптимально, там ставится 42-х разрядный сумматор, который режет частоту до 188МГц, его можно конвейеризовать. При том, что максимальная скорость аппаратных перемножителей - 270МГц, и надо выходить именно на неё. Так что написать улучшенную корку есть смысл. Но универсально под любую архитектуру вряд ли получится, если хотим максимальной эффективности.
Go to the top of the page
 
+Quote Post
BlackOps
сообщение Jun 6 2012, 19:31
Сообщение #3


Знающий
****

Группа: Свой
Сообщений: 618
Регистрация: 7-06-08
Из: USSR
Пользователь №: 38 121



Цитата(Timmy @ Jun 2 2012, 11:15) *
Это под какой чип? На Spartan3e-5 максимальная латентность умножителя 6 клоков, чтоб была 12, надо включить ещё и мультицикл 2. Ксайлинковский перемножитель реализуется неоптимально, там ставится 42-х разрядный сумматор, который режет частоту до 188МГц, его можно конвейеризовать. При том, что максимальная скорость аппаратных перемножителей - 270МГц, и надо выходить именно на неё. Так что написать улучшенную корку есть смысл. Но универсально под любую архитектуру вряд ли получится, если хотим максимальной эффективности.

спартан6, xc6slx25, xc6slx150t
спасибо, ясно.


--------------------
Нажми на кнопку - получишь результат, и твоя мечта осуществится
Go to the top of the page
 
+Quote Post

Сообщений в этой теме


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 22nd July 2025 - 23:32
Рейтинг@Mail.ru


Страница сгенерированна за 0.01388 секунд с 7
ELECTRONIX ©2004-2016