Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Создание своего Floating-Point Unit
Форум разработчиков электроники ELECTRONIX.ru > Программируемая логика ПЛИС (FPGA,CPLD, PLD) > Работаем с ПЛИС, области применения, выбор
BlackOps
Я сейчас использую FPU модули от Xilinx в разных проектах, там их можно в коргене конфигурировать, скажем например умножение двух 32bit FPU чисел с использованием четырей хард мультипликаторов в чипе занимает 12 клоков, работать может примерно на чуть больше 200МГц.


Думаю как появится свободное время написать свои, но мне интерестно а стоит ли? т.е. инженеры в Xilinx уже выжали максимум при составлении этих FPU корок или же если постаратся можно сделать свой который будет работать быстрее? Скажем хотябы 300МГц или чтото вроде того?


тоже самое хотелось бы узнать и про Альтеру и их корки.

одними словом, стоит ли сделать унифицированные FPU корки которые бы работали быстрее чем заводские? или максимум там уже достигнут?

(смотрел в нете тоже, но там они какие то корявые и непонятно написанные)

кто нибудь писал свои ФПУ корки, достигал скорости быстрее корок Ксайлинкс?
Timmy
Цитата(BlackOps @ May 30 2012, 19:01) *
Я сейчас использую FPU модули от Xilinx в разных проектах, там их можно в коргене конфигурировать, скажем например умножение двух 32bit FPU чисел с использованием четырей хард мультипликаторов в чипе занимает 12 клоков, работать может примерно на чуть больше 200МГц.

кто нибудь писал свои ФПУ корки, достигал скорости быстрее корок Ксайлинкс?

Это под какой чип? На Spartan3e-5 максимальная латентность умножителя 6 клоков, чтоб была 12, надо включить ещё и мультицикл 2. Ксайлинковский перемножитель реализуется неоптимально, там ставится 42-х разрядный сумматор, который режет частоту до 188МГц, его можно конвейеризовать. При том, что максимальная скорость аппаратных перемножителей - 270МГц, и надо выходить именно на неё. Так что написать улучшенную корку есть смысл. Но универсально под любую архитектуру вряд ли получится, если хотим максимальной эффективности.
BlackOps
Цитата(Timmy @ Jun 2 2012, 11:15) *
Это под какой чип? На Spartan3e-5 максимальная латентность умножителя 6 клоков, чтоб была 12, надо включить ещё и мультицикл 2. Ксайлинковский перемножитель реализуется неоптимально, там ставится 42-х разрядный сумматор, который режет частоту до 188МГц, его можно конвейеризовать. При том, что максимальная скорость аппаратных перемножителей - 270МГц, и надо выходить именно на неё. Так что написать улучшенную корку есть смысл. Но универсально под любую архитектуру вряд ли получится, если хотим максимальной эффективности.

спартан6, xc6slx25, xc6slx150t
спасибо, ясно.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.