Цитата(BlackOps @ May 30 2012, 19:01)

Я сейчас использую FPU модули от Xilinx в разных проектах, там их можно в коргене конфигурировать, скажем например умножение двух 32bit FPU чисел с использованием четырей хард мультипликаторов в чипе занимает 12 клоков, работать может примерно на чуть больше 200МГц.
кто нибудь писал свои ФПУ корки, достигал скорости быстрее корок Ксайлинкс?
Это под какой чип? На Spartan3e-5 максимальная латентность умножителя 6 клоков, чтоб была 12, надо включить ещё и мультицикл 2. Ксайлинковский перемножитель реализуется неоптимально, там ставится 42-х разрядный сумматор, который режет частоту до 188МГц, его можно конвейеризовать. При том, что максимальная скорость аппаратных перемножителей - 270МГц, и надо выходить именно на неё. Так что написать улучшенную корку есть смысл. Но универсально под любую архитектуру вряд ли получится, если хотим максимальной эффективности.