Может кто сталкивался с задачей вычислений 16бит float (*, +, -, 1/sqrt) с оптимизацией для модуля MAC микроконтроллеров фирмы SiLabs?

Хотелось бы обменяться опытом, а точнее: не писать новую библиотеку, а заточить какую-либо существующую под матричные(4x4) операции.

P.S. Что такое 16 бит float и чем это грозит ознакомлен. Применить DSP низя, там нет встроенной flash памяти программ.