FPU ядро в STM32F4 - сказка. За время работы очень привык и к скорости и к прозрачности работы. Но вот тут потребовалось использовать не обычный float, а double. И вот тут, посмотрев на библиотечную функцию умножения Microlib, я ужаснулся. Вычисления осуществляются через перевод в uint32. А деление - вообще катастрофа, даже без использования аппаратных умножений или делений.
Подскажите - а побыстрее (на порядок желательно), например с использованием FPU и простого float - никак? Существуют ли такие алгоритмы в принципе?