Цитата(Alexey Lukin @ Feb 17 2011, 23:34)

В современных библиотеках FFT имеется несколько вариантов кода. Во время выполнения их скорость замеряется и выбирается тот вариант, который быстрее на данной системе. Большое значение имеет не только число умножений и сложений, но и эффективность использования кеш-памяти процессора.
100% так. Если на РС, то лучше не выдумывать, а взять библиотеки Intel MKL или IPP - и получить скорость в 2-8 раз выше, чем при использовании самописного (хоть и на ассемблере) алгоритма. И эти MKL очень хорошо работают на самых разных конфигурациях. И кеш-память - тоже очень важная штука, если данные не влазят в кеш а постоянно подгребаются извне - скорость падает в разы.
О сколько нам открытий чудных ...