Цитата(iiv @ May 15 2013, 20:30)

...
Я смог получить около 60МФлоп/с на регистрах, 20МФлоп/с (линейный доступ) 2МФлоп/с (случайный доступ) при работе с общей памятью. Разницы одинарная или двойная точность почти не видно, есть, но не в два раза, а примерно в 20-30%.
...
Перепробовал кучу опций компиляции, похоже, что -Ofast без ничего другого показывает самые лучшие результаты, пробовал и неон включать, и vf*v3 но только хуже стало.
В связи с этим, возникают вопросы
1. какой реально достижимый пик на этом процессоре на плавающей точке,
2. может ли кто-то поделиться правильными опциями компиляции и примером в несколько строк где бы серьезно больше 60МФлоп/с получалось бы?
Не знаю, поможет или нет, но вот
тут пишут, что включать надо одновременно и VFPv3 и neon опции. И еще до кучи с полдюжины других условий надобно соблюсти. А так, похоже, что работает только VFP сопроцессор, у него как раз 10...30 тактов на команду уходит.