Цитата(Sekat @ Sep 10 2013, 17:07)

Есть ли какие элегантные способы для STM32F4
Попробуйте замапить ОЗУ на нулевой адрес (SYSCFG_MEMRMP), должно стать быстрее. Да, ну и код выполнять из адресов 0x00******, а не 0x20******. Дело в том, что инструкции из 0x20****** идут в процессор через шину System Interface, в она вносит лишний такт задержки на каждую инструкцию и не умеет заглатывать две 16-битные инструкции в один присест, в отличие от шины ICode.
В мануале на процессор это расписано, и вот
тут сегодня тоже обсуждалось.