Update: Новые времена - новые контроллеры - новые времянки.
На STM32F207 @ 120 MHz/3 waitstate - время переключения контекста 1.280 uS
На STM32F407 @ 168 MHz/5 waitstate, ART prefetch ON, no FPU - время переключения контекста 0.904 uS
Таки контроллеры становятся быстрее и быстрее