Цитата(Methane @ Dec 8 2009, 19:14)

Но не на аппаратном уровне. На программном: прыгнули, все регистры выгрузили в стек, переключились, загрузили новый указатель стека, загрузили регистры из нового стека итд.
Simultaneous Multi-Threading для повышения производительности - там все на аппаратном уровне, и никаких лишних копирований.
Цитата(flipflop @ Dec 8 2009, 20:18)

Для навороченного ядра исполняемые инструкции могут вообще не совпадать со входными(оптимизация обращений к памяти, например). Так что просто проверять контрольные точки программы(результат), имхо. Обнаружили ошибку - посеять дополнительные точки. Либо детально описывать все нюансы RTL-поведения(SVA) - на порядок больше работы(за ту-же зарплату).
Цитата
Внутренней. Block Ram
Тогда советую пересмотреть архитектуру(если проц не для ASIC) и/или HDL-описание(избегать "case"-стиля описания АЛУ и др блоков) - кэши/MMU и тп призваны оптимизировать обращения к внешней памяти FPGA.
Цитата(Methane @ Dec 8 2009, 19:14)


У меня все проще, некоторыми идеями аппаратной многопоточности воспользовался только для организации прерываний и выполнения фоновых задач, не для повышения производительности.