там стоит 4-х портовая память (2 банка распределенной памяти RAMxD32).
порты записи объеденены в один - получаем порт чтения/записи
+ 2 порта только на чтение. Кста сделав то же самое на блочной памяти можно получить 512 регистров по 32 бита, НО 1 такт латентности на чтение, но тогда ломаеться 3-х тактный конвейер => что то похожее на ниос получаеться

похоже именно так и сдели в микроблейзе 5 ом (5 ти тактный конвейер).