Цитата(VslavX @ Jul 30 2011, 18:38)

Будет время - я попрофайлю свой стек, потому как не совсем понятно куда время процессорное ушло.
Много времени прошло

Прикрутил к своему стеку ответную часть к iperf (теперь все цифры показывает iperf, довольно точно совпадает с внутренней измериловкой), сделал рефакторинг подсистемы аллокации/освобождения буферов, еще всякие мелочи
Достижения для LPC1768@100 такие (полезного TCP потока, из теоретически возможных ~96Mbps):
- передача на удаленный хост 88.8Mbps при 75-процентной загрузке проца
- прием от удаленного хоста 79.1Mbps при 85-процентной загрузке проца
На все сетевые буфера взято 16К памяти. Отключение контроля IP/TCP сумм дает примерно 20 процентов процессороного времени - на STM32F2xx с аппартными суммами станет полегче с загрузкой.
MPC8347@533MHz с гигабитным портом на оптимизацию кода отреагировал значительно более бурно,
было 398Mbps на прием, и 280MBps на передачу при ~100-процентной загрузке, после оптимизации
- передача на удаленный хост 343Mbps при 60-процентной загрузке проца
- прием от удаленного хоста 832Mbps при 70-процентной загрузке проца
Предположительно передатчик тормозится системой предотвращения заторов - наверное буду еще разбираться.
Да, все фреймы обычные - 1518 байт, на Джумбе должно быть еще немного веселее