Цитата(DASM @ Nov 21 2013, 21:52)

в случае 32 битной и вне кеша — это даже не в четыре раза потеря, поболее может быть вроде как. char *
Дык наверно так делают, чтобы получить любое кол-во копируемых байт, а не кратно 4м. Например, как такой операцией скопировать 5 или 6 байт? 32х бытовое копирование запросит как минимум 8, а если память выделена только под 5?
Если уж так важна скорость, и объемы копирования не 10 байт, а значительно больше - используйте DMA в 32х битном режиме...