Цитата(messenger @ Aug 15 2009, 20:28)

Мне нужно ровно в два раза меньше.
Можно "раскатать" цикл в линейную структуру, где каждый бит будет устанавливаться напрямую, без сдвигов. Некрасиво и места много занимает, зато быстро. А если еще и написать все на ассемблере - то быстрее не бывает.