да, теперь все четко, вот код теста на VC:
Код
int _tmain(int argc, _TCHAR* argv[])
{
for (unsigned int i = 0; i < 0xFFFFFFFF; i++)
{
unsigned int N = i >> 1;
unsigned int result;
result = (((N >> 16) + 1) * 0x3333) & 0xFFFF0000;
N = N - result * 5 + 1;
N += N >> 16;
result |= (N * 0x3333) >> 16;
if (result != (i / 10))
{
printf("\nError: i = %X i / 10 = %X result = %X\n",i , i / 10, result);
break;
}
if ((i & 0xFFFF) == 0) printf("\r i = %X", i);
}
return 0;
}
Цитата(=GM= @ Apr 26 2011, 19:37)

Чёт не всё понимаю. Вроде бы поначалу борьба шла за малое количество используемых регистров. А сейчас за што бодаетесь?
Скорость при разумном количестве используемых регистров.
То есть по регистрам не хуже чем стандартное деление,
а по скорости намного выше.
теперь осталось деление на 100
для 100 разрядности все равно не хватает
то есть понятно что можно поделить на 4 потом на 5 и еще на 5
но это всего в 2,5раза лучше стандартного деления
есть идеи ?