1. Вариант с табличным преобразованием для 8 бит очень даже хорошо смотрится. Для 16 бит и тем более 32 размер таблицы становится ого-го. Поэтому см. Вариант получения двоичной инверсии битов 32-разрядного числа на C:
x = (x & 0x55555555) << 1 | (x & 0xAAAAAAAA) >> 1;
x = (x & 0x33333333) << 2 | (x & 0xCCCCCCCC) >> 2;
x = (x & 0x0F0F0F0F) << 4 | (x & 0xF0F0F0F0) >> 4;
x = (x & 0x00FF00FF) << 8 | (x & 0xFF00FF00) >> 8;
x = (x & 0x0000FFFF) << 16 | (x & 0xFFFF0000) >> 16;
Кстати для 8 бит (не так быстро как таблица или asm, но зато на С):
x = (x & 0x55) << 1 | (x & 0xAA) >> 1;
x = (x & 0x33) << 2 | (x & 0xCC) >> 2;
x = (x & 0x0F) << 4 | (x & 0xF0) >> 4;
2. Не знаю зачем Вам двоичная инверсия битов. Но если для перестановки элементов массива в двоично-инверсном порядке (бит-реверсивном), например для FFT, то есть очень эффективный алгоритм см.
Алгоритмы для Программеров . Там pdf с целой кучей алгоритмов, для каждого есть примеры программ на С.