Я отнюдь не считаю что это бесперспективно. Наоборот, за этим будущее вообще всех вычислений. Просто существующая база (читай FPGA) не позволяет сделать эту технологию распространенной и дешевой.
Максимум что ты можешь сейчас сделать - профилировать свою программу и выделить из нее особо емкие (в смысле времении и объема) куски кода, которые можно будет реализовать аппаратно (в том числе и программно многократно перезагружая при этом аппаратный ускоритель - реконфигурируя). Т.е. изначально ограниченное хотя и очень интересное решение. А вот если бы было стандартное (в определенном смысле) железо и умный компилятор для него (точнее компилятор совмещенный с синтезатором) то ...
Я не жду блюдечка, и мне тоже не особо приятно следовать за нашими желтыми братьями

, но мне не хватит образования сделать что-то в этой области самому, к сожалению

А тема эта очень интересна и я думаю она будет очень быстро развиваться в ближайшем будущем.