Ну так сделали уже, не замучились

Правда я сам лично занимался только упаковкой потока в битстрим с помощью CABAC/CAVLC. Решение этой подзадачина ПЛИС где-то в 30-40 раз быстрее DSP C64x от TI при равных тактовых частотах. Но и с учетом преимущества процессора по частоте получалось где-то в 6-8 раз быстрее уже в железе. Так что задача имеет смысл. Практика внедрений показала, что заказчикам порой нужны очень разнообразные фичи от стандарта, от простых до сложных. Охватить это одним чипом ASIC может быть нелегко в смысле эффективности. А в ПЛИС это все конфигурируется на этапе сборки проекта под конкретные требования к качеству, скорости обработки, скорости канала и т.п. В общем как-то так.