Я реализовывал билинейную интерполяцию, но, правда, программно. Делались варианты на обычном C++ (плав.точка), на MMX и на SSE2(целочисленные). Отдельно для уменьшения и для увеличения изображений. Был хороший рост производительности, особенно для уменьшения (экспоненциальный при росте коэффициента уменьшения). Если кому-то интересно, могу рассказать подрробнее.
|