реклама на сайте
подробности

 
 
> Улучшение аппаратного алгоритма 4x4 luma prediction, Реализация в ПЛИС H.264 - Intra Prediction
Kopart
сообщение Feb 14 2008, 13:11
Сообщение #1


Знающий
****

Группа: Свой
Сообщений: 601
Регистрация: 1-03-05
Из: Spb
Пользователь №: 2 972



Вопрос к тем кто реализовывал данный алгоритм. Кто как оптимизировал реализацию в ПЛИС этого алгоритма по критерию занимаемых ресурсов (LUT4).

Подскажите есть ли в интернет что почитать в плане оптимальной (Hardware) структуры в ПЛИС алгоритма 4x4 Intra prediction. Или может кто подскажет по своему опыту "куда смотреть".

*Задача возникла потому, что появилось предположение, что можно реализовать с более оптимальной по ресурсам структуре этот алгоритм.
В существующей реализации DC prediction mode - обрабатывается отдельно от остальных восьми режимов.
Соответсвенно предполагаю, что эти оставшиеся 8 режимов имеют "общие вычисления", которые и можно оптимизировать в двух тактном конвейере.

Подскажите (или направьте где почитать) в плане оптимальной (по ресурсам) реализации для оставшихся 8 режимов 4х4 prediction.


--------------------
Насколько проще была бы жизнь, если бы она была в исходниках
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
des00
сообщение Feb 14 2008, 14:42
Сообщение #2


Вечный ламер
******

Группа: Модераторы
Сообщений: 7 248
Регистрация: 18-03-05
Из: Томск
Пользователь №: 3 453



Цитата(NiOS @ Feb 14 2008, 08:11) *
Вопрос к тем кто реализовывал данный алгоритм. Кто как оптимизировал реализацию в ПЛИС этого алгоритма по критерию занимаемых ресурсов (LUT4).

Подскажите есть ли в интернет что почитать в плане оптимальной (Hardware) структуры в ПЛИС алгоритма 4x4 Intra prediction. Или может кто подскажет по своему опыту "куда смотреть".

*Задача возникла потому, что появилось предположение, что можно реализовать с более оптимальной по ресурсам структуре этот алгоритм.
В существующей реализации DC prediction mode - обрабатывается отдельно от остальных восьми режимов.
Соответсвенно предполагаю, что эти оставшиеся 8 режимов имеют "общие вычисления", которые и можно оптимизировать в двух тактном конвейере.

Подскажите (или направьте где почитать) в плане оптимальной (по ресурсам) реализации для оставшихся 8 режимов 4х4 prediction.


ух ты. кто-то еще не бросил бессмысленную затею сделать нормальный h.264 и его клонов на фпга %)

Раскажите каких успехов добились ? smile.gif HD 1080 CABAC, IPBBB, MBAFF работает в реалтайме ?

По сабжу задача некорректно поставлена. 4x4 интра имеет 9 мод, которые определяются доступностью соседей и если соседи доступны их можно (предикторы) считать одновременно. Последовательный расчет предикторов затруднен, ибо там математика слишком разная (например поворот на 22 градуса (если правильно помню)).

Потом еще нужно посчитать разностные блочки и только затем SAD. вот это можно законвееризировать.

А самая большая Ж... для предсказания берутся востановленые соседи. Т.е. те что прошли Compensation -> DCT->Quant -> DeQuant -> IDCT -> DeCompensation.

Естественный способ ускорения алгоритма - диагональный проход по блочкам.

Вот такие наброски.


ЗЫ. Раскажите каких успехов то добились ? smile.gif

ЗЗЫ. А зачем вы реализуете геморойные моды на интра ? , куда уж лучше затащить партицирование на интер. это даст больше толку. Или у вас I frame only и CIF ? тогда смысла ФПГА ставить никакого.


--------------------
Go to the top of the page
 
+Quote Post
Kopart
сообщение Feb 14 2008, 15:14
Сообщение #3


Знающий
****

Группа: Свой
Сообщений: 601
Регистрация: 1-03-05
Из: Spb
Пользователь №: 2 972



Цитата(des00 @ Feb 14 2008, 17:42) *
4x4 интра имеет 9 мод, которые определяются доступностью соседей и если соседи доступны их можно (предикторы) считать одновременно.

Видеокодинг для меня это новое - поэтому привести сравнительные результаты пока не могу.

Пока у меня стоит вполне определенная хардверно-оптимизаторская задача:
Её я и процитировал в Вашем ответе. Те нужно считать "одновременно". Но пока постановка, что считать надо только 8 мод (без DC) и есть конвеер на два стейджа для данных + еще один предварительный стейдж на подготовку mux'ров для текущей моды.

Те частная задача реализации 8 мод придикции (с оптимизацие по ресурсам) для 2 тактного конвейера.

Вот и спрашиваю - может кто реализовывал такое...


--------------------
Насколько проще была бы жизнь, если бы она была в исходниках
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 16th July 2025 - 07:45
Рейтинг@Mail.ru


Страница сгенерированна за 0.01383 секунд с 7
ELECTRONIX ©2004-2016