реклама на сайте
подробности

 
 
> Графический фильтр на Cortex-M7, Увеличение ровно в 2 раза
__inline__
сообщение Jul 16 2018, 05:35
Сообщение #1


Местный
***

Группа: Участник
Сообщений: 257
Регистрация: 5-09-17
Пользователь №: 99 126



Бьюсь над реализацией графического фильтра HQ2X на STM32H743 (Cortex-M7). Фильтр работает, но притормаживает, когда в кадре много мелких деталей.

Была предпринята оптимизация: Switch/Case из 256 значений был заменён на JumpTable. Не помогло. Исходный код фильтра (Keil ARM MDK):

Прикрепленный файл  HQ2x.rar ( 8.36 килобайт ) Кол-во скачиваний: 21


Требуется растянуть кадр в 2 раза по обеим осям.

Есть другие фильтры Scale2x, SaI2x , LQ2x - с ними проблем нет, на STM32H743 они идут довольно шустро(написанные на C, без Asm-а).

Вот тут чувак заточил под NEON и DSP фильтр HQnX (что не годится для Cortex-M7): https://pyra-handheld.com/boards/threads/ru...sp.69047/page-5

Существуют ли аналогичные графические фильтры (в частности HQ 2x), оптимизированные на ассемблере для ядер ARM Cortex-M7?

Работа фильтра пояснена на рисунке:

Прикрепленное изображение


Сообщение отредактировал __inline__ - Jul 16 2018, 05:37
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Genadi Zawidowsk...
сообщение Jul 16 2018, 08:39
Сообщение #2


Профессионал
*****

Группа: Участник
Сообщений: 1 620
Регистрация: 22-06-07
Из: Санкт-Петербург, Россия
Пользователь №: 28 634



Там тоже ассемблер с "неоном". Неон умеет по 16 байт за один раз обсчитывать, Cortex-M7 только по четыре.
лично я делал FIR фильтры (многоканальные, для float) с импользованием NEON. Получилось.


ps: "там" это тут
Цитата


Сообщение отредактировал Genadi Zawidowski - Jul 16 2018, 08:44
Go to the top of the page
 
+Quote Post
jcxz
сообщение Jul 16 2018, 08:50
Сообщение #3


Гуру
******

Группа: Свой
Сообщений: 5 228
Регистрация: 3-07-08
Из: Омск
Пользователь №: 38 713



Я так понимаю - Вы сами пытались оптимизировать функцию Diff() asm-вставками? И в её начале - закомментаренное си-тело?
Если так, то действие:
Код
  int c1v = (c1 & Vmask) - (c2 & Vmask);
  if (Absolute(c1v) > trV)

совсем не аналогично варианту на асме ниже.
Подумайте, что будет если к примеру c1==0x81, c2==0 в первом и во втором случае.
Если конечно в реализации изначально не заложено какое-то ограничение по количеству цветов (диапазону значений байтов).
Но в любом случае: взятие модуля от числа - не аналогично операции x=-x.
Да и вычитать SSUB8 c1,c2 чтобы потом находить NEG от каждого байта - это как-то бессмысленно. Почему бы тогда сразу не сделать SSUB8 c2,c1 ?

PS: Так что похоже у Вас ещё и реализация кривая.... laughing.gif
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- __inline__   Графический фильтр на Cortex-M7   Jul 16 2018, 05:35
- - Genadi Zawidowski   А попорбовать вместо ассемблерных вставок (которые...   Jul 16 2018, 06:12
|- - __inline__   Цитата(Genadi Zawidowski @ Jul 16 2018, 07...   Jul 16 2018, 07:49
- - ViKo   Рисунок врет. Например, глаза лягушонка он размыл ...   Jul 16 2018, 07:26
|- - aaarrr   Цитата(ViKo @ Jul 16 2018, 10:26) Рисунок...   Jul 16 2018, 07:49
||- - ViKo   Цитата(aaarrr @ Jul 16 2018, 10:49) Прост...   Jul 16 2018, 07:54
|- - __inline__   Цитата(ViKo @ Jul 16 2018, 08:26) Рисунок...   Jul 16 2018, 07:54
|- - KnightIgor   Цитата(__inline__ @ Jul 16 2018, 08:54) Н...   Jul 16 2018, 11:54
|- - __inline__   Цитата(KnightIgor @ Jul 16 2018, 12:54) О...   Jul 21 2018, 09:26
|- - Arlleex   Цитата(__inline__ @ Jul 21 2018, 12:26) В...   Jul 21 2018, 10:13
|- - __inline__   Цитата(Arlleex @ Jul 21 2018, 11:13) А за...   Jul 21 2018, 10:41
- - Genadi Zawidowski   CMSIS обычно подключен через соответствующий проце...   Jul 16 2018, 07:53
- - jcxz   Цитата(__inline__ @ Jul 16 2018, 08:35) Б...   Jul 16 2018, 08:00
|- - __inline__   Цитата(jcxz @ Jul 16 2018, 09:00) Уже пис...   Jul 16 2018, 08:07
|- - jcxz   Цитата(__inline__ @ Jul 16 2018, 11:07) П...   Jul 16 2018, 08:17
- - AVI-crak   Цитата(__inline__ @ Jul 16 2018, 11:35) В...   Jul 16 2018, 08:35
|- - __inline__   Цитата(jcxz @ Jul 16 2018, 09:50) Я так п...   Jul 16 2018, 14:54
- - Obam   Т.к. кортекс-М умеет только команды Tumb-2, то заг...   Jul 16 2018, 15:52
|- - __inline__   Цитата(Obam @ Jul 16 2018, 16:52) Т.к. ко...   Jul 16 2018, 16:21
|- - jcxz   Цитата(__inline__ @ Jul 16 2018, 19:21) Ч...   Jul 16 2018, 18:30
|- - jcxz   Кстати - по этой найденной Вами ассемблерной Diff(...   Jul 17 2018, 06:17
|- - __inline__   Цитата(jcxz @ Jul 17 2018, 07:17) Кстати ...   Jul 17 2018, 11:11
|- - jcxz   Цитата(__inline__ @ Jul 17 2018, 14:11) Е...   Jul 17 2018, 15:59
|- - __inline__   Цитата(jcxz @ Jul 17 2018, 16:59) Код in...   Jul 18 2018, 03:03
|- - jcxz   Цитата(__inline__ @ Jul 18 2018, 06:03) П...   Jul 18 2018, 08:57
|- - __inline__   Цитата(jcxz @ Jul 18 2018, 09:57) Я вообщ...   Jul 21 2018, 02:38
- - __inline__   Проделал несколько экспериментов. 1) Переписал Di...   Jul 17 2018, 09:01
- - AVI-crak   Цитата(__inline__ @ Jul 17 2018, 15:01) 3...   Jul 17 2018, 15:26


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 20th July 2025 - 19:57
Рейтинг@Mail.ru


Страница сгенерированна за 0.01386 секунд с 7
ELECTRONIX ©2004-2016