Какое ОЗУ выбрать для обработки видео? - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Программируемая логика ПЛИС (FPGA,CPLD, PLD) > Работаем с ПЛИС, области применения, выбор

3 страниц

1 2 3 >

Reply to this topic

Start new topic

Какое ОЗУ выбрать для обработки видео?, Динамическое, статическое и сколько микросхем?

Гвоздик Просмотр профиля	Aug 16 2006, 13:24 Сообщение #1
Частый гость Группа: Свой Сообщений: 153 Регистрация: 2-12-04 Из: Чебоксары Пользователь №: 1 289	Задача следующая: требуется на лету хватать потоковое видео (700 * 500, YUV) и делать вычитание попиксельно предыдущего из текущего кадра изображения. Какова будет принципиальная схема устройства, я думаю, что входной видеосигнал надо раскодировать (выхватить данные), считать пикселы с теми же координатами из предыдущего кадра из ОЗУ, произвести вычитание и сразу же выдать на выход (или писать в ОЗУ сначала?). Верна ли схема или будут задержки, из-за которых она не сработает? От чего это будет зависеть? Какую микросхему ОЗУ выбирать для этих целей, может подойдет статическое или надо динамическое? ПЛИС - Xilinx Spartan 3 или Virtex 4 (пока побольше возьмем с запасом). Возможно я задаю глупые вопросы, прошу указать на неточности, если что не так. Более точными характеристиками видеосигнала пока не владею, будут уточняться. Спасибо.

NickNich Просмотр профиля	Aug 16 2006, 13:42 Сообщение #2
Местный Группа: Свой Сообщений: 375 Регистрация: 8-11-05 Пользователь №: 10 593	Если все так, как Вы описали, задача - халявная. Тип используемого ОЗУ здесь роли не играет и определяется причинами, к обработке видео напрямую не относящимися. Если потребление не критично - используйте статическое ОЗУ - упростите себе жизнь за счет работы с памятью. Никаких считываний с координат не нужно. Данные в ПЛИС поступают построчно - заведите инкрементный счетчик адреса. На каждый вновь принятый пиксель: -считайте из ОЗУ по текущему состоянию счетчика; -вычтите прочитанное значение из принятого пикселя и выдайте его наружу; -запишите принятый пиксель в озу по текущему состоянию счетчика адреса; -увеличте счетчик. В конце кадра счетчик сбросьте и начните сначала....

Гвоздик Просмотр профиля	Aug 16 2006, 14:17 Сообщение #3
Частый гость Группа: Свой Сообщений: 153 Регистрация: 2-12-04 Из: Чебоксары Пользователь №: 1 289	Ух-ты, как все классно! Тогда получается, что весь кадр не нужно хранить, только несколько обрабатываемых одновременно пикселей? Спасибо огромное, буду смотреть потребление статических ОЗУ

Гвоздик Просмотр профиля	Aug 16 2006, 15:08 Сообщение #4
Частый гость Группа: Свой Сообщений: 153 Регистрация: 2-12-04 Из: Чебоксары Пользователь №: 1 289	Поторопился на радостях, все верно - нужно хранить кадр целиком. Отлично

_andrew_ Просмотр профиля	Aug 16 2006, 15:16 Сообщение #5
Частый гость Группа: Свой Сообщений: 126 Регистрация: 24-08-05 Пользователь №: 7 935	А с какой целью производится вычитание?

NickNich Просмотр профиля	Aug 16 2006, 16:53 Сообщение #6
Местный Группа: Свой Сообщений: 375 Регистрация: 8-11-05 Пользователь №: 10 593	Цитата(Гвоздик @ Aug 16 2006, 18:17) Ух-ты, как все классно! Кадр нужно хранить целиком. Учтите, что у указанных Вами ПЛИС есть встроенные блоки ОЗУ. имеет смысл использовать их. на весь кадр (700х500) пикселей их, скорее всего, не хватит, но объем внешней памяти они помогут сократить. Просмотрите внимательно структуру входного видеопотока. Может оказаться, что Вам передаются все три канала YUV, без прореживания. А это уже потребует объем памяти больше мегабайта.

net Просмотр профиля	Aug 16 2006, 17:15 Сообщение #7
Знающий Группа: Свой Сообщений: 858 Регистрация: 9-08-04 Пользователь №: 473	действительно - а зачем вам вычитать два кадра? обычно их складывают и тогда получают много интересного не могли бы расскрыть секрет вашей задачи? а память берите статическую - тогда неикаких проблем у вас не будет тем более чейчас памяти с 10 нс как грязи Сообщение отредактировал net - Aug 16 2006, 17:16

Гвоздик Просмотр профиля	Aug 17 2006, 06:16 Сообщение #8
Частый гость Группа: Свой Сообщений: 153 Регистрация: 2-12-04 Из: Чебоксары Пользователь №: 1 289	Спасибо всем! Вычитание текущего и предыдущего кадров будет производиться для определения движения на картинке, думаю, что сложение будет присутствовать тоже.

-Al- Просмотр профиля	Aug 17 2006, 07:19 Сообщение #9
Местный Группа: Свой Сообщений: 330 Регистрация: 10-06-05 Из: Россия, Москва Пользователь №: 5 894	Цитата(net @ Aug 16 2006, 21:15) а память берите статическую - тогда неикаких проблем у вас не будет тем более чейчас памяти с 10 нс как грязи Fast SRAM: K6R4016 - 2 штуки должно хватить, стоят ~100р в розницу за штуку. Чудные микросхемки от самсунга

dxp Просмотр профиля	Aug 17 2006, 07:54 Сообщение #10
Adept Группа: Свой Сообщений: 3 469 Регистрация: 6-12-04 Из: Novosibirsk Пользователь №: 1 343	Цитата(-Al- @ Aug 17 2006, 14:19) Цитата(net @ Aug 16 2006, 21:15) а память берите статическую - тогда неикаких проблем у вас не будет тем более чейчас памяти с 10 нс как грязи Fast SRAM: K6R4016 - 2 штуки должно хватить, стоят ~100р в розницу за штуку. Чудные микросхемки от самсунга В паре с ПЛИС лучче применять синхронную память - не нужно возиться с задержками при формировании сигналов (WE например). Все по такту делается, который тот же самый, что и системный клок внутриплисового дизайна. -------------------- «Отыщи всему начало, и ты многое поймёшь» К. Прутков

_andrew_ Просмотр профиля	Aug 17 2006, 08:38 Сообщение #11
Частый гость Группа: Свой Сообщений: 126 Регистрация: 24-08-05 Пользователь №: 7 935	Цитата(NickNich @ Aug 16 2006, 20:53) Цитата(Гвоздик @ Aug 16 2006, 18:17) Ух-ты, как все классно! Кадр нужно хранить целиком. Учтите, что у указанных Вами ПЛИС есть встроенные блоки ОЗУ. имеет смысл использовать их. на весь кадр (700х500) пикселей их, скорее всего, не хватит, но объем внешней памяти они помогут сократить. Просмотрите внимательно структуру входного видеопотока. Может оказаться, что Вам передаются все три канала YUV, без прореживания. А это уже потребует объем памяти больше мегабайта. Встроенных блоков всего ничего, на несколько строк (если говорить о спартане), так что помоему не стоит и заморачиваться, лучше на встронной памяти сделать фильтры какие нибудь или еще что. Входной поток скорее всего либо YUV422, либо YUV420 - врядли поток совсем без прореживания. Еще обратите внимание на тип потока (интерлэйс, прогрессив).

Mad Makc Просмотр профиля	Aug 17 2006, 08:41 Сообщение #12
Местный Группа: Свой Сообщений: 244 Регистрация: 2-10-04 Из: Мухосранска Пользователь №: 763	Цитата В паре с ПЛИС лучче применять синхронную память - не нужно возиться с задержками при формировании сигналов (WE например). Полностью поддреживаю.И как пример - вот вам память от кипариса CY7C1380C. На сайте даже модель на VHDL есть.

Flanker Просмотр профиля	Aug 17 2006, 09:36 Сообщение #13
Частый гость Группа: Свой Сообщений: 76 Регистрация: 16-05-05 Из: г.Чебоксары Пользователь №: 5 090	Не знаю как синхронная статическая ОЗУ, я в проекте совместно со Spartan II использую асинхронную статическую ОЗУ 512Kx32. Читаю данные с LCD порта - формат видео режима TFT 800x600x16 бит. Тактовая частота 40 Мгц. Сохраняю текущий кадр, а предыдущий после обработки выдаю дальше. Все работает замечательно и линий управления у ОЗУ меньше по-сравнению с синхронной.

dxp Просмотр профиля	Aug 17 2006, 10:28 Сообщение #14
Adept Группа: Свой Сообщений: 3 469 Регистрация: 6-12-04 Из: Novosibirsk Пользователь №: 1 343	Цитата(Flanker @ Aug 17 2006, 16:36) Не знаю как синхронная статическая ОЗУ, я в проекте совместно со Spartan II использую асинхронную статическую ОЗУ 512Kx32. Читаю данные с LCD порта - формат видео режима TFT 800x600x16 бит. Тактовая частота 40 Мгц. Сохраняю текущий кадр, а предыдущий после обработки выдаю дальше. Все работает замечательно и линий управления у ОЗУ меньше по-сравнению с синхронной. С асинхронной тоже имели дело - иначе не писали бы. Да, работает она - куда ей деться, но с синхронной работать, во-первых, удобнее, во-вторых, она быстрее. Я делал честный синхронный контроллер памяти (поскольку внутри ПЛИС весь дизайн синхронный), который формировал сигнал nWE строго по тактам. Итого на цикл обращения приходится три системных такта. Мне вот скорость была важна и пришлось задирать системную тактовую аж до 200 МГц, хотя сам дизайн этого не требовал - вполне хватило бы сотни. В итоге, на 200 МГц не уложился по скорости, пришлось опуститься на 160 МГц и еще наворотить тучу констрейнов, чтобы синтез шел как надо - мультициклы всякие, конвейеры вводить, в общем, боролся за скорость из-за одного узла. Конечно, можно было бы сформировать задержку на ячейках (там допуск приличный) и зафиксировать их, чтобы времянка хотя бы от разводки не плавала, хотя это, имхо, грязный хак, так делать не хотел и не стал. Можно было бы завести два клоковых домена - один на 100 МГц, основной, другой на 200 МГц - для контроллера памяти. Наверное, это был бы самый правильный путь, но когда понимание пришло, уже было поздно, а дивайс и так работал. К тому же и тут даже на 200 МГц обращение составляет 35 нс 15 нс, а с синхронной - на 100 МГц за 10 нс. Более того, как показала практика, за 15 нс из Cyclone (спидгрейд 7) в 10 нс память слазить за 15 нс не удается - к 10 нс еще добавляются задержка от выходного триггера до пина, tCO, задержка от пина до входного триггера (при чтении) плюс tSU. Все это в сумме выходит за 15 нс, реально там минимально необходимое время было что-то около 16 нс. В итоге, сделано было на 160 МГц - 36.25 нс = 18.75 нс. Т.е. почти вдвое медленнее, чем в случае со 100 МГц синхронной памятью. Дополнительный гемор с асинхронной памятью состоит в том, что обращение происходит не за один такт, надо специалный сигнал готовности с контроллера памяти на клиентскую сторону выдавать, чтобы оттуда данные и адреса не в каждом такте выдавали, а только по готовности (один раз в три такта в моем случае). С синхронной памятью таких заморочек нет - достучался до контроллера, получил разрешение (там не одно, а несколько устройств в память лазили, арбитр разруливал) и понеслась - сразу весь блок (строку или столбец) записал/прочитал, одно слово на такт. Тогда же четко осознал, что надо было применять просто синхронную память (с pipeline для скорости), с ней никаких проблем нет - на 100 МГц все работает без вопросов. Сейчас у меня в текущем дивайсе стоит SDRAM на 100 МГц, и несмотря на то, что SDRAM контроллер значительно сложнее, чем оный для статической памяти, все намного белее и пушистее - 100 МГц, весь дизайн со свистом успевает безо всяких дополнительных констрейнов, мультициклов и прочего, т.е. можно сосредоточиться на целевой задаче, а не бороться за скорость. Конечно, на 40 МГц все гораздо проще, но и тут возни с задежками не избежать. Реализация по-любому сложнее выходит. Что касается количества ножек на интрефейс с памятью, то оно где-то одинаковое что в случае с синхронной статикой, что в случае с асинхронной статикой, что в случае со SDRAM, и сооставляет примерно 40 ножек. -------------------- «Отыщи всему начало, и ты многое поймёшь» К. Прутков

-Al- Просмотр профиля	Aug 17 2006, 10:46 Сообщение #15
Местный Группа: Свой Сообщений: 330 Регистрация: 10-06-05 Из: Россия, Москва Пользователь №: 5 894	Цитата(dxp @ Aug 17 2006, 14:28) С асинхронной тоже имели дело - иначе не писали бы. Да, работает она - куда ей деться, но с синхронной работать, во-первых, удобнее, во-вторых, она быстрее. Я делал честный синхронный контроллер памяти (поскольку внутри ПЛИС весь дизайн синхронный), который формировал сигнал nWE строго по тактам. Итого на цикл обращения приходится три системных такта. Мне вот скорость была важна и пришлось задирать системную тактовую аж до 200 МГц, хотя сам дизайн этого не требовал - вполне хватило бы сотни. В итоге, на 200 МГц не уложился по скорости, пришлось опуститься на 160 МГц и еще наворотить тучу констрейнов, чтобы синтез шел как надо - мультициклы всякие, конвейеры вводить, в общем, боролся за скорость из-за одного узла. Конечно, можно было бы сформировать задержку на ячейках (там допуск приличный) и зафиксировать их, чтобы времянка хотя бы от разводки не плавала, хотя это, имхо, грязный хак, так делать не хотел и не стал. Можно было бы завести два клоковых домена - один на 100 МГц, основной, другой на 200 МГц - для контроллера памяти. Наверное, это был бы самый правильный путь, но когда понимание пришло, уже было поздно, а дивайс и так работал. К тому же и тут даже на 200 МГц обращение составляет 35 нс 15 нс, а с синхронной - на 100 МГц за 10 нс. Более того, как показала практика, за 15 нс из Cyclone (спидгрейд 7) в 10 нс память слазить за 15 нс не удается - к 10 нс еще добавляются задержка от выходного триггера до пина, tCO, задержка от пина до входного триггера (при чтении) плюс tSU. Все это в сумме выходит за 15 нс, реально там минимально необходимое время было что-то около 16 нс. В итоге, сделано было на 160 МГц - 36.25 нс = 18.75 нс. Т.е. почти вдвое медленнее, чем в случае со 100 МГц синхронной памятью. Дополнительный гемор с асинхронной памятью состоит в том, что обращение происходит не за один такт, надо специалный сигнал готовности с контроллера памяти на клиентскую сторону выдавать, чтобы оттуда данные и адреса не в каждом такте выдавали, а только по готовности (один раз в три такта в моем случае). С синхронной памятью таких заморочек нет - достучался до контроллера, получил разрешение (там не одно, а несколько устройств в память лазили, арбитр разруливал) и понеслась - сразу весь блок (строку или столбец) записал/прочитал, одно слово на такт. Тогда же четко осознал, что надо было применять просто синхронную память (с pipeline для скорости), с ней никаких проблем нет - на 100 МГц все работает без вопросов. Сейчас у меня в текущем дивайсе стоит SDRAM на 100 МГц, и несмотря на то, что SDRAM контроллер значительно сложнее, чем оный для статической памяти, все намного белее и пушистее - 100 МГц, весь дизайн со свистом успевает безо всяких дополнительных констрейнов, мультициклов и прочего, т.е. можно сосредоточиться на целевой задаче, а не бороться за скорость. Конечно, на 40 МГц все гораздо проще, но и тут возни с задежками не избежать. Реализация по-любому сложнее выходит. Что касается количества ножек на интрефейс с памятью, то оно где-то одинаковое что в случае с синхронной статикой, что в случае с асинхронной статикой, что в случае со SDRAM, и сооставляет примерно 40 ножек. У меня K6R4016V1D-TI10 (256kx16bit, 10нс) тоже работает в синхронной схеме, цикл чтения/записи составляет 1 такт (и никаких фокусов на задержках тут нет!, все чисто) линий управления - 2 (WE и CS), работает все дело на 48МГц... PS тоже пришлось бороться за скорость... PPS сигнал WE формируется на двух T-триггерах у которых выходы проXORенные, а у одного из них противофазный такт: Код pulse[].clk =( clk, !clk ); pulse[].( t, ena, clrn ) = ( vcc, en, reset ); out = pulse[ 0 ] xor pulse[ 1 ]; Сообщение отредактировал -Al- - Aug 17 2006, 11:15

« Предыдущая тема · Работаем с ПЛИС, области применения, выбор · Следующая тема »

3 страниц

1 2 3 >

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 22nd August 2025 - 01:07

Страница сгенерированна за 0.02785 секунд с 7
ELECTRONIX ©2004-2016