реклама на сайте
подробности

 
 
> IMX6S, Скорость SDMA
mantech
сообщение Apr 7 2018, 17:27
Сообщение #1


Гуру
******

Группа: Участник
Сообщений: 2 219
Регистрация: 16-08-12
Из: Киров
Пользователь №: 73 143



Приветствую.

Вопрос к тому, кто копал данный сабж поглубже, а именно на предмет работы контроллера SDMA. Решил посмотреть, с какой скоростью он перекачивает данные из памяти в память, копировал блоками по 64Кб (16384х32 бита) (больше за одну транзакцию он не может). Создал 21 транзакцию (buffer descriptor) (1376235 байт) И засек время, итого получилось 30 копирований в сек. Что составляет примерно 42 мегабайта в сек.
Это очень мало, если сравнить, например, скорость выдачи данных на дисплей - при разрешении 1024х768, 32х битном цвете и 2хслойной графике - это будет 158 мегабайт в сек. Что в несколько раз быстрее. Конечно, здесь разные получатели, в первом случае память, во втором дисплейный порт, но это не должно давать такой разницы.

Может у кого есть варианты, почему так и можно-ли ускорить копирование?
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Шаманъ
сообщение Apr 14 2018, 19:03
Сообщение #2


Знающий
****

Группа: Участник
Сообщений: 758
Регистрация: 27-08-08
Пользователь №: 39 839



Цитата(mantech @ Apr 7 2018, 20:27) *
копировал блоками по 64Кб (16384х32 бита) (больше за одну транзакцию он не может). Создал 21 транзакцию (buffer descriptor) (1376235 байт) И засек время, итого получилось 30 копирований в сек. Что составляет примерно 42 мегабайта в сек.

Если я правильно понял, то это будет 64К * 21 * 30 = 39МБ/сек чтений и столько же записей.

Цитата
Это очень мало, если сравнить, например, скорость выдачи данных на дисплей - при разрешении 1024х768, 32х битном цвете и 2хслойной графике - это будет 158 мегабайт в сек.

26кадров/сек?

Цитата
Что в несколько раз быстрее.

А вот тут начинается самое интересное - SDRAM память нетороплива при случайных обращениях, но шустро отдает/принимает данные блоками. Выдача данных на дисплей скорее всего идет через буфер, по последовательным адресам и издержки получаются минимальные. Стоит посмотреть имеется ли буфер (и какой) у SDMA, поскольку если для каждого 32битного слова дергать память на чтение/запись, да еще и по разным адресам производительность сильно просядет (тем более у Вас и так подсистема памяти нагружена выводом на дисплей).

Кстати для ускорения можно положить видеобуфер, буфер откуда данные копируются и буфер куда данные копируются в разные банки памяти wink.gif.

P.S. А память то какая (DDR3?) и на какой частоте работает?
P.P.S. Заглянул в доки, я надеюсь Вы используете burst DMA unit?

Сообщение отредактировал Шаманъ - Apr 14 2018, 19:11
Go to the top of the page
 
+Quote Post
mantech
сообщение Apr 17 2018, 16:54
Сообщение #3


Гуру
******

Группа: Участник
Сообщений: 2 219
Регистрация: 16-08-12
Из: Киров
Пользователь №: 73 143



Цитата(Шаманъ @ Apr 14 2018, 22:03) *
Если я правильно понял, то это будет 64К * 21 * 30 = 39МБ/сек чтений и столько же записей.


26кадров/сек?


А вот тут начинается самое интересное - SDRAM память нетороплива при случайных обращениях, но шустро отдает/принимает данные блоками. Выдача данных на дисплей скорее всего идет через буфер, по последовательным адресам и издержки получаются минимальные. Стоит посмотреть имеется ли буфер (и какой) у SDMA, поскольку если для каждого 32битного слова дергать память на чтение/запись, да еще и по разным адресам производительность сильно просядет (тем более у Вас и так подсистема памяти нагружена выводом на дисплей).

Кстати для ускорения можно положить видеобуфер, буфер откуда данные копируются и буфер куда данные копируются в разные банки памяти wink.gif.

P.S. А память то какая (DDR3?) и на какой частоте работает?
P.P.S. Заглянул в доки, я надеюсь Вы используете burst DMA unit?


39МБ/сек чтений и столько же записей. - конечно, нужно прочитать по одному адресу и записать в другой.

ДМА работает в режиме линейного адреса, поэтому режиму burst DMA никто не мешает, в даташите написано, что копирует по 16 байт в блоке.

А память то какая (DDR3?) и на какой частоте работает?
DDR3 шириной 32 бита на частоте 400МГц. Судя по этому должна быть очень шустрой rolleyes.gif

Сообщение отредактировал mantech - Apr 17 2018, 16:57
Go to the top of the page
 
+Quote Post
jcxz
сообщение Apr 18 2018, 08:52
Сообщение #4


Гуру
******

Группа: Свой
Сообщений: 5 228
Регистрация: 3-07-08
Из: Омск
Пользователь №: 38 713



Цитата(mantech @ Apr 17 2018, 19:54) *
ДМА работает в режиме линейного адреса, поэтому режиму burst DMA никто не мешает, в даташите написано, что копирует по 16 байт в блоке.

А почему кстати "байт", а не "слов"? Вы надеюсь DMA не в байтовом режиме запускаете?
Ещё часто DMA-контроллеры имеют возможность блокировки шины на время burst-пересылки - можно попробовать использовать её и посмотреть что получится.
Да, конечно, для теста нужно отключить все прочие активности, делать тест только чтения (или только записи). Во внутреннюю память.
Можно отключить рефреш SDRAM на время теста - может какие-то проблемы с конфигурированием SDRAM?
Go to the top of the page
 
+Quote Post
mantech
сообщение Apr 18 2018, 10:36
Сообщение #5


Гуру
******

Группа: Участник
Сообщений: 2 219
Регистрация: 16-08-12
Из: Киров
Пользователь №: 73 143



Цитата(jcxz @ Apr 18 2018, 11:52) *
А почему кстати "байт", а не "слов"? Вы надеюсь DMA не в байтовом режиме запускаете?
Ещё часто DMA-контроллеры имеют возможность блокировки шины на время burst-пересылки - можно попробовать использовать её и посмотреть что получится.
Да, конечно, для теста нужно отключить все прочие активности, делать тест только чтения (или только записи). Во внутреннюю память.
Можно отключить рефреш SDRAM на время теста - может какие-то проблемы с конфигурированием SDRAM?


Просто я ошибся, конечно блок 16 DWords. Копирую тоже по 32бита. Без графики не пробовал, просто потому, что без нее нет смысла в этом копировании вообще biggrin.gif

Цитата(aaarrr @ Apr 18 2018, 12:51) *
Основным влияющим фактором, думаю, является кривой код примера в первом случае.


А есть, например, перспективы получения скорости обмена через Ethernet более 400Мбит/с? Вот и здесь, похоже, перспективы аналогичные.


Ну 19метров - это надо искусственно тормозить или многослойную графику фуллХД включать, у меня как раз ближе ко второму результату.

ЗЫ. Сейчас осваиваю аллвиннер, посмотрим, что на нем будет laughing.gif
Go to the top of the page
 
+Quote Post
mantech
сообщение Apr 26 2018, 17:38
Сообщение #6


Гуру
******

Группа: Участник
Сообщений: 2 219
Регистрация: 16-08-12
Из: Киров
Пользователь №: 73 143



Цитата(mantech @ Apr 18 2018, 13:36) *
ЗЫ. Сейчас осваиваю аллвиннер, посмотрим, что на нем будет laughing.gif



Вообщем, дошли руки до теста А13
С чем запускалось:
DDR333-16bit mode - 168MHz clock. MMU Enable, DDR Region no cashed, SRAM Region cashed. CPU Clock 682MHz.

Вот что получилось:

Тест копирования с помощью DMA - копировались блоки по 3 МБайта
Без включенного видеоконтроллера 65-72 Мбайт\сек
С видеоконтроллером (1024х600х32) - 55-59 Мбайт\сек

Вот такие дела, и это при том, что МХ6 ДДР - 400 и 32 Бита!!!

ДМА в А13 очень понравился, процедура запуска 10 строчек кода, полная поддержка 2D-режима, жаль в V3s его заменили на МХ6-подобную хрень с кучей дескрипторов crying.gif

Ну и больше 682МГц проц завести не удалось - нужно делать выше питание, 1.2В больше не тянут, как у олимексовцев получилось запустить гигагерц на 1.2В - для меня загадка laughing.gif
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 22nd July 2025 - 20:39
Рейтинг@Mail.ru


Страница сгенерированна за 0.01416 секунд с 7
ELECTRONIX ©2004-2016