реклама на сайте
подробности

 
 
2 страниц V   1 2 >  
Reply to this topicStart new topic
> AT91RM9200: быстрая пересылка память-память, ПДП- то для этого нету :(
Ruslan1
сообщение Nov 16 2006, 08:33
Сообщение #1


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Думаю, проблема популярная.
Нужно как можно быстрее скопировать данные из одной части адресного пространства в другую.
Можно придумать что-то, работающее быстрее, чем memcpy() ?

Еще конкретнее: есть устройства с 8- и 16- битной организацией, расположенные в пространстве адресов контроллера StaticMemory. Хочется наиболее оптимально обменяться данными с массивом, расположенным в SDRAM.
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Nov 16 2006, 21:23
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата
Можно придумать что-то, работающее быстрее, чем memcpy() ?

Едва ли: функция memcpy, как правило, очень хорошо оптимизирована.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 17 2006, 07:06
Сообщение #3


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(aaarrr @ Nov 17 2006, 00:23) *
Цитата
Можно придумать что-то, работающее быстрее, чем memcpy() ?

Едва ли: функция memcpy, как правило, очень хорошо оптимизирована.

Ну ладно, я уже смирился и приспособился. smile.gif
Чтение страницы из NAND Flash в память (2112 байт, 8-битная шина) при тактовой шины MCK=25.3MHz, Fcore=101MHz на AT91RM9200 продолжается 2750 us. Из них собственно внутренние дела NAND Flash занимают 23 us, остальное- именно пересылка двух килобайт.

Вот еще прочитал в одном документе, описывающем драйвер NAND Flash (одно из моих устройств тоже NAND-Flash). Пишут о наличии нужного DMA в платформах на базе ядра ARM7TDMI. Только непонятно, речь идет о случае "память-память" или "NANDflash-память". Да и что за камни это имеют, интересно.

Написано следующее:
Код
Below is an example for a platform based on
ARM7TDMI core:
#ifdef DMA_ENABLE
do
i=*(volatile udword*) (GDMACON0);
while ( (i&0x2) != 0);
*((volatile unsigned int*) (GDMASRC0)) = Base_Address;
*((volatile unsigned int*) (GDMADST0)) = (udword)Buffer;
*((volatile unsigned int*) (GDMACNT0)) = udLength[0];
*(volatile unsigned int*) (GDMACON0) = 0x0081;
udIndex+=udLength[0];
#endif


А, вот, нашел, о ком это они: Samsung KS32C50100.
Это конкретно NAND Flash можно на DMA повесить. Круто.

Интересно, а все-таки существуют камни с ядром ARM7 или ARM9, имеющие просто DMA для передач "память-память"? Странно, если нету- ведь очень востребованная вещь.
Go to the top of the page
 
+Quote Post
doomer#gp
сообщение Nov 17 2006, 07:12
Сообщение #4


Местный
***

Группа: Участник
Сообщений: 382
Регистрация: 10-03-05
Из: USA
Пользователь №: 3 234



Вот memcpy (GCC 4.1.0, -Os optimization)
Код
00008278 <memcpy>:
    8278:    e3a0c000     mov    ip, #0; 0x0
    827c:    ea000002     b    828c <memcpy+0x14>
    8280:    e7dc3001     ldrb    r3, [ip, r1]
    8284:    e7cc3000     strb    r3, [ip, r0]
    8288:    e28cc001     add    ip, ip, #1; 0x1
    828c:    e2522001     subs    r2, r2, #1; 0x1
    8290:    2afffffa     bcs    8280 <memcpy+0x8>
    8294:    e12fff1e     bx    lr


А вот что приведено в ADS Assembler manual в качестве примера демонстрации эффективного использования команд ldm stm при блочном коприровании - двумя последовательными командами копируем 8 двойных слов.

Код
                      AREA Block, CODE, READONLY; name this block of code
num                EQU 20; set number of words to be copied
                      ENTRY; mark the first instruction to
start
                     LDR r0, =src; r0 = pointer to source block
                     LDR r1, =dst; r1 = pointer to destination
                     MOV r2, #num; r2 = number of words to copy
                     MOV sp, #0x400; Set up stack pointer (r13)
blockcopy       MOVS r3,r2, LSR #3; Number of eight word multiples
                     BEQ copywords; Less than eight words to move?
                     STMFD sp!, {r4-r11}; Save some working registers
octcopy          LDMIA r0!, {r4-r11}; Load 8 words from the source
                     STMIA r1!, {r4-r11}; and put them at the destination
                     SUBS r3, r3, #1; Decrement the counter
                     BNE octcopy; ... copy more
                     LDMFD sp!, {r4-r11}; Don't need these now - restore
                                                  ; originals
copywords      ANDS r2, r2, #7; Number of odd words to copy
                     BEQ stop; No words left to copy?
wordcopy       LDR r3, [r0], #4; Load a word from the source
                     STR r3, [r1], #4; store it to the destination
                     SUBS r2, r2, #1; Decrement the counter
                     BNE wordcopy; ... copy more
stop               MOV r0, #0x18; angel_SWIreason_ReportException
                     LDR r1, =0x20026; ADP_Stopped_ApplicationExit
                     SWI 0x123456; ARM semihosting SWI

                    AREA BlockData, DATA, READWRITE
src                DCD 1,2,3,4,5,6,7,8,1,2,3,4,5,6,7,8,1,2,3,4
dst                DCD 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
                     END
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Nov 17 2006, 13:02
Сообщение #5


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата(Ruslan1 @ Nov 17 2006, 10:06) *
Ну ладно, я уже смирился и приспособился. smile.gif
Чтение страницы из NAND Flash в память (2112 байт, 8-битная шина) при тактовой шины MCK=25.3MHz, Fcore=101MHz на AT91RM9200 продолжается 2750 us. Из них собственно внутренние дела NAND Flash занимают 23 us, остальное- именно пересылка двух килобайт.

Что-то уж слишком медленно получается. По-моему, где-то ошибка.

Цитата(Ruslan1 @ Nov 17 2006, 10:06) *
Интересно, а все-таки существуют камни с ядром ARM7 или ARM9, имеющие просто DMA для передач "память-память"? Странно, если нету- ведь очень востребованная вещь.

Навскидку: ARM7 - S3C44B0X, ARM9 - EP93xx
Go to the top of the page
 
+Quote Post
zltigo
сообщение Nov 17 2006, 13:40
Сообщение #6


Гуру
******

Группа: Свой
Сообщений: 13 372
Регистрация: 27-11-04
Из: Riga, Latvia
Пользователь №: 1 244



Цитата(Ruslan1 @ Nov 17 2006, 09:06) *
Странно, если нету- ведь очень востребованная вещь.

Прежде чем 'требовать' подумайте а чем занимается контроллер, когда у него отобрали память?
В памяти оно конечно 'само все пересылается' а процессор просто стоит, если у него конечно нет
кэшей немеряно и продвинутой системы предсказаний для загрузки кэшей.... Ну а чем стоять - мог и пересылать... Короче, DMA в микроконтролерном мире во многих случаях это просто словечко для маркетинга.....


--------------------
Feci, quod potui, faciant meliora potentes
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 17 2006, 14:30
Сообщение #7


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(aaarrr @ Nov 17 2006, 16:02) *
Цитата(Ruslan1 @ Nov 17 2006, 10:06) *

Ну ладно, я уже смирился и приспособился. smile.gif
Чтение страницы из NAND Flash в память (2112 байт, 8-битная шина) при тактовой шины MCK=25.3MHz, Fcore=101MHz на AT91RM9200 продолжается 2750 us. Из них собственно внутренние дела NAND Flash занимают 23 us, остальное- именно пересылка двух килобайт.

Что-то уж слишком медленно получается. По-моему, где-то ошибка.


Надеюсь, что так. Сам удивился. Пошуршу еще.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 17 2006, 14:41
Сообщение #8


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(zltigo @ Nov 17 2006, 16:40) *
Цитата(Ruslan1 @ Nov 17 2006, 09:06) *

Странно, если нету- ведь очень востребованная вещь.

Прежде чем 'требовать' подумайте а чем занимается контроллер, когда у него отобрали память?
В памяти оно конечно 'само все пересылается' а процессор просто стоит, если у него конечно нет
кэшей немеряно и продвинутой системы предсказаний для загрузки кэшей.... Ну а чем стоять - мог и пересылать... Короче, DMA в микроконтролерном мире во многих случаях это просто словечко для маркетинга.....

Да пусть хоть совсем стоит и ждет, пока две железяки быстро обменяются с помощью его DMA-контроллера. Цикл шины на источник плюс на приемник и слово передано. Что должно быть не хуже, чем под управлением АЛУ- это очевидно.
А насчет "DMA для маркетологов"- совсем не согласен. Скажу про себя- разгружает сильно. Для вссяких там UART/SPI/I2C- это просто спасение. Да и для USB/Ethernet думаю тоже.
Go to the top of the page
 
+Quote Post
vmp
сообщение Nov 17 2006, 15:28
Сообщение #9


Местный
***

Группа: Свой
Сообщений: 426
Регистрация: 20-01-05
Из: Зеленоград
Пользователь №: 2 070



Цитата(Ruslan1 @ Nov 17 2006, 17:41) *
А насчет "DMA для маркетологов"- совсем не согласен. Скажу про себя- разгружает сильно. Для вссяких там UART/SPI/I2C- это просто спасение. Да и для USB/Ethernet думаю тоже.


Это точно. Можете смеяться, но я сделал один проект на SAM7S вообще без использования прерываний - мне вполне хватило возможностей PDC. Причем там был даже обмен пакетами по UART.
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Nov 17 2006, 15:59
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата(Ruslan1 @ Nov 17 2006, 17:41) *
Для вссяких там UART/SPI/I2C- это просто спасение. Да и для USB/Ethernet думаю тоже.

Я бы приоритеты поставил наоборот: спасение для USB/Ethernet, а для всяких UART'ов - приятная мелочь.

Цитата(vmp @ Nov 17 2006, 18:28) *
Можете смеяться, но я сделал один проект на SAM7S вообще без использования прерываний - мне вполне хватило возможностей PDC. Причем там был даже обмен пакетами по UART.

А вот мне кажется, что атмел череcчур упорно лепит повсюду свой PDC, забывая, что некоторой периферии желательно еще и FIFO.
Go to the top of the page
 
+Quote Post
MemoryTest
сообщение Nov 17 2006, 18:15
Сообщение #11


Участник
*

Группа: Свой
Сообщений: 65
Регистрация: 25-01-05
Из: Мск регион.
Пользователь №: 2 161



Цитата
А вот мне кажется, что атмел череcчур упорно лепит повсюду свой PDC, забывая, что некоторой периферии желательно еще и FIFO.

+1
Я бы от PDC + FIFO не отказалсяsmile.gif

А насчет PDC память-память, я согласен с zltigo.
тут по любому
1 нужно произвести чтение из памяти, кудато во внутрь процессора
2 это что прочитал записать куда надо.
если этим будет заниматься ПДЦ то процессор будет стоять ждать доступа к EBI.
мое ИМХО всё это он может сделать сам.
Go to the top of the page
 
+Quote Post
zltigo
сообщение Nov 17 2006, 18:28
Сообщение #12


Гуру
******

Группа: Свой
Сообщений: 13 372
Регистрация: 27-11-04
Из: Riga, Latvia
Пользователь №: 1 244



Цитата(Ruslan1 @ Nov 17 2006, 16:41) *
Скажу про себя- разгружает сильно.

Это Вы на чем? На Pentium M? :-)))))
Вообще попробуйте как-нибудь попробовать аккуратно реализовать (там, де возможны варианты) и померить.


Цитата(aaarrr @ Nov 17 2006, 17:59) *
А вот мне кажется, что атмел череcчур упорно лепит повсюду свой PDC

Ага, причем если у новых LPC 128bit MAM есть и отдельный банк памяти на отдельной шине для DMA нужд, то у Atmel PDC не бог весть как эффективен, естественно по сравнению с простым FIFO а не по сравнению с совсем тупой железкой без ничего.


--------------------
Feci, quod potui, faciant meliora potentes
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 19 2006, 22:34
Сообщение #13


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(zltigo @ Nov 17 2006, 21:28) *
Цитата(Ruslan1 @ Nov 17 2006, 16:41) *

Скажу про себя- разгружает сильно.

Это Вы на чем? На Pentium M? :-)))))

Нет, я про многострадальный AT91RM9200.

Цитата(zltigo @ Nov 17 2006, 21:28) *
Вообще попробуйте как-нибудь попробовать аккуратно реализовать (там, де возможны варианты) и померить.

Что-то я не горю желанием "аккуратно" переписывать, скажем, работу с восьмью разными SPI устройствами. Или обмен на 115200 по Modbus-RTU, чтобы при каждом байтике прерывания возникали. Я заранее уверен, что лучше, чем с использованием PDC, у меня не выйдет. И даже осмелюсь подумать такую крамольную мысль, что выйдет хуже. У меня, разумеется. За других не скажу.
Go to the top of the page
 
+Quote Post
zltigo
сообщение Nov 19 2006, 22:41
Сообщение #14


Гуру
******

Группа: Свой
Сообщений: 13 372
Регистрация: 27-11-04
Из: Riga, Latvia
Пользователь №: 1 244



Цитата(Ruslan1 @ Nov 20 2006, 00:34) *
Я заранее уверен, что лучше, чем с использованием PDC, у меня не выйдет.

Это я чуть отколонился :-(.
Речь вел не о том, что без DMA лучше - с DMA безусловно лучше чем без ничего. А о том, что а Atmel-овской архитетуре DMA отнюдь не более, а менее эффективна, чем "банальные" FIFO. Ну а буде была
реализована пересылка память-память и вовсе бесполезна - не горюйте!.


--------------------
Feci, quod potui, faciant meliora potentes
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 20 2006, 10:07
Сообщение #15


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(zltigo @ Nov 19 2006, 22:41) *
Цитата(Ruslan1 @ Nov 20 2006, 00:34) *

Я заранее уверен, что лучше, чем с использованием PDC, у меня не выйдет.

Это я чуть отколонился :-(.
Речь вел не о том, что без DMA лучше - с DMA безусловно лучше чем без ничего. А о том, что а Atmel-овской архитетуре DMA отнюдь не более, а менее эффективна, чем "банальные" FIFO.

Плохость FIFO в том, что:
1. "резиновых" FIFO пока не наблюдается. Сколько байт дали (обычно меньше чем нужно)- через столько и прерывайся. DMA позволяет этого не делать. Одно прерывание на посылку.
2. PDC позволяет не перегружать данные из памяти в FIFO передатчика каждый раз полностью. Например, если у меня PDC и я опрашиваю по петле одно устройство- то просто запускаю еще раз передатчик, так как буфер у меня нетронут. Либо меняю несколько байт в передаваемом пакете и все. Либо просто указываю контроллеру новые указатели для буферов приема/передачи.
В случае простого FIFO- все нужно заливать по новой перед каждой передачей.

При приеме- тоже грустно. из FIFO обязательно нужно выгребать, а PDC уже сразу кладет данные туда, куда мне нужно.

Хм... Чем дольше думаю, тем больше сомнений. Можете привести пример, когда FIFO позволит сэкономить количество обращений с памятью? А если я в качестве буферов для PDC назначу набортное RAM контроллера?
Go to the top of the page
 
+Quote Post

2 страниц V   1 2 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 20th July 2025 - 18:00
Рейтинг@Mail.ru


Страница сгенерированна за 0.01496 секунд с 7
ELECTRONIX ©2004-2016