реклама на сайте
подробности

 
 
> memcpy() на Cortex-M3
vgovseychuk
сообщение Oct 23 2015, 07:44
Сообщение #1


Участник
*

Группа: Участник
Сообщений: 48
Регистрация: 16-03-14
Пользователь №: 80 955



Добрый день, господа!

Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?
Есть ли какие-то условия ее оптимального применения?
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов (1 - 7)
jcxz
сообщение Oct 23 2015, 08:03
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 5 228
Регистрация: 3-07-08
Из: Омск
Пользователь №: 38 713



Цитата(vgovseychuk @ Oct 23 2015, 13:44) *
Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?

Открываете окошко "Дизассемблер" отладчика и тоже становитесь в курсе
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Oct 23 2015, 08:06
Сообщение #3


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(vgovseychuk @ Oct 23 2015, 10:44) *
Добрый день, господа!

Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?
Есть ли какие-то условия ее оптимального применения?


Конечно.
Это важнейшая функция в realtime приложениях. Ее в первую очередь тестируют когда надо делать что-либо быстро.
Я публиковал несколько исследований, но они уже не актуальны. Для каждой новой архитектуры и компилятора их надо повторять заново.
Для Cortex-M с кэшем на FLASH можно только сказать, что имеет значение выравнивание размещения функции memcpy в памяти и имеет значение выравнивание самих копируемых данных.
Go to the top of the page
 
+Quote Post
_Pasha
сообщение Oct 23 2015, 13:21
Сообщение #4


;
******

Группа: Участник
Сообщений: 5 646
Регистрация: 1-08-07
Пользователь №: 29 509



или использовать DMA highest priority
Go to the top of the page
 
+Quote Post
ukpyr
сообщение Oct 23 2015, 13:25
Сообщение #5


Профессионал
*****

Группа: Участник
Сообщений: 1 264
Регистрация: 17-06-08
Из: бандустан
Пользователь №: 38 347



занимает много.
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Oct 23 2015, 14:13
Сообщение #6


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(_Pasha @ Oct 23 2015, 16:21) *
или использовать DMA highest priority


DMA медленней.
Go to the top of the page
 
+Quote Post
zltigo
сообщение Oct 23 2015, 15:48
Сообщение #7


Гуру
******

Группа: Свой
Сообщений: 13 372
Регистрация: 27-11-04
Из: Riga, Latvia
Пользователь №: 1 244



QUOTE (AlexandrY @ Oct 23 2015, 17:13) *
DMA медленней.

Или нет. Зависит от тактировки контролера DMA и на каких шинах и банках что там в конкретном контроллере висит и пересылается. Ну и опять-же, процессор в той или иной степени может заниматься чем-то более полезным, пока DMA работает.


--------------------
Feci, quod potui, faciant meliora potentes
Go to the top of the page
 
+Quote Post
megajohn
сообщение Nov 13 2015, 12:32
Сообщение #8


Профессионал
*****

Группа: Свой
Сообщений: 1 080
Регистрация: 16-11-04
Из: СПб
Пользователь №: 1 143



Цитата(vgovseychuk @ Oct 23 2015, 10:44) *
Есть ли какие-то условия ее оптимального применения?

оптимальное применение если разница между адресами кратна на 4. Похуже если 2. Если 1 то самая низкая производительность.

исходник теста
Код
    

#define BUFF_SIZE 0x1000
#define OFFS_QNTY 16

uint8_t src_buff[ BUFF_SIZE + OFFS_QNTY ];
uint8_t dst_buff[ BUFF_SIZE + OFFS_QNTY ];
uint32_t results[OFFS_QNTY][OFFS_QNTY];

void memcpy_test()
{
    uint8_t src_offset, dst_offset;
    uint32_t ticks_start, ticks_stop;

    CoreDebug->DEMCR |= 0x01000000;
    DWT->CYCCNT = 0;
    DWT->CTRL = 1;

    for( src_offset = 0; src_offset < OFFS_QNTY; src_offset++ )
        for( dst_offset = 0; dst_offset < OFFS_QNTY; dst_offset++ )
        {
            ticks_start = DWT->CYCCNT;
            memcpy( &dst_buff[ dst_offset ], &src_buff[ src_offset ], BUFF_SIZE );
            ticks_stop = DWT->CYCCNT;
            results[ src_offset ][ dst_offset ] = ticks_stop - ticks_start;
        }
}


ниже картинка отсортированных результатов этого теста
копирование из RAM в RAM размером 0x1000 ( 4кб )
результат в тиках процессора, то есть 3300/4196=0,8такта на байт
оптимизация практически не влияет
для теста применялся LPC1778 на основе CM3


Прикрепленный файл  result.rar ( 4.69 килобайт ) Кол-во скачиваний: 69




Цитата(vgovseychuk @ Oct 23 2015, 10:44) *
Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?

в IAR ARM7.3 занимает 116 байт ( ABImemcpy_unaligned.o ro code=118 )


--------------------
Марс - единственная планета, полностью населенная роботами (около 7 штук).
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 23rd July 2025 - 13:54
Рейтинг@Mail.ru


Страница сгенерированна за 0.01415 секунд с 7
ELECTRONIX ©2004-2016