Форум разработчиков электроники ELECTRONIX.ru

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: memcpy() на Cortex-M3

Форум разработчиков электроники ELECTRONIX.ru > Сайт и форум > В помощь начинающему > ARM, 32bit

vgovseychuk

Oct 23 2015, 07:44

Добрый день, господа!

Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?
Есть ли какие-то условия ее оптимального применения?

jcxz

Oct 23 2015, 08:03

Цитата(vgovseychuk @ Oct 23 2015, 13:44)

Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?

Открываете окошко "Дизассемблер" отладчика и тоже становитесь в курсе

AlexandrY

Oct 23 2015, 08:06

Цитата(vgovseychuk @ Oct 23 2015, 10:44)

Конечно.
Это важнейшая функция в realtime приложениях. Ее в первую очередь тестируют когда надо делать что-либо быстро.
Я публиковал несколько исследований, но они уже не актуальны. Для каждой новой архитектуры и компилятора их надо повторять заново.
Для Cortex-M с кэшем на FLASH можно только сказать, что имеет значение выравнивание размещения функции memcpy в памяти и имеет значение выравнивание самих копируемых данных.

_Pasha

Oct 23 2015, 13:21

или использовать DMA highest priority

ukpyr

Oct 23 2015, 13:25

занимает много.

AlexandrY

Oct 23 2015, 14:13

Цитата(_Pasha @ Oct 23 2015, 16:21)

или использовать DMA highest priority

DMA медленней.

zltigo

Oct 23 2015, 15:48

QUOTE (AlexandrY @ Oct 23 2015, 17:13)

DMA медленней.

Или нет. Зависит от тактировки контролера DMA и на каких шинах и банках что там в конкретном контроллере висит и пересылается. Ну и опять-же, процессор в той или иной степени может заниматься чем-то более полезным, пока DMA работает.

megajohn

Nov 13 2015, 12:32

Цитата(vgovseychuk @ Oct 23 2015, 10:44)

Есть ли какие-то условия ее оптимального применения?

оптимальное применение если разница между адресами кратна на 4. Похуже если 2. Если 1 то самая низкая производительность.

исходник теста

Код

#define BUFF_SIZE 0x1000
#define OFFS_QNTY 16

uint8_t src_buff[ BUFF_SIZE + OFFS_QNTY ];
uint8_t dst_buff[ BUFF_SIZE + OFFS_QNTY ];
uint32_t results[OFFS_QNTY][OFFS_QNTY];

void memcpy_test()
{
    uint8_t src_offset, dst_offset;
    uint32_t ticks_start, ticks_stop;

    CoreDebug->DEMCR |= 0x01000000;
    DWT->CYCCNT = 0;
    DWT->CTRL = 1;

    for( src_offset = 0; src_offset < OFFS_QNTY; src_offset++ )
        for( dst_offset = 0; dst_offset < OFFS_QNTY; dst_offset++ )
        {
            ticks_start = DWT->CYCCNT;
            memcpy( &dst_buff[ dst_offset ], &src_buff[ src_offset ], BUFF_SIZE );
            ticks_stop = DWT->CYCCNT;
            results[ src_offset ][ dst_offset ] = ticks_stop - ticks_start;
        }
}

ниже картинка отсортированных результатов этого теста
копирование из RAM в RAM размером 0x1000 ( 4кб )
результат в тиках процессора, то есть 3300/4196=0,8такта на байт
оптимизация практически не влияет
для теста применялся LPC1778 на основе CM3

Нажмите для просмотра прикрепленного файла

Цитата(vgovseychuk @ Oct 23 2015, 10:44)

Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()?

в IAR ARM7.3 занимает 116 байт ( ABImemcpy_unaligned.o ro code=118 )

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.