memcpy() на Cortex-M3 - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Сайт и форум > В помощь начинающему > ARM, 32bit

memcpy() на Cortex-M3

vgovseychuk Просмотр профиля	Oct 23 2015, 07:44 Сообщение #1
Участник Группа: Участник Сообщений: 48 Регистрация: 16-03-14 Пользователь №: 80 955	Добрый день, господа! Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()? Есть ли какие-то условия ее оптимального применения?

Start new topic

Ответов (1 - 7)

jcxz Просмотр профиля	Oct 23 2015, 08:03 Сообщение #2
Гуру Группа: Свой Сообщений: 5 228 Регистрация: 3-07-08 Из: Омск Пользователь №: 38 713	Цитата(vgovseychuk @ Oct 23 2015, 13:44) Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()? Открываете окошко "Дизассемблер" отладчика и тоже становитесь в курсе

AlexandrY Просмотр профиля	Oct 23 2015, 08:06 Сообщение #3
Ally Группа: Модераторы Сообщений: 6 232 Регистрация: 19-01-05 Пользователь №: 2 050	Цитата(vgovseychuk @ Oct 23 2015, 10:44) Добрый день, господа! Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()? Есть ли какие-то условия ее оптимального применения? Конечно. Это важнейшая функция в realtime приложениях. Ее в первую очередь тестируют когда надо делать что-либо быстро. Я публиковал несколько исследований, но они уже не актуальны. Для каждой новой архитектуры и компилятора их надо повторять заново. Для Cortex-M с кэшем на FLASH можно только сказать, что имеет значение выравнивание размещения функции memcpy в памяти и имеет значение выравнивание самих копируемых данных.

_Pasha Просмотр профиля	Oct 23 2015, 13:21 Сообщение #4
; Группа: Участник Сообщений: 5 646 Регистрация: 1-08-07 Пользователь №: 29 509	или использовать DMA highest priority

ukpyr Просмотр профиля	Oct 23 2015, 13:25 Сообщение #5
Профессионал Группа: Участник Сообщений: 1 264 Регистрация: 17-06-08 Из: бандустан Пользователь №: 38 347	занимает много.

AlexandrY Просмотр профиля	Oct 23 2015, 14:13 Сообщение #6
Ally Группа: Модераторы Сообщений: 6 232 Регистрация: 19-01-05 Пользователь №: 2 050	Цитата(_Pasha @ Oct 23 2015, 16:21) или использовать DMA highest priority DMA медленней.

zltigo Просмотр профиля	Oct 23 2015, 15:48 Сообщение #7
Гуру Группа: Свой Сообщений: 13 372 Регистрация: 27-11-04 Из: Riga, Latvia Пользователь №: 1 244	QUOTE (AlexandrY @ Oct 23 2015, 17:13) DMA медленней. Или нет. Зависит от тактировки контролера DMA и на каких шинах и банках что там в конкретном контроллере висит и пересылается. Ну и опять-же, процессор в той или иной степени может заниматься чем-то более полезным, пока DMA работает. -------------------- Feci, quod potui, faciant meliora potentes

megajohn Просмотр профиля	Nov 13 2015, 12:32 Сообщение #8
Профессионал Группа: Свой Сообщений: 1 080 Регистрация: 16-11-04 Из: СПб Пользователь №: 1 143	Цитата(vgovseychuk @ Oct 23 2015, 10:44) Есть ли какие-то условия ее оптимального применения? оптимальное применение если разница между адресами кратна на 4. Похуже если 2. Если 1 то самая низкая производительность. исходник теста Код #define BUFF_SIZE 0x1000 #define OFFS_QNTY 16 uint8_t src_buff[ BUFF_SIZE + OFFS_QNTY ]; uint8_t dst_buff[ BUFF_SIZE + OFFS_QNTY ]; uint32_t results[OFFS_QNTY][OFFS_QNTY]; void memcpy_test() { uint8_t src_offset, dst_offset; uint32_t ticks_start, ticks_stop; CoreDebug->DEMCR \|= 0x01000000; DWT->CYCCNT = 0; DWT->CTRL = 1; for( src_offset = 0; src_offset < OFFS_QNTY; src_offset++ ) for( dst_offset = 0; dst_offset < OFFS_QNTY; dst_offset++ ) { ticks_start = DWT->CYCCNT; memcpy( &dst_buff[ dst_offset ], &src_buff[ src_offset ], BUFF_SIZE ); ticks_stop = DWT->CYCCNT; results[ src_offset ][ dst_offset ] = ticks_stop - ticks_start; } } ниже картинка отсортированных результатов этого теста копирование из RAM в RAM размером 0x1000 ( 4кб ) результат в тиках процессора, то есть 3300/4196=0,8такта на байт оптимизация практически не влияет для теста применялся LPC1778 на основе CM3 result.rar ( 4.69 килобайт ) Кол-во скачиваний: 69 Цитата(vgovseychuk @ Oct 23 2015, 10:44) Кто-нибудь в курсе скорости работы/занимаемого в памяти места функции memcpy()? в IAR ARM7.3 занимает 116 байт ( ABImemcpy_unaligned.o ro code=118 ) -------------------- Марс - единственная планета, полностью населенная роботами (около 7 штук).

« Предыдущая тема · ARM, 32bit · Следующая тема »

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 25th July 2025 - 12:18

Страница сгенерированна за 0.01406 секунд с 7
ELECTRONIX ©2004-2016