STR91x - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Photo

Forum

Reviews

Help (!)

Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > ARM

STR91x, конвеер ?

Опции

sergvks Просмотр профиля	Jul 30 2007, 10:02 Сообщение #1
Местный Группа: Свой Сообщений: 251 Регистрация: 26-07-05 Пользователь №: 7 117	Стал оптимизировать одну функцию. Время выполнения измеряю таймером типа: time=0;//инкремент в прерывании таймера for(n=0;n<100000;n++) { my_func(); } while(1);//тут брейкпоинт Заметил, что добавление NOP в самом начале, что вызывает просто сдвиг проги в памяти, может приводить к изменению производительности до 3.5%. И ещё : SPI->DR=data; while(!(SPI->SR&SPI_TX_FIFO_not_full)); При попадании этого while на определённые адреса проц на нём зацикливается, добавляем в прогу NOP и всё опять работает. Отсюда вопрос - это что работа конвеера??? Может выравнивание какое надо включить в компиляторе, я уже не знаю, поскажите pls.

Ответов

MALLOY2 Просмотр профиля	Aug 1 2007, 13:07 Сообщение #2
Знающий Группа: Validating Сообщений: 838 Регистрация: 31-01-05 Пользователь №: 2 317	Цитата Да, я зафиксировал такой эффект. Но именно Dhrystone и Whetstone меняли свои результаты не более чем на 1% А вот простой цикл (ниже) от простого смещения на 8 байт дает изменение результата на 20% ! ;------------------------------------------------------------------------------------------------------------- ; Задержка на (t+1)10 тактов ;------------------------------------------------------------------------------------------------------------- us_Delay MOV R1,#0 B label1 label2 NOP NOP NOP NOP NOP ADD R1,R1,#1 label1 CMP R1,R0 BLT label2 BX LR Причем откдючение Branch cache на полученные пропорции влияния не оказывает. И именно смещение на 8-ь байт дает худший вариант. Однозначно что-то с burst FLASH намутили. (sergvks @ Jul 31 2007, 15:59) Попробуйте поэкспериментировать на Whetstone, если добавлять просто NOPы в стартап результат начинает прилично меняться, хотя никаких memcpy там нет. Ничего нет тут странного, и то что результат аж 20% это нормально и burst FLASH тут не причем, во всем виноват конвеер , команда BLT label2 и BX очисчает конвеер, и вот в каком месте он очистится, точнеее какие даные уже загружены в конвеере от этого и зависит производительность. Тоесть если вы хотите сделать точную задержку в тактах или посчитать сколько тактов уходит на функцию,на ядрах с конвеером забудьте ! точность приблизительно равна T = кол-во переходов размер конвеера. вот и получите +- T тактов. Это если несчитать всяких колpий на шинах, особенно когда работает ПДП если он есть .

Сообщений в этой теме

sergvks STR91x Jul 30 2007, 10:02

scifi Цитата(sergvks @ Jul 30 2007, 14:02) Заме... Jul 30 2007, 11:27

AlexandrY В STR91x очень много чудес возникает если неправил... Jul 30 2007, 18:41

sergvks Цитата(AlexandrY @ Jul 30 2007, 22:41) NO... Jul 31 2007, 12:29

AlexandrY Да, я зафиксировал такой эффект. Но именно Dhrysto... Jul 31 2007, 20:57

sergvks Поигрался тактами ожидания где только они есть и п... Aug 1 2007, 06:19

MALLOY2 ЦитатаДа, я зафиксировал такой эффект. Но именно D... Aug 1 2007, 13:07

AlexandrY Эт с кем вы спорите? Тут как бы всем и так понятно... Aug 1 2007, 13:52

sergvks Все проблемы с прерываниями(я уже писал про конфли... Aug 3 2007, 16:33

« Предыдущая тема · ARM · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 17th August 2025 - 01:54