реклама на сайте
подробности

 
 
> Tightly Coupled Memory
sifadin
сообщение Jul 1 2011, 09:47
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 443
Регистрация: 11-02-09
Пользователь №: 44 698



Есть программа размером под 2Мб, которая выполняется из SDRAM
Столкнулся с тем что вот такой кусок кода
col1=*videomem;

if ((col1 & 0xff000000)!=0) return 1;
if (1) {
if ((col1 & 0xff000000)==0)
offset1=X1;
offset1=offset1*1024;
offset1=offset1+Y1;
offset1=(offset1<<2);
}
выполняется 1,5 мкс при частоте 100МГц
Решил повысить быстродействие, введением Tightly Coupled Memory под инструкции
И сразу столкнулся с трудностью - как запихнуть нужную мне процедуру в эту память
При объявлении
void PP () __attribute__ ((section (".onchip_memory2_0_s2")));
компилятор выдает ошибку relocation truncated to fit
смысл ее мне не очень ясен но видимо линкер не может поместить ее в эту область потому что остальной код
в SDRAM
как быть? Весь код туда не влезет


Сообщение отредактировал sifadin - Jul 1 2011, 09:48
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
WitFed
сообщение Dec 8 2011, 14:59
Сообщение #2


Местный
***

Группа: Свой
Сообщений: 271
Регистрация: 6-12-11
Из: Taganrog
Пользователь №: 68 701



Я думаю, что сам исходник:
CODE
if ((col1 & 0xff000000)!=0) return 1;
if (1) {
if ((col1 & 0xff000000)==0)
offset1=X1;
offset1=offset1*1024;
offset1=offset1+Y1;
offset1=(offset1<<2);
}

должен выглядеть так:
CODE
if ((col1 & 0xff000000)!=0) return 1;
offset1=X1;
offset1=offset1*1024;
offset1=offset1+Y1;
offset1=(offset1<<2);

Это эквивалентно и гораздо яснее. Вторичная проверка не нужна, да и вдруг оптимизатор её сам не выбросит.
Там на самом деле из всего получается простая формула:
CODE
offset1 = (X1<<12) + (Y1<<2);

, которую можно вычислять однострочно. Даже завести временные переменные с (X1<<12) и (Y1<<2), обновляемые в тех местах, где исходные меняются.
Может быть, это еще что-то ускорит на десяток тактов. Можно посравнивать сдвиги с умножением -- оно бывает аппаратное и на LE, сдвиги тоже им. Barrel можно настроить.
Само помещение кода в другой тип памяти вряд ли даст выигрыш -- в кэше он всю жизнь сидит при постоянном исполнении, а кэш из того же теста, что и пресловутая Tightly Coupled, да на вызов куча тактов пойдет. Легче само это тело текущей функции сделать inline-функцией, чтобы return-ов было поменьше.
Ну и, конечно, главная оптимизация уходом от -О0 получается wink.gif

Сообщение отредактировал WitFed - Dec 8 2011, 15:00
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 24th July 2025 - 03:21
Рейтинг@Mail.ru


Страница сгенерированна за 0.01531 секунд с 7
ELECTRONIX ©2004-2016