реклама на сайте
подробности

 
 
3 страниц V   1 2 3 >  
Reply to this topicStart new topic
> Как оценить время в Keil, Не могу посчитать количество тактов
Nikitoc
сообщение Mar 16 2010, 14:30
Сообщение #1


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Всем здравствуйте. Я недавно перепрыгнул (вернее нахожусь в прыжке) с PIC'ов на ARM'ы. После привычного Mplab'a Keil кажется враждебным biggrin.gif А если конкретней мне никак не удается оценить количество тактов за которое выполняется команда. В Mplab'e есть очень удобный инструмент Stopwatch - который, собственно, за все эти ф-ции отвечает. А в Keil'e такого нет. Посоветуйте, как мерить время (в тактах, или наносекундах) выполнения команд. Пишу на Си. Камень at91sam7s256.
Да, и еще, если разогнать проц до 80Мгц и выполнять программу из оперативной памяти, будут ли быстрее выполняться команды обращения к портам? Мне нужно максимально быстро их сканировать для считывания видео с простенькой CMOS-камеры.

Сообщение отредактировал Nikitoc - Mar 16 2010, 14:35
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Mar 16 2010, 15:09
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата(Nikitoc @ Mar 16 2010, 17:30) *
Посоветуйте, как мерить время (в тактах, или наносекундах) выполнения команд.

Debug->Execution Profiling->Time
Только вейтстейты при работе с флеш и обращению к периферии он не учитывает. Я уж не говорю про простои из-за работы DMA.
Поэтому считать лучше или в уме или на железке.

Цитата(Nikitoc @ Mar 16 2010, 17:30) *
Да, и еще, если разогнать проц до 80Мгц и выполнять программу из оперативной памяти...

Ну, если он разгонится еще.

Цитата(Nikitoc @ Mar 16 2010, 17:30) *
...будут ли быстрее выполняться команды обращения к портам? Мне нужно максимально быстро их сканировать для считывания видео с простенькой CMOS-камеры.

Будут, конечно. Но чтение порта в любом случае достаточно медленное - 4 такта.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 16 2010, 18:48
Сообщение #3


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Цитата(aaarrr @ Mar 16 2010, 19:09) *
Debug->Execution Profiling->Time
Только вейтстейты при работе с флеш и обращению к периферии он не учитывает. Я уж не говорю про простои из-за работы DMA.
Поэтому считать лучше или в уме или на железке.


А если по дизассемблеру считать? В смысле по количеству команд? Насколько это будет точно?
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Mar 16 2010, 19:31
Сообщение #4


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата(Nikitoc @ Mar 16 2010, 21:48) *
А если по дизассемблеру считать? В смысле по количеству команд? Насколько это будет точно?

И близко не будет. Но запомнить, сколько занимает тактов та или иная команда, совсем нетрудно. Ну, плюс еще досчитывать вейтстейты на обращение к флеш и периферии через APB.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 16 2010, 20:24
Сообщение #5


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Цитата(aaarrr @ Mar 16 2010, 22:31) *
И близко не будет. Но запомнить, сколько занимает тактов та или иная команда, совсем нетрудно. Ну, плюс еще досчитывать вейтстейты на обращение к флеш и периферии через APB.

О. А можно поподробней про эти самые вэйтстейты? В стартапе есть закладочка Configuration Wizard и там настройки Embedded Flash Controller (EFC1 и EFC0). И две опции: FMCN: Flash Microsecond Cycle Number (по умолчанию 50) и FWS: Flash Wait State (по умолчанию Read: 2 cycle/ Write: 3 cycles). Что это за параметры? Как их можно изменять? На что влияют?
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Mar 16 2010, 20:30
Сообщение #6


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Поподробнее можно посмотреть в даташите. Если кратко, то при работе на частоте больше 30МГц, доступ к флеш должен осуществляться минимум с 1 WS, т.е. за 2 такта.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 16 2010, 20:39
Сообщение #7


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Угу, ясненько. И если можно последний моментик: Вы написали, что при обращении к периферии (я так понимаю порты туда тоже входят) нужно досчитывать эти вэйтстейты. Но разве эти регистры расположены во флеше?
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Mar 16 2010, 20:46
Сообщение #8


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Периферия находится на "медленной" шине APB, цикл чтения/записи на ней занимает два такта MCK.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 16 2010, 20:53
Сообщение #9


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Цитата(aaarrr @ Mar 16 2010, 23:46) *
Периферия находится на "медленной" шине APB, цикл чтения/записи на ней занимает два такта MCK.

Спасибо большое. Вроде все ясно. Дальше, думаю, с даташитом разберусь.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 19 2010, 12:23
Сообщение #10


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Типа отчет, о том что получилось. Тестовая программка:
Код
while (1) {
    AT91C_BASE_PIOA -> PIO_SODR = AT91C_BASE_PIOA -> PIO_SODR | 0x00000800;           //  PA11    = 1
    AT91C_BASE_PIOA -> PIO_CODR = AT91C_BASE_PIOA -> PIO_CODR | 0x00000800;           //  PA11    = 0
}

Мне удалось разогнать процессор (at91sam7s256) до 100 Мгц.
При выполнении программы из ОЗУ период меандра на ножке PA11 был примерно 200 нс.
И это при тактовом цикле 10нс!
Дизассемблер показал, что изменение состояния ножки занимает 4-5 команд:
Код
   319:         while (1) {
0x00102CE0  EA000008  B         0x00102D08
   320:         AT91C_BASE_PIOA -> PIO_SODR = AT91C_BASE_PIOA -> PIO_SODR | 0x00000800;     //  PA11      = 1
0x00102CE4  E3A00000  MOV       R0,#0x00000000
0x00102CE8  E5100BD0  LDR       R0,[R0,#-0x0BD0]
0x00102CEC  E3800B02  ORR       R0,R0,#0x00000800
0x00102CF0  E3A01000  MOV       R1,#0x00000000
0x00102CF4  E5010BD0  STR       R0,[R1,#-0x0BD0]
   321:         AT91C_BASE_PIOA -> PIO_CODR = AT91C_BASE_PIOA -> PIO_CODR | 0x00000800;                   //  PA11     = 0
0x00102CF8  E3A00000  MOV       R0,#0x00000000
0x00102CFC  E5100BCC  LDR       R0,[R0,#-0x0BCC]
0x00102D00  E3800B02  ORR       R0,R0,#0x00000800
0x00102D04  E5010BCC  STR       R0,[R1,#-0x0BCC]
   319:         while (1) {
0x00102D08  EAFFFFF5  B         0x00102CE4

Если каждая команда будет выполняться ровно 2 такта, то все складывается. Но, если я не ошибаюсь, у армов большинство команд выполняется за один такт. Может кто-нибудь подскажет, в чем дело?
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Mar 19 2010, 13:24
Сообщение #11


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата(Nikitoc @ Mar 19 2010, 15:23) *
Мне удалось разогнать процессор (at91sam7s256) до 100 Мгц.

Что за стремление разогнать процессор, даже не попытавшись сначала освоить работу с ним в штатном режиме?

Цитата(Nikitoc @ Mar 19 2010, 15:23) *
Но, если я не ошибаюсь, у армов большинство команд выполняется за один такт.

Ошибаетесь. Только MOV и ORR в приведенном листинге выполняются за один такт.

Цитата(Nikitoc @ Mar 19 2010, 15:23) *
Может кто-нибудь подскажет, в чем дело?

Оптимизатор надо было включить. Ну и на чтениях порта теряете время.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 19 2010, 13:47
Сообщение #12


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Цитата(aaarrr @ Mar 19 2010, 17:24) *
Ошибаетесь. Только MOV и ORR в приведенном листинге выполняются за один такт.


А не подскажете, случайно, где можно подробно посмотреть время исполнения (в тактах) ассемблерных команд?

Цитата
Оптимизатор надо было включить. Ну и на чтениях порта теряете время.


Ну да. При включенной оптимизации по времени 3-го уровня компилятор сократил код до 3-х команд:

Код
   319:            AT91C_BASE_PIOA -> PIO_CODR = AT91C_BASE_PIOA -> PIO_CODR | 0x00000800;
0x00102BC4  E5140BCC  LDR       R0,[R4,#-0x0BCC]
0x00102BC8  E3800B02  ORR       R0,R0,#0x00000800
0x00102BCC  E5040BCC  STR       R0,[R4,#-0x0BCC]
   320:                 AT91C_BASE_PIOA -> PIO_SODR = AT91C_BASE_PIOA -> PIO_SODR | 0x00000800;
0x00102BD0  E5140BD0  LDR       R0,[R4,#-0x0BD0]
0x00102BD4  E3800B02  ORR       R0,R0,#0x00000800
0x00102BD8  E5040BD0  STR       R0,[R4,#-0x0BD0]
   318:          while (1) {
0x00102BDC  EAFFFFF8  B         0x00102BC4

Но измерить разницу (увидеть на осциллографе) в периоде мне не удалось. Я имею в виду, что период так и остался равным примерно 200 нс...

А по поводу разгона... так я ж говорил это мне видео хочется поснимать biggrin.gif При таких условиях мне удается захватить примерно 3,5 fps (QCIF 176x144). Но меня ограничивает скорость COM-порта PC - 115200. Поэтому следующий этап - освоение SPI и DMA. Хочется сделать потоковую запись на SD-карточку. Если это конечно будет иметь смысл (по скорости).

Сообщение отредактировал Nikitoc - Mar 19 2010, 13:48
Go to the top of the page
 
+Quote Post
aaarrr
сообщение Mar 19 2010, 14:14
Сообщение #13


Гуру
******

Группа: Свой
Сообщений: 10 713
Регистрация: 11-12-04
Пользователь №: 1 448



Цитата(Nikitoc @ Mar 19 2010, 16:47) *
А не подскажете, случайно, где можно подробно посмотреть время исполнения (в тактах) ассемблерных команд?

В даташите на ARM7TDMI.

Цитата(Nikitoc @ Mar 19 2010, 16:47) *
Но измерить разницу (увидеть на осциллографе) в периоде мне не удалось. Я имею в виду, что период так и остался равным примерно 200 нс...

Было 22 такта, стало 19. Уберите чтение PIO_SODR и PIO_CODR - это регистры только для записи. И почитайте даташит на процессор.
Go to the top of the page
 
+Quote Post
Nikitoc
сообщение Mar 19 2010, 14:27
Сообщение #14


Местный
***

Группа: Validating
Сообщений: 207
Регистрация: 14-01-09
Из: Днепропетровск
Пользователь №: 43 367



Цитата(aaarrr @ Mar 19 2010, 18:14) *
В даташите на ARM7TDMI.
Было 22 такта, стало 19. Уберите чтение PIO_SODR и PIO_CODR - это регистры только для записи. И почитайте даташит на процессор.

:-) Все, я ушел просвещаться. Спасибо за помощь.
P.S. Хотя по поводу PIO_SODR и PIO_CODR я не понял.
Код
AT91C_BASE_PIOA -> PIO_CODR = AT91C_BASE_PIOA -> PIO_CODR | 0x00000800

Я здесь вроде не читаю, а записываю...
Как это сделать - на асме или на Си тоже можно?

Сообщение отредактировал Nikitoc - Mar 19 2010, 14:42
Go to the top of the page
 
+Quote Post
toweroff
сообщение Mar 19 2010, 20:04
Сообщение #15


Гуру
******

Группа: Свой
Сообщений: 2 957
Регистрация: 19-09-06
Из: Москва
Пользователь №: 20 514



Цитата
AT91C_BASE_PIOA -> PIO_SODR = AT91C_BASE_PIOA -> PIO_SODR | 0x00000800;


Цитата
Я здесь вроде не читаю, а записываю...


0x00102BC4 E5140BCC LDR R0,[R4,#-0x0BCC]
0x00102BC8 E3800B02 ORR R0,R0,#0x00000800
0x00102BCC E5040BCC STR R0,[R4,#-0x0BCC]

и где же _только пишем_?
Go to the top of the page
 
+Quote Post

3 страниц V   1 2 3 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 20th July 2025 - 12:42
Рейтинг@Mail.ru


Страница сгенерированна за 0.01436 секунд с 7
ELECTRONIX ©2004-2016