|
|
  |
TNKernel будет ли порт для cortex m4 ? |
|
|
|
Feb 19 2013, 21:16
|

embarrassed systems engineer
    
Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038

|
Выполнил черновой перенос существующего кода порта для Cortex-M3 (в который буду добавлять код для M4F) под GCC.Погонял тестовый код на Discovery STM32F4xx под IAR 5.41, IAR 6.40, GCC CodeSourcery (4.7.2 менторовский релиз 63) и упомянутый в этой ветке GNU Tools for ARM Embedded Processors.
По компактности сгенерированного кода (в порядке от меньшего к боьшему размеру) - IAR 5.x - 11632 - IAR 6.x - 13344 - GCC CS - 13344 - Toolchain - 14816
По быстродействию (переключение контекста / Dhrystone, не особо показательно, разница маленькая): - IAR 6.x (0.920 мкс) - 246502 DS - IAR 5.x (1.080 мкс) - 246850 DS - GCC CS (1.040 мкс) - 250490 DS - Toolchain (1.080 мкс) - 250936 DS
Тест Dhrystone гонял, но он тоже не показателен - примерно 250000 у всех, +/- пару процентов. При модификации кода показатели меняются (видимо смещается как-то оно во флешке и начинает играть акселератор).
Исходники компилируются обоими компиляторами GCC - CS/Toolchain, никаких уcловных веток между ними нет. Но мне пока CodeSourcery нравится больше - документация получше, код покомпактнее. И вроде бы поддерживает LTO, но ключики -flto компилятору и линкеру на результирующий файл влияния не оказали. Toolchain на -flto варнингует.
В-общем, следующий шаг - уже буду собственно плавучку прикручивать, тут CodeSourcery в бесплатной редакции Lite может подбросить фокусов - вроде там были искусственные ограничения на hard-FPU. Буду разбираться дальше.
|
|
|
|
|
Feb 20 2013, 08:54
|
Частый гость
 
Группа: Участник
Сообщений: 121
Регистрация: 27-04-09
Из: Украина
Пользователь №: 48 342

|
А вот с этим: arm-none-eabi кто нибудь, работал?
|
|
|
|
|
Feb 20 2013, 12:21
|
Частый гость
 
Группа: Участник
Сообщений: 121
Регистрация: 27-04-09
Из: Украина
Пользователь №: 48 342

|
Цитата(VslavX @ Feb 20 2013, 11:47)  Именно Линуксовая версия интересует? Я тестировал в этом топике версию с того же launchpad.net, но под Cygwin. Вроде же разницы на генерируемом выходном файле быть не должно? Да, именно линуховый вариант интересует, и в самом линухе. Извиняюсь з аоффтопик, но может кто-то подскажет? С помощью этого тулчейна можно компильнуьб рабочий бинарник для: Код -mcpu=arm946e-s -march=armv5te
Сообщение отредактировал Volldemar - Feb 20 2013, 12:32
|
|
|
|
|
Feb 20 2013, 15:58
|

Шаман
     
Группа: Модераторы
Сообщений: 3 064
Регистрация: 30-06-04
Из: Киев, Украина
Пользователь №: 221

|
Цитата(VslavX @ Feb 20 2013, 11:47)  Именно Линуксовая версия интересует? Я тестировал в этом топике версию с того же launchpad.net, но под Cygwin. Вроде же разницы на генерируемом выходном файле быть не должно? Разницы нет. Цитата(Volldemar @ Feb 20 2013, 14:21)  С помощью этого тулчейна можно компильнуьб рабочий бинарник для: Код -mcpu=arm946e-s -march=armv5te Насколько мне известно, этот тулчейн заточен под Cortex-M/R семейства.
|
|
|
|
|
Feb 20 2013, 19:53
|

embarrassed systems engineer
    
Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038

|
По теме переключения контекста FPU по требованию (по исключению) тоже хотелось бы услышать мнение All. После обдумывания мне кажется что хранить контекст FPU в стеке уже нельзя - иначе его будет невозможно восстановить по требованию (задача выполняется уже при произвольном стеке, и тут ей понадобился FPU - а стек-то уже тю-тю). Поэтому предлагается хранить контекст в блоке задчаи - TN_TCB. Но тут минус что контекст FPU большой - от 128 байт, и не каждая задача использует FPU - не всем оно надо. Поэтому предлагается завести пул блоков, для сохранения контекста. Когда задача начинает юзать FPU ей оттуда выделяется блок (ссылка храниться в TCB) и далее она пользуется блоком. При завершении задачи - блок возвращается. Таким образом пользователь может определить пул нужного размера - по числу задач работающих с FPU. Поддержку FPU в обработчиках прерываний/исключений думаю не реализовывать - код усложняется, скорость падает. P.S. А чем бы float/double на консоль выводить, а то мой самописный printf не поддерживает %f, %e, %a - наверное, пришло время добавить эту поддержку. Посмотрел реализации glibc - так там еще длинную арифметику надо. uglibc тоже не радужно. Может кто-то присоветует относительно более простое решение? Update: разобрался я с FPSCR, он автоматически в стеке сохраняется. При моем методе надо будет делать руками, главное - не забыть
|
|
|
|
|
Feb 21 2013, 03:00
|

фанат дивана
     
Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684

|
Я бы для начала попытался проанализировать плюсы и минусы вашего метода при различных сценариях использования. Сценарий первый: в данный момент времени две задачи (или более) работают с плавучкой. При таком сценарии, насколько я понял, после каждого переключения контекста на "плавучую" задачу будет происходить много чего: исключение, выяснение причины, сохранение контекста предыдущей задачи, поиск свободного пула для сохранения контекста новой задачи... То есть, это всё будет работать сильно медленнее, чем простой вариант а-ля FreeRtos. Сценарий второй (выигрышный для вашего варианта): Все задачи (или все кроме одной) перестали работать с плавучкой. В этом случае ничего не происходит, всё работает как M3. Мне кажется, что второй вариант будет встречаться значительно реже. К тому же, к FreeRtos-ному варианту можно просто добавить функцию окончания работы с плавучкой, типа tn_end_fpu(), в которой будет сбрасываться бит CONTROL.FPCA. В этом случае он не уступит вашему варианту и при втором сценарии (если конечно все задачи вызовут tn_end_fpu()).
--------------------
Если бы я знал, что такое электричество...
|
|
|
|
|
Feb 21 2013, 05:53
|

embarrassed systems engineer
    
Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038

|
Цитата(AHTOXA @ Feb 21 2013, 05:00)  Я бы для начала попытался проанализировать плюсы и минусы вашего метода при различных сценариях использования. Основной анализ проделан в статье ARM на которую Вы уже давали ссылку. Там же оба подхода довольно подробно рассмотрены. Из дополнительных минусов второго ("переключение по требованию") я вижу невозможность (хотя, скорее громоздкость и неудобство) использования FPU в обработчиках прерываний/исключений. Зато снижается оверхед при переключении контекста и interrupt latency. Цитата(AHTOXA @ Feb 21 2013, 05:00)  Сценарий первый: ... ... Сценарий второй ... С анализом сценариев у меня туго  . На данный момент у меня такого рода задачи, что я вообще не понимаю зачем нужен FPU. Будучи студентом в университете приходилось заниматься численным моделированием плазмы. На Фортране-IV. На СМ-4. Предметом гордости было наличие блока FIS. Потом кафедра купила СМ-1420 с полноценным FPP - радости было. Но сейчас таких задач у меня нет - скрипач FPU не нужен. Поэтому мне сложно сказать какой сценарий более частый и предпочтительный, и планирую реализовать оба подхода, с выбором по флагу компиляции. Второй сценарий сделаю несколько упрощенным - для начала не буду заморачиваться с пулом, просто буду хранить контекст в TCB. Если кто-то реально использует (или только планирует использовать) FPU в своих приложениях - то было бы интересно узнать какой типовой способ использования в разрезе RTOS - сколько задач используют FPU, есть ли использование FPU в обработчиках прерываний и прочее. Цитата(AHTOXA @ Feb 21 2013, 05:00)  (если конечно все задачи вызовут tn_end_fpu()). ИМХО такая функция полезна при обоих подходах. Если пользователя заботит быстродействие то ему надо предоставить возможность такой настройки. Update: Вот такое "понравилось": "GNUC C compiler (gcc) If a program is compiled with the FPU option, gcc might make use of the floating-point registers if register pressure is high, and running low on available registers for data processing. In some cases, the memory copy might also utilize floating-point registers to hold data" Соглашение ABI при наличии FPU разрешает его почти произвольное использование - даже если нет работы с данными типа float/double, регистры FPU все равно могут использоваться компилятором, хотя бы в качестве быстрого хранилища переменных. Поэтому весь код обработчиков прерываний (включая системные функции типа tn_sem_isignal()) нужно компилировать с -mfloat-abi=soft. И библиотеки тоже с такой опцией. И, соответственно, приложение - иначе несовместимость линковки (хотя, проверю линковку "soft" и "softfp", есть шанс). И кому такое надо - вообще не моги пользовать FPU? Получается что второй подход для систем с отдельной линковкой приложения. Разрешить использование FPU в обработчиках можно, но для этого надо для каждого сделать отдельную функцию-переходник в котором явно запрещается FPU - чтобы FPU-код в обработчике вызвал исключение. И такой переходник скушает почти весь выигрыш в быстродействии  Из компиляторов пока только Keil можно заставить не использовать FPU для "неплавучих" целей. GCC и IAR таких флажков не имеют.
|
|
|
|
|
Feb 21 2013, 20:01
|

embarrassed systems engineer
    
Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038

|
Реализовал оба метода переключения контекста. Метод 1: использование автоматического "ленивого" сохранения контекста FPU в стеке, полностью аналогичен коду порта scmRTOS Метод 2: метод переключения контекста по требованию. Имеется системная переменная - указатель на TCB задачи, контекст которой загружен в данный момент в регистры FPU. При переключении задачи эта переменная сравнивается с TCB загружаемой задачи. При совпадении доступ к FPU разрешается через биты регистра CPACR, иначе доступ запрещен. Когда текущая задача, не владеющая контекстом FPU пытается выполнить плавучую операцию - происходит исключение, сохраняющее регистры FPU в TCB задачи-владельца, и загружающее нужный контекст текущей задачи. Предварительно потестировал оба метода. Для начала картинка GCC<->IAR без поддержки FPU
Мой взгляд, разницы принципиальной нет. Теперь картинка сравнения разных методов, для компилятора GCC.
FPU1 - метод 1 FPU2 - метод 2 none - ни одна из двух тестовых задач не обращается к FPU Task1 - только первая тестовая задач обращается к FPU Task2 - только вторая тестовая задач обращается к FPU Task12 - первая и вторая тестовая задачи обращаются к FPU Для метода 1 следует помнить, что FPCA бит в регистре CONTROL является sticky - то есть если задача хотя бы раз (возможно в далеком прошлом) обратилась к FPU и теперь про него вообще забыла - крайняя левая картинка уже использоваться не будет - работает одна из правых. С явным сбросом FPCA могут быть проблемы, так как компилятор может неявно использовать FPU даже в отсутствие операций с float/double. Для метода 2 есть недостаток - не поддерживается FPU в прерываниях/исключениях. В связи с этим для гарантии код операционной системы следует компилировать с оцпией -mfloat-abi=soft. А приложение и математические библиотеки с опцией softfp. Иначе оно не будет линковаться. На ассемблер разумеется никаких ограничений. Еще немного потестирую и буду прикручивать к официальной версии 2.6. Кстати, там видно что пооптимизировать, предложу модификации. Update: еще покрутил ассемблерный листинг - для метода 2 времянки еще улучшились немного. На крайней правой нижней картинке теперь общее время 3.73мкс. Можно еще уменьшить за счет удаления всяких проверок (типа не пришло ли исключение из режима обработчика), но это уже может сказаться на надежности. Update 2: у меня тут префетч из флеша в тесте выключался оказывается, почему то заметно влияло только на самую нижнуюю правую картинку - итого полное время 3,30 мкс для метода 2. Update 3: тестирование прошло удачно, обновил картинку с цифрами. Префетч включен
|
|
|
|
|
Feb 22 2013, 02:59
|

фанат дивана
     
Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684

|
Очень интересно. Только я не понял, как читать осциллограммы  Сначала думал, что жёлтый луч - это одна задача, синий - вторая, а промежуток между ними - переключение контекста. Но потом засомневался - что-то уж очень маленькое время переключения контекста получается. Что касаемо того, что gcc может использовать регистры FPU по своему желанию - это, по идее, достаточно легко обнаружить при отладке (и как-то изменить программу, чтоб это убрать).
--------------------
Если бы я знал, что такое электричество...
|
|
|
|
|
Feb 22 2013, 05:39
|

embarrassed systems engineer
    
Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038

|
Цитата(AHTOXA @ Feb 22 2013, 04:59)  Очень интересно. Только я не понял, как читать осциллограммы  Сейчас я убегаю, поэтому - по быстрому - фрагмент тестового кода: CODE #define TST_CONTEXT_STACK_SIZE 128
volatile BOOL tst_context_exit; BYTE use_fpu;
void tst_context_task_func(void *param) { PTN_SEM sem;
// // tst_printf("\r\nTest task started...\f"); // sem = (PTN_SEM) param; for(;;) { #ifdef _TEST_CONTEXT_PIN_2 IO_PORT_CLR(_TEST_CONTEXT_PIN_2); #endif tn_sem_acquire (sem, TN_WAIT_INFINITE); #ifdef _TEST_CONTEXT_PIN_1 IO_PORT_CLR(_TEST_CONTEXT_PIN_1); #endif if (tst_context_exit) { // // tst_printf("\r\nTest task completed...\f"); // tn_task_exit(0, 0); } #if TN_SUPPORT_FPU if (use_fpu & 2) { fpu_touch(); } #endif } }
void io_test_context(void) { TN_SEM test_switch_sem; TN_TCB test_task_clear; PVOID test_task_stack[TST_CONTEXT_STACK_SIZE]; DWORD lock;
tst_printf("\r\nContext switch test...\f"); tst_context_exit = FALSE;
lock = hal_lock_interrupt(); { #ifdef _TEST_CONTEXT_PIN_1 #if HAL_IO_SET_MODE IO_SET_MODE(_TEST_CONTEXT_PIN_1); #else IO_PORT(_TEST_CONTEXT_PIN_1)->sFIO_DIR |= IO_MASK(_TEST_CONTEXT_PIN_1); #endif #endif #ifdef _TEST_CONTEXT_PIN_2 #if HAL_IO_SET_MODE IO_SET_MODE(_TEST_CONTEXT_PIN_2); #else IO_PORT(_TEST_CONTEXT_PIN_2)->sFIO_DIR |= IO_MASK(_TEST_CONTEXT_PIN_2); #endif #endif } hal_unlock_interrupt(lock);
tn_sem_create (&test_switch_sem, 1, 1); tn_task_create( (TN_TCB*)&test_task_clear, tst_context_task_func, IO_PRIMARY_PRIORITY-4, &(test_task_stack[TST_CONTEXT_STACK_SIZE-1]), TST_CONTEXT_STACK_SIZE, (PVOID)&test_switch_sem, TN_TASK_START_ON_CREATION);
for(;;) { tn_task_sleep(MS_TO_TICKS(1)); #ifdef _TEST_CONTEXT_PIN_1 IO_PORT_SET(_TEST_CONTEXT_PIN_1); #endif tn_sem_signal(&test_switch_sem); #ifdef _TEST_CONTEXT_PIN_2 IO_PORT_SET(_TEST_CONTEXT_PIN_2); #endif if (tst_inkey() == 27) { tst_printf("\r\nStopping test task...\f"); while(test_task_clear.task_state != TSK_STATE_DORMANT) { tst_context_exit = TRUE; tn_sem_signal(&test_switch_sem); tn_task_sleep(MS_TO_TICKS(10)); } tn_task_delete((TN_TCB*)&test_task_clear); tn_sem_delete(&test_switch_sem); tst_printf("\r\nTest completed...\f"); return; }
#if TN_SUPPORT_FPU if (use_fpu & 1) { fpu_touch(); } #endif } }
Вечером продолжу тестирование и буду уже смотреть официальную ветку, там тоже есть что обсудить. P.S. А префетч я отключал чтобы по-честному соревноваться с Вашими тестами scmRTOS - у Вас там ревизия проца старая  P.P.S. Картинки уже устарели - есть круче
|
|
|
|
|
Feb 25 2013, 18:50
|
Частый гость
 
Группа: Участник
Сообщений: 78
Регистрация: 7-04-10
Из: Пушкино
Пользователь №: 56 462

|
Цитата(VslavX @ Feb 12 2013, 10:16)  Порт для Cortex-M3 спокойно завелся на STM32F407 (пока без FPU). Не могли ли бы вы поделиться проектом? У меня, к сожалению сделать это не получилось. Программа постоянно прыгает по "OS timer tick" в tn_timer_task_func с периодической обработкой SysTick_Handler, но никак не переходит в функцию моей единственной задачи. Буду благодарен любой помощи, мое первое знакомство с tn_kernel. Работаю все на той же stm32f4discovery под mdk-arm.
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|