реклама на сайте
подробности

 
 
3 страниц V  < 1 2 3 >  
Reply to this topicStart new topic
> TNKernel будет ли порт для cortex m4 ?
VslavX
сообщение Feb 19 2013, 21:16
Сообщение #16


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



Выполнил черновой перенос существующего кода порта для Cortex-M3 (в который буду добавлять код для M4F) под GCC.Погонял тестовый код на Discovery STM32F4xx под IAR 5.41, IAR 6.40, GCC CodeSourcery (4.7.2 менторовский релиз 63) и упомянутый в этой ветке GNU Tools for ARM Embedded Processors.

По компактности сгенерированного кода (в порядке от меньшего к боьшему размеру)
- IAR 5.x - 11632
- IAR 6.x - 13344
- GCC CS - 13344
- Toolchain - 14816

По быстродействию (переключение контекста / Dhrystone, не особо показательно, разница маленькая):
- IAR 6.x (0.920 мкс) - 246502 DS
- IAR 5.x (1.080 мкс) - 246850 DS
- GCC CS (1.040 мкс) - 250490 DS
- Toolchain (1.080 мкс) - 250936 DS

Тест Dhrystone гонял, но он тоже не показателен - примерно 250000 у всех, +/- пару процентов. При модификации кода показатели меняются (видимо смещается как-то оно во флешке и начинает играть акселератор).

Исходники компилируются обоими компиляторами GCC - CS/Toolchain, никаких уcловных веток между ними нет. Но мне пока CodeSourcery нравится больше - документация получше, код покомпактнее. И вроде бы поддерживает LTO, но ключики -flto компилятору и линкеру на результирующий файл влияния не оказали. Toolchain на -flto варнингует.

В-общем, следующий шаг - уже буду собственно плавучку прикручивать, тут CodeSourcery в бесплатной редакции Lite может подбросить фокусов - вроде там были искусственные ограничения на hard-FPU. Буду разбираться дальше.
Go to the top of the page
 
+Quote Post
Volldemar
сообщение Feb 20 2013, 08:54
Сообщение #17


Частый гость
**

Группа: Участник
Сообщений: 121
Регистрация: 27-04-09
Из: Украина
Пользователь №: 48 342



А вот с этим: arm-none-eabi кто нибудь, работал?
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Feb 20 2013, 09:45
Сообщение #18


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Именно про него парой постов выше упоминали аж несколько авторов.


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
VslavX
сообщение Feb 20 2013, 09:47
Сообщение #19


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



Цитата(Volldemar @ Feb 20 2013, 10:54) *
А вот с этим: arm-none-eabi кто нибудь, работал?

Именно Линуксовая версия интересует? Я тестировал в этом топике версию с того же launchpad.net, но под Cygwin. Вроде же разницы на генерируемом выходном файле быть не должно?
Go to the top of the page
 
+Quote Post
Volldemar
сообщение Feb 20 2013, 12:21
Сообщение #20


Частый гость
**

Группа: Участник
Сообщений: 121
Регистрация: 27-04-09
Из: Украина
Пользователь №: 48 342



Цитата(VslavX @ Feb 20 2013, 11:47) *
Именно Линуксовая версия интересует? Я тестировал в этом топике версию с того же launchpad.net, но под Cygwin. Вроде же разницы на генерируемом выходном файле быть не должно?

Да, именно линуховый вариант интересует, и в самом линухе.
Извиняюсь з аоффтопик, но может кто-то подскажет?
С помощью этого тулчейна можно компильнуьб рабочий бинарник для:
Код
-mcpu=arm946e-s -march=armv5te


Сообщение отредактировал Volldemar - Feb 20 2013, 12:32
Go to the top of the page
 
+Quote Post
IgorKossak
сообщение Feb 20 2013, 15:58
Сообщение #21


Шаман
******

Группа: Модераторы
Сообщений: 3 064
Регистрация: 30-06-04
Из: Киев, Украина
Пользователь №: 221



Цитата(VslavX @ Feb 20 2013, 11:47) *
Именно Линуксовая версия интересует? Я тестировал в этом топике версию с того же launchpad.net, но под Cygwin. Вроде же разницы на генерируемом выходном файле быть не должно?

Разницы нет.

Цитата(Volldemar @ Feb 20 2013, 14:21) *
С помощью этого тулчейна можно компильнуьб рабочий бинарник для:
Код
-mcpu=arm946e-s -march=armv5te

Насколько мне известно, этот тулчейн заточен под Cortex-M/R семейства.
Go to the top of the page
 
+Quote Post
VslavX
сообщение Feb 20 2013, 19:53
Сообщение #22


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



По теме переключения контекста FPU по требованию (по исключению) тоже хотелось бы услышать мнение All. После обдумывания мне кажется что хранить контекст FPU в стеке уже нельзя - иначе его будет невозможно восстановить по требованию (задача выполняется уже при произвольном стеке, и тут ей понадобился FPU - а стек-то уже тю-тю). Поэтому предлагается хранить контекст в блоке задчаи - TN_TCB. Но тут минус что контекст FPU большой - от 128 байт, и не каждая задача использует FPU - не всем оно надо. Поэтому предлагается завести пул блоков, для сохранения контекста. Когда задача начинает юзать FPU ей оттуда выделяется блок (ссылка храниться в TCB) и далее она пользуется блоком. При завершении задачи - блок возвращается. Таким образом пользователь может определить пул нужного размера - по числу задач работающих с FPU. Поддержку FPU в обработчиках прерываний/исключений думаю не реализовывать - код усложняется, скорость падает.

P.S. А чем бы float/double на консоль выводить, а то мой самописный printf не поддерживает %f, %e, %a - наверное, пришло время добавить эту поддержку. Посмотрел реализации glibc - так там еще длинную арифметику надо. uglibc тоже не радужно. Может кто-то присоветует относительно более простое решение?

Update: разобрался я с FPSCR, он автоматически в стеке сохраняется. При моем методе надо будет делать руками, главное - не забыть sm.gif
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Feb 21 2013, 03:00
Сообщение #23


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Я бы для начала попытался проанализировать плюсы и минусы вашего метода при различных сценариях использования.
Сценарий первый: в данный момент времени две задачи (или более) работают с плавучкой. При таком сценарии, насколько я понял, после каждого переключения контекста на "плавучую" задачу будет происходить много чего: исключение, выяснение причины, сохранение контекста предыдущей задачи, поиск свободного пула для сохранения контекста новой задачи... То есть, это всё будет работать сильно медленнее, чем простой вариант а-ля FreeRtos.
Сценарий второй (выигрышный для вашего варианта): Все задачи (или все кроме одной) перестали работать с плавучкой. В этом случае ничего не происходит, всё работает как M3.
Мне кажется, что второй вариант будет встречаться значительно реже. К тому же, к FreeRtos-ному варианту можно просто добавить функцию окончания работы с плавучкой, типа tn_end_fpu(), в которой будет сбрасываться бит CONTROL.FPCA. В этом случае он не уступит вашему варианту и при втором сценарии (если конечно все задачи вызовут tn_end_fpu()).


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
VslavX
сообщение Feb 21 2013, 05:53
Сообщение #24


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



Цитата(AHTOXA @ Feb 21 2013, 05:00) *
Я бы для начала попытался проанализировать плюсы и минусы вашего метода при различных сценариях использования.

Основной анализ проделан в статье ARM на которую Вы уже давали ссылку. Там же оба подхода довольно подробно рассмотрены. Из дополнительных минусов второго ("переключение по требованию") я вижу невозможность (хотя, скорее громоздкость и неудобство) использования FPU в обработчиках прерываний/исключений. Зато снижается оверхед при переключении контекста и interrupt latency.

Цитата(AHTOXA @ Feb 21 2013, 05:00) *
Сценарий первый: ...
...
Сценарий второй ...

С анализом сценариев у меня туго sm.gif. На данный момент у меня такого рода задачи, что я вообще не понимаю зачем нужен FPU. Будучи студентом в университете приходилось заниматься численным моделированием плазмы. На Фортране-IV. На СМ-4. Предметом гордости было наличие блока FIS. Потом кафедра купила СМ-1420 с полноценным FPP - радости было. Но сейчас таких задач у меня нет - скрипач FPU не нужен. Поэтому мне сложно сказать какой сценарий более частый и предпочтительный, и планирую реализовать оба подхода, с выбором по флагу компиляции. Второй сценарий сделаю несколько упрощенным - для начала не буду заморачиваться с пулом, просто буду хранить контекст в TCB.

Если кто-то реально использует (или только планирует использовать) FPU в своих приложениях - то было бы интересно узнать какой типовой способ использования в разрезе RTOS - сколько задач используют FPU, есть ли использование FPU в обработчиках прерываний и прочее.

Цитата(AHTOXA @ Feb 21 2013, 05:00) *
(если конечно все задачи вызовут tn_end_fpu()).

ИМХО такая функция полезна при обоих подходах. Если пользователя заботит быстродействие то ему надо предоставить возможность такой настройки.

Update:
Вот такое "понравилось":

"GNUC C compiler (gcc)
If a program is compiled with the FPU option, gcc might make use of the floating-point registers
if register pressure is high, and running low on available registers for data processing. In some
cases, the memory copy might also utilize floating-point registers to hold data"

Соглашение ABI при наличии FPU разрешает его почти произвольное использование - даже если нет работы с данными типа float/double, регистры FPU все равно могут использоваться компилятором, хотя бы в качестве быстрого хранилища переменных. Поэтому весь код обработчиков прерываний (включая системные функции типа tn_sem_isignal()) нужно компилировать с -mfloat-abi=soft. И библиотеки тоже с такой опцией. И, соответственно, приложение - иначе несовместимость линковки (хотя, проверю линковку "soft" и "softfp", есть шанс). И кому такое надо - вообще не моги пользовать FPU? Получается что второй подход для систем с отдельной линковкой приложения. Разрешить использование FPU в обработчиках можно, но для этого надо для каждого сделать отдельную функцию-переходник в котором явно запрещается FPU - чтобы FPU-код в обработчике вызвал исключение. И такой переходник скушает почти весь выигрыш в быстродействии sad.gif

Из компиляторов пока только Keil можно заставить не использовать FPU для "неплавучих" целей. GCC и IAR таких флажков не имеют.
Go to the top of the page
 
+Quote Post
VslavX
сообщение Feb 21 2013, 20:01
Сообщение #25


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



Реализовал оба метода переключения контекста.
Метод 1: использование автоматического "ленивого" сохранения контекста FPU в стеке, полностью аналогичен коду порта scmRTOS
Метод 2: метод переключения контекста по требованию. Имеется системная переменная - указатель на TCB задачи, контекст которой загружен в данный момент в регистры FPU. При переключении задачи эта переменная сравнивается с TCB загружаемой задачи. При совпадении доступ к FPU разрешается через биты регистра CPACR, иначе доступ запрещен. Когда текущая задача, не владеющая контекстом FPU пытается выполнить плавучую операцию - происходит исключение, сохраняющее регистры FPU в TCB задачи-владельца, и загружающее нужный контекст текущей задачи.
Предварительно потестировал оба метода.
Для начала картинка GCC<->IAR без поддержки FPU
Прикрепленное изображение

Мой взгляд, разницы принципиальной нет.

Теперь картинка сравнения разных методов, для компилятора GCC.
Прикрепленное изображение

FPU1 - метод 1
FPU2 - метод 2
none - ни одна из двух тестовых задач не обращается к FPU
Task1 - только первая тестовая задач обращается к FPU
Task2 - только вторая тестовая задач обращается к FPU
Task12 - первая и вторая тестовая задачи обращаются к FPU

Для метода 1 следует помнить, что FPCA бит в регистре CONTROL является sticky - то есть если задача хотя бы раз (возможно в далеком прошлом) обратилась к FPU и теперь про него вообще забыла - крайняя левая картинка уже использоваться не будет - работает одна из правых. С явным сбросом FPCA могут быть проблемы, так как компилятор может неявно использовать FPU даже в отсутствие операций с float/double.

Для метода 2 есть недостаток - не поддерживается FPU в прерываниях/исключениях. В связи с этим для гарантии код операционной системы следует компилировать с оцпией -mfloat-abi=soft. А приложение и математические библиотеки с опцией softfp. Иначе оно не будет линковаться. На ассемблер разумеется никаких ограничений.

Еще немного потестирую и буду прикручивать к официальной версии 2.6. Кстати, там видно что пооптимизировать, предложу модификации.

Update: еще покрутил ассемблерный листинг - для метода 2 времянки еще улучшились немного. На крайней правой нижней картинке теперь общее время 3.73мкс. Можно еще уменьшить за счет удаления всяких проверок (типа не пришло ли исключение из режима обработчика), но это уже может сказаться на надежности.

Update 2: у меня тут префетч из флеша в тесте выключался оказывается, почему то заметно влияло только на самую нижнуюю правую картинку - итого полное время 3,30 мкс для метода 2.

Update 3: тестирование прошло удачно, обновил картинку с цифрами. Префетч включен
Прикрепленное изображение
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Feb 22 2013, 02:59
Сообщение #26


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Очень интересно. Только я не понял, как читать осциллограммыsm.gif
Сначала думал, что жёлтый луч - это одна задача, синий - вторая, а промежуток между ними - переключение контекста. Но потом засомневался - что-то уж очень маленькое время переключения контекста получается.
Что касаемо того, что gcc может использовать регистры FPU по своему желанию - это, по идее, достаточно легко обнаружить при отладке (и как-то изменить программу, чтоб это убрать).


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
VslavX
сообщение Feb 22 2013, 05:39
Сообщение #27


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



Цитата(AHTOXA @ Feb 22 2013, 04:59) *
Очень интересно. Только я не понял, как читать осциллограммыsm.gif

Сейчас я убегаю, поэтому - по быстрому - фрагмент тестового кода:

CODE

#define TST_CONTEXT_STACK_SIZE 128

volatile BOOL tst_context_exit;
BYTE use_fpu;

void tst_context_task_func(void *param)
{
PTN_SEM sem;

//
// tst_printf("\r\nTest task started...\f");
//
sem = (PTN_SEM) param;
for(;;)
{
#ifdef _TEST_CONTEXT_PIN_2
IO_PORT_CLR(_TEST_CONTEXT_PIN_2);
#endif
tn_sem_acquire (sem, TN_WAIT_INFINITE);
#ifdef _TEST_CONTEXT_PIN_1
IO_PORT_CLR(_TEST_CONTEXT_PIN_1);
#endif
if (tst_context_exit)
{
//
// tst_printf("\r\nTest task completed...\f");
//
tn_task_exit(0, 0);
}
#if TN_SUPPORT_FPU
if (use_fpu & 2)
{
fpu_touch();
}
#endif
}
}

void io_test_context(void)
{
TN_SEM test_switch_sem;
TN_TCB test_task_clear;
PVOID test_task_stack[TST_CONTEXT_STACK_SIZE];
DWORD lock;

tst_printf("\r\nContext switch test...\f");
tst_context_exit = FALSE;

lock = hal_lock_interrupt();
{
#ifdef _TEST_CONTEXT_PIN_1
#if HAL_IO_SET_MODE
IO_SET_MODE(_TEST_CONTEXT_PIN_1);
#else
IO_PORT(_TEST_CONTEXT_PIN_1)->sFIO_DIR |= IO_MASK(_TEST_CONTEXT_PIN_1);
#endif
#endif
#ifdef _TEST_CONTEXT_PIN_2
#if HAL_IO_SET_MODE
IO_SET_MODE(_TEST_CONTEXT_PIN_2);
#else
IO_PORT(_TEST_CONTEXT_PIN_2)->sFIO_DIR |= IO_MASK(_TEST_CONTEXT_PIN_2);
#endif
#endif
}
hal_unlock_interrupt(lock);

tn_sem_create (&test_switch_sem, 1, 1);
tn_task_create(
(TN_TCB*)&test_task_clear,
tst_context_task_func,
IO_PRIMARY_PRIORITY-4,
&(test_task_stack[TST_CONTEXT_STACK_SIZE-1]),
TST_CONTEXT_STACK_SIZE,
(PVOID)&test_switch_sem,
TN_TASK_START_ON_CREATION);

for(;;)
{
tn_task_sleep(MS_TO_TICKS(1));
#ifdef _TEST_CONTEXT_PIN_1
IO_PORT_SET(_TEST_CONTEXT_PIN_1);
#endif
tn_sem_signal(&test_switch_sem);
#ifdef _TEST_CONTEXT_PIN_2
IO_PORT_SET(_TEST_CONTEXT_PIN_2);
#endif
if (tst_inkey() == 27)
{
tst_printf("\r\nStopping test task...\f");
while(test_task_clear.task_state != TSK_STATE_DORMANT)
{
tst_context_exit = TRUE;
tn_sem_signal(&test_switch_sem);
tn_task_sleep(MS_TO_TICKS(10));
}
tn_task_delete((TN_TCB*)&test_task_clear);
tn_sem_delete(&test_switch_sem);
tst_printf("\r\nTest completed...\f");
return;
}

#if TN_SUPPORT_FPU
if (use_fpu & 1)
{
fpu_touch();
}
#endif
}
}


Вечером продолжу тестирование и буду уже смотреть официальную ветку, там тоже есть что обсудить.
P.S. А префетч я отключал чтобы по-честному соревноваться с Вашими тестами scmRTOS - у Вас там ревизия проца старая sm.gif
P.P.S. Картинки уже устарели - есть круче sm.gif
Go to the top of the page
 
+Quote Post
Valentine Logino...
сообщение Feb 25 2013, 18:50
Сообщение #28


Частый гость
**

Группа: Участник
Сообщений: 78
Регистрация: 7-04-10
Из: Пушкино
Пользователь №: 56 462



Цитата(VslavX @ Feb 12 2013, 10:16) *
Порт для Cortex-M3 спокойно завелся на STM32F407 (пока без FPU).

Не могли ли бы вы поделиться проектом? У меня, к сожалению сделать это не получилось.
Программа постоянно прыгает по "OS timer tick" в tn_timer_task_func с периодической обработкой SysTick_Handler, но никак не переходит в функцию моей единственной задачи.
Буду благодарен любой помощи, мое первое знакомство с tn_kernel. Работаю все на той же stm32f4discovery под mdk-arm.
Go to the top of the page
 
+Quote Post
VslavX
сообщение Feb 25 2013, 20:24
Сообщение #29


embarrassed systems engineer
*****

Группа: Свой
Сообщений: 1 083
Регистрация: 24-10-05
Из: Осокорки
Пользователь №: 10 038



Цитата(Valentine Loginov @ Feb 25 2013, 20:50) *
Не могли ли бы вы поделиться проектом? У меня, к сожалению сделать это не получилось.

Порт "официальной" ветки и пример под stm32f4xx готовы, к сожалению, под IAR/GCC. Также внесена часть моих оптимизаций - которые вносятся без глубокого хирургического вмешательства. Осталось написать "сопроводиловку" и еще немного потестировать (там аж 8 вариантов компиляции нарисовалось) - и будет открыто.
Go to the top of the page
 
+Quote Post
yuri_t
сообщение Mar 9 2013, 21:53
Сообщение #30


Частый гость
**

Группа: Свой
Сообщений: 163
Регистрация: 24-08-05
Пользователь №: 7 937



TNKernel порт для Cortex-M4, написанный VslavX, выложен на сайте www.tnkernel.com.

Просьба со всеми вопросами обращаться непосредственно к автору ( VslavX )


Go to the top of the page
 
+Quote Post

3 страниц V  < 1 2 3 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 28th June 2025 - 20:00
Рейтинг@Mail.ru


Страница сгенерированна за 0.01542 секунд с 7
ELECTRONIX ©2004-2016