реклама на сайте
подробности

 
 
> Зависает один процесс
kurtis
сообщение Mar 31 2010, 12:30
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 466
Регистрация: 21-06-05
Пользователь №: 6 205



Здравствуйте!
Столкнулся с проблемой зависания процесса, который занимается аналоговыми измерениями. Всего в системе 4 процесса, приоритеты распределены следующим образом
Код
#define ANMEAS_PRI  (OS::pr1) /* Аналоговые измерения */
#define UART0_PRI   (OS::pr0) /* Работа с UART */
#define TECHNO_PRI  (OS::pr3) /* Технология (логика работы программы) */
#define PERIPH_PRI  (OS::pr2) /* Работа с периферийными устройствами */

Если я меняю значение приоритета ANMEAS_PRI на максимальный (с OS::pri1 на OS::pri0) то зависания пропадают. Проблема в том что я не могу разобраться почему в одном случае оно работает, а в другом - нет.
Исходный код доступен здесь.
Для поиска неисправностей, я написал небольшой макрос (SET_INFO(x)), который посылает в UART текущий номер, все вызовы макроса расположены в порядке возрастания порядкового номера. Модифицированный вариант исходника лежит здесь.
Таким образом установил, что после зависания процесса, в UART отправляется число 26
Код
104         }
105         SET_INFO(26);
106
107         Sleep(5,5);// 11 mc
108         SET_INFO(27);
109         LED_Out_Str[24] = GREEN_LAMP;
110         SET_INFO(28);
Т.е. прямо перед вызовом функции Sleep(). Далее я перегрузил функцию Sleep() (чтоб вызывалась конкретная функция только для одного процесса), и модифицировал по описанной выше методике, получилось такое
Код
void TBaseProcess::Sleep(TTimeout timeout, uint8_t huita)
{
    {
    TCritSect cs;

    SET_INFO(30);
    Kernel.ProcessTable[Kernel.CurProcPriority]->Timeout = timeout;
    SET_INFO(31);
    Kernel.SetProcessUnready(Kernel.CurProcPriority);
    SET_INFO(32);
    Kernel.Scheduler();
    SET_INFO(33);
    }
    SET_INFO(34);
}
Теперь последнее отправляемое число в UART 32, т.е. прямо перед вызовом Kernel.Scheduler(). Дальше лезть страшно.

В чем может возникать проблема что при смене приоритетов процесс наглухо зависает? Может есть какие-то рекомендации, чего делать не стоит или у меня какие-то существенные ошибки в описании процесса?
Заранее Спасибо!:))

P.S. Версия scmRTOS 3.10, компилятор avr-gcc (4.3.3)
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
kurtis
сообщение Mar 31 2010, 18:15
Сообщение #2


Местный
***

Группа: Свой
Сообщений: 466
Регистрация: 21-06-05
Пользователь №: 6 205



2 Сергей Борщ
Попробовал вашу методику. Поместил ваш код в фунцию TBaseProcess::Sleep(), в переменной Waiter сохраняется адрес зависшего процесса AnalogMeasure.

2 AHTOXA
Остальные работают. В других процессах идет опрос клавиатуры, вывод информации на жки и засветка светодиодов.
Go to the top of the page
 
+Quote Post
dxp
сообщение Apr 1 2010, 03:21
Сообщение #3


Adept
******

Группа: Свой
Сообщений: 3 469
Регистрация: 6-12-04
Из: Novosibirsk
Пользователь №: 1 343



Цитата(kurtis @ Apr 1 2010, 01:15) *
2 Сергей Борщ
Попробовал вашу методику. Поместил ваш код в фунцию TBaseProcess::Sleep(), в переменной Waiter сохраняется адрес зависшего процесса AnalogMeasure.

Значит, это он уснул добровольно. Посмотрите, чему равно значение таймаута этого процесса. При достижении таймаутом нуля процесс должен быть разбужен. Еще посмотрите ReadyProcessMap - точно ли процесс спит или готов к выполнению (соответствующий бит установлен), но по какой-то причине не работает.


--------------------
«Отыщи всему начало, и ты многое поймёшь» К. Прутков
Go to the top of the page
 
+Quote Post
BAT
сообщение Mar 29 2011, 12:31
Сообщение #4


Участник
*

Группа: Участник
Сообщений: 35
Регистрация: 22-12-05
Пользователь №: 12 556



Столкнулся с похожей проблемой. Есть проект, где в паре процессов используется в основном цикле Sleep.
Что-то типа
CODE
for(;;)
{
Sleep(10);

. . .

}


Время от времени (достаточно редко) процессы застревают именно в Sleep.
Timeout процесса при этом равен нулю. Процесс к выполнению в карте процессов не готов.
Порт под STM Cortex-M3. IAR 6.10.
Стек не переполняется с запасом.

Какие, хотя бы приблизительно, могут быть косяки с моей стороны приводящие к такому результату? Не могу понять, где копать.
Некорректное использование переменных с доступом из разных процессов может приводить к такому?
Правда одновременная модификация нигде не используется.
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Mar 30 2011, 05:34
Сообщение #5


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Цитата(BAT @ Mar 29 2011, 18:31) *
Стек не переполняется с запасом.

Меня смутила эта фраза. Вы хотели сказать - "стеки"?


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
BAT
сообщение Mar 30 2011, 06:33
Сообщение #6


Участник
*

Группа: Участник
Сообщений: 35
Регистрация: 22-12-05
Пользователь №: 12 556



Цитата(AHTOXA @ Mar 30 2011, 08:34) *
Меня смутила эта фраза. Вы хотели сказать - "стеки"?


ну да sm.gif конечно для каждого процесса свой
просто как-то по старой очень привычке называю их одним иногда

Попробую добавить TCritSect cs. Попозже напишу результат.
Go to the top of the page
 
+Quote Post
BAT
сообщение Mar 30 2011, 08:18
Сообщение #7


Участник
*

Группа: Участник
Сообщений: 35
Регистрация: 22-12-05
Пользователь №: 12 556



CODE
TStackItem* OS::TKernel::ContextSwitchHook(TStackItem* sp)
{
TCritSect cs; <--- здесь

ProcessTable[CurProcPriority]->StackPointer = sp;
sp = ProcessTable[SchedProcPriority]->StackPointer;

#if scmRTOS_CONTEXT_SWITCH_USER_HOOK_ENABLE == 1
ContextSwitchUserHook();
#endif

CurProcPriority = SchedProcPriority;
return sp;
}


Туда я добавил? Если да, то не помогло sad.gif. Все это чаще всего проявляется, когда активно начинает работать высокоприоритетный процес + идет активно связь по компорту, а она реализована в силу особенностей на прерываниях с использованием канала оси. OS::TISRW ISR на обработчиках стоит.
Go to the top of the page
 
+Quote Post
dxp
сообщение Mar 30 2011, 12:56
Сообщение #8


Adept
******

Группа: Свой
Сообщений: 3 469
Регистрация: 6-12-04
Из: Novosibirsk
Пользователь №: 1 343



Цитата(BAT @ Mar 30 2011, 15:18) *
Туда я добавил? Если да, то не помогло sad.gif. Все это чаще всего проявляется, когда активно начинает работать высокоприоритетный процес + идет активно связь по компорту, а она реализована в силу особенностей на прерываниях с использованием канала оси. OS::TISRW ISR на обработчиках стоит.

Да, добавили правильно. Если у вашего порта приоритетный контроллер прерываний и прерывание переключения контекстов может быть прервано (вытеснено) другим прерыванием, то эту критическую секцию надо там оставить (иначе чревато проблемами). В противном случае можно убрать.

Причину найти с ходу тяжело. Если есть возможность, то для начала добиться повторяемости (определить, при каких условиях это происходит). Тогда уже можно экспериментировать с целью локализовать проблему.

По симптомам вообще похоже на переполнение стека, когда данные стека налезают на чужую память. Ну, и вообще, такое поведение характерно для ошибок работы с памятью, когда из-за неправильной адресации портится чужая память. Посмотрите - остальные потроха объекта-процесса не портятся? Только Timeout?

По размерам стеков как определили, что их объём достаточен?

По самой оси кроме вышеописанного косяка с приоритетными контроллерами прерываний, вопросов, вроде, не замечено.


--------------------
«Отыщи всему начало, и ты многое поймёшь» К. Прутков
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Mar 30 2011, 14:15
Сообщение #9


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Цитата(dxp @ Mar 30 2011, 18:56) *
Да, добавили правильно. Если у вашего порта приоритетный контроллер прерываний и прерывание переключения контекстов может быть прервано (вытеснено) другим прерыванием, то эту критическую секцию надо там оставить (иначе чревато проблемами). В противном случае можно убрать.

В порте(ах) для Cortex-M3 прерывания при вызове OS::TKernel::ContextSwitchHook() и так запрещены:
OS_Target_asm.S:
Код
PendSVC_ISR:
    CPSID   I                 // Prevent interruption during context switch
...
    LDR     R1, =os_context_switch_hook    // os_context_switch_hook();
    BLX     R1

так что эта критическая секция не нужна.


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
dxp
сообщение Mar 31 2011, 05:04
Сообщение #10


Adept
******

Группа: Свой
Сообщений: 3 469
Регистрация: 6-12-04
Из: Novosibirsk
Пользователь №: 1 343



Цитата(AHTOXA @ Mar 30 2011, 21:15) *
В порте(ах) для Cortex-M3 прерывания при вызове OS::TKernel::ContextSwitchHook() и так запрещены:
OS_Target_asm.S:
Код
PendSVC_ISR:
    CPSID   I                 // Prevent interruption during context switch
...
    LDR     R1, =os_context_switch_hook    // os_context_switch_hook();
    BLX     R1

так что эта критическая секция не нужна.

Ты про свой порт или это у IAR'ного подсмотрел?

Цитата(BAT @ Mar 30 2011, 20:19) *
Кстати, в новом релизе не планируется добавить дебагрежима на такие случаи, чтоб были переменные с данными по использованию стеков?

Да, будет специальный режим отладки (кстати, это уже есть, лежит в репозитории в ветке, которая относится к подготовке релиза, pre-v400), и интерфейс (специальная функция) для получения информации о запасе по стеку. Также, будет возможность засекать адрес сервиса, который ожидает процесс - бывает, что процесс висит, чего-то ждёт, тут полезно бывает узнать, чего он ждёт. Ещё будет профилировка работы процессов (два вида, в виде расширений). Всё это будет подробно описано в документации.

Цитата(BAT @ Mar 30 2011, 20:19) *
Самое неприятное, что ошибка вылезает нечасто. И пока не могу добиться стабильности в этом.

Вот это и есть ключ к решению - если добиться повторяемости, тогда станет понятно, в каких условиях оно проявляется и, меняя условия, можно будет локализовать проблему.


--------------------
«Отыщи всему начало, и ты многое поймёшь» К. Прутков
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Mar 31 2011, 05:23
Сообщение #11


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Цитата(dxp @ Mar 31 2011, 11:04) *
Ты про свой порт или это у IAR'ного подсмотрел?

Это у обоих портов так, изначально.


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
dxp
сообщение Mar 31 2011, 10:15
Сообщение #12


Adept
******

Группа: Свой
Сообщений: 3 469
Регистрация: 6-12-04
Из: Novosibirsk
Пользователь №: 1 343



Цитата(AHTOXA @ Mar 31 2011, 12:23) *
Это у обоих портов так, изначально.

Гуд, значит для этих портов ничего не надо делать.


--------------------
«Отыщи всему начало, и ты многое поймёшь» К. Прутков
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- kurtis   Зависает один процесс   Mar 31 2010, 12:30
- - jorikdima   Для начала разберитесь, почему зависает? Зависнуть...   Mar 31 2010, 13:22
- - kurtis   В том то и проблема что я не понимаю почему зависа...   Mar 31 2010, 13:32
|- - Сергей Борщ   Цитата(kurtis @ Mar 31 2010, 15:32) В том...   Mar 31 2010, 13:42
- - kurtis   да   Mar 31 2010, 13:50
|- - Сергей Борщ   Я это к чему: Я дописал маленький отладочный кусоч...   Mar 31 2010, 14:19
|- - AHTOXA   Цитата(Сергей Борщ @ Mar 31 2010, 20:19) ...   Mar 31 2010, 14:37
|- - Сергей Борщ   Цитата(AHTOXA @ Mar 31 2010, 16:37) А есл...   Mar 31 2010, 15:21
|- - dxp   Цитата(BAT @ Mar 29 2011, 19:31) Какие, х...   Mar 30 2011, 03:02
- - a9d   У меня один раз косяк был, когда я для межпроцессо...   Mar 29 2011, 13:43
- - BAT   Остальные данные в объектах-процессах не портятся....   Mar 30 2011, 13:19
- - kostyan   Аналогично BATу, словил зависание процесса. Встава...   Jun 5 2012, 03:53
|- - _Артём_   Цитата(kostyan @ Jun 5 2012, 06:53) Анало...   Jun 7 2012, 08:31
- - kostyan   3.11   Jun 8 2012, 07:34


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 26th June 2025 - 21:00
Рейтинг@Mail.ru


Страница сгенерированна за 0.01511 секунд с 7
ELECTRONIX ©2004-2016