реклама на сайте
подробности

 
 
2 страниц V  < 1 2  
Reply to this topicStart new topic
> Hercules от техаса, есть впечатления?
DASM
сообщение Sep 4 2013, 10:40
Сообщение #16


Гуру
******

Группа: Свой
Сообщений: 3 644
Регистрация: 28-05-05
Пользователь №: 5 493



Я так понимаю, что речь идет не о том, что устройство должно при обнаружении отказа продолжать нормально работать, а, скорее, лучше пусть отрубается совсем, или выдает error на ножку, которая, в свою очередь, отрубит например силовое питание клапанов или движков. Как-то так. То есть не "делай во чтобы то ни стало" а "не можешь делать - лучше отрубись". Не знаю как это по ГОСТ звучит =)

Цитата(ZASADA @ Sep 4 2013, 13:48) *
про фрискейл-раньше широко использовали, техподдержка была минимальная. при малейших проблемах вместо америкосов начинали отвечать индусы в стиле "моя твоя не понимайт"
+1. Если ты не Боинг, или, на худой конец, НАСА - они тебя просто не замечают. С дистрибуцией была таже фигня.
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Sep 4 2013, 12:59
Сообщение #17


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(DASM @ Sep 4 2013, 13:40) *
Я так понимаю, что речь идет не о том, что устройство должно при обнаружении отказа продолжать нормально работать, а, скорее, лучше пусть отрубается совсем, или выдает error на ножку, которая, в свою очередь, отрубит например силовое питание клапанов или движков. Как-то так.


Ага, сердечный стимулятор или дозатор для диабетика должен торжественно запищать при обнаружении отказа и отрубится. И это будет высший уровень безопасности. biggrin.gif

Не забываем, что речь в контексте Hercules идет о безопасности людей, а не дивайсов.
Сам дивайс должен быть надежным чтобы быть безопасным для людей.

Выставить ошибку на внешней ноге это скорее для независимого лога в процессе тестирования на этапе разработки,
поскольку для обычных процов словить ошибку ALU и отличить ее от ошибки шины практически нет никаких шансов.

Вообще многие приблуды Hercules ориентированы на снижение рисков в процессе разработки, а не в процессе эксплуатации.
Соответственно гаражным разработчикам будут непонятны и неприемлемы.
Go to the top of the page
 
+Quote Post
DASM
сообщение Sep 4 2013, 14:11
Сообщение #18


Гуру
******

Группа: Свой
Сообщений: 3 644
Регистрация: 28-05-05
Пользователь №: 5 493



Вы сферического коня в вакууме обсуждаете, впрочем как и я. По Вашей логике - стоп-краны в поездах не нужны, кнопки Стоп красные на механизмах - это только для гаражей. Лучше скажите, что делает Техас при обнаружении fault на одном из ядер ? Если передает управление другому, то какие вопросы ? Это именно мера повышения надежности в процессе эксплуатации. Причем в случае , допустим, станка - лучше и остановить процесс по возможности. В случае стимулятора - работать на другом, выбора нет. Всем понятно, что надо проектировать девайса так, чтобы (длинный список ляляля, удовлетворить который, надо полагать, могут только процессоры от одного известного производителя в комплекте с софтом от него же + полная смена разработчиков на кошерных) Причем тут разработка вообще неясно - второе ядро как датчик ЕМС что-ли работает ? Мажорирование ячеек в радиационно-стойких ПЛИС Актеля - тоже для комфорта разработчиков ?
Go to the top of the page
 
+Quote Post
-=Sergei=-
сообщение Sep 4 2013, 14:37
Сообщение #19


Местный
***

Группа: Свой
Сообщений: 339
Регистрация: 26-10-04
Пользователь №: 985



Цитата(AlexandrY @ Sep 4 2013, 16:59) *
Ага, сердечный стимулятор или дозатор для диабетика должен торжественно запищать при обнаружении отказа и отрубится. И это будет высший уровень безопасности. biggrin.gif

Не забываем, что речь в контексте Hercules идет о безопасности людей, а не дивайсов.
Сам дивайс должен быть надежным чтобы быть безопасным для людей.

Выставить ошибку на внешней ноге это скорее для независимого лога в процессе тестирования на этапе разработки,
поскольку для обычных процов словить ошибку ALU и отличить ее от ошибки шины практически нет никаких шансов.

Вообще многие приблуды Hercules ориентированы на снижение рисков в процессе разработки, а не в процессе эксплуатации.
Соответственно гаражным разработчикам будут непонятны и неприемлемы.


Все гораздо многообразней в жизни, и в зависимости от требований делаются различные системы
Можно тут глянуть подробнее ниже


Цитата(DASM @ Sep 4 2013, 18:11) *
Вы сферического коня в вакууме обсуждаете, впрочем как и я. По Вашей логике - стоп-краны в поездах не нужны, кнопки Стоп красные на механизмах - это только для гаражей. Лучше скажите, что делает Техас при обнаружении fault на одном из ядер ? Если передает управление другому, то какие вопросы ? Это именно мера повышения надежности в процессе эксплуатации. Причем в случае , допустим, станка - лучше и остановить процесс по возможности. В случае стимулятора - работать на другом, выбора нет. Всем понятно, что надо проектировать девайса так, чтобы (длинный список ляляля, удовлетворить который, надо полагать, могут только процессоры от одного известного производителя в комплекте с софтом от него же + полная смена разработчиков на кошерных) Причем тут разработка вообще неясно - второе ядро как датчик ЕМС что-ли работает ? Мажорирование ячеек в радиационно-стойких ПЛИС Актеля - тоже для комфорта разработчиков ?


При обнаружении расхождения в поведении ядер, определить в каком именно из ядер произошел сбой нельзя. При обнаружения сбоя по расхождению ядер процессоры сваливаются в исключение по обработке этой ситуации, где уже программа решает что и как. При сваливании в обработчик исключения (это сродни софт ресету) ядра снова синхронизируются. И далее, перезупуск задачи, уход на альтернативные режимы обработки итп.

Простейший пример где хорошо работает локстеп:
Есть вентиль который можно открыть только в случае аварии. Если этот вентиль откроют ошибочно, то будет еще большая авария. (подача пожарной смеси в двигатель самолета).

Так вот, в этом случае можно сделать этот вентиль на одном микроконтроллере и 2-х последовательных вентилях (а не какая нибудь троированная система). Процедура открытия будет состоять из трех фаз. 1- открытие перового вентеля, 2- диагностика системы и 3 фаза - открытие второго вентиля. Таким образом при нормальной работе без сбоев оба вентиля откроются, и функция выполнена правильно. При сбое, PC шагнул на команды открытия первого вентиля не регламентировано, например. То первый вентель откроется, но на этапе диагностики сбой будет обнаружен и второй вентиль не откроется. А у системы будет внутренний сигнал ошибки. Обычно в этом случае самолет уже сажают на ближайший. Если в результате сбоя шагнули на открытие второго вентиля, и открыли его - то первый вентиль закрыт, опять таки аварии не устроим.
Так вот локстеп позволяет сократить время диагностики до единиц тактов, вместо более сложный процедур самодиагностики
и подтверждения на более высоком уровне. Кроме того самодиагностика позволяет обнаружить отказы, а сбои она не показывает. А интенсивность сбоев примерно в 1000 раз больше чем интенсивность отказов на земле.


Прикрепленные файлы
Прикрепленный файл  Safety_Seminar_TI_2012.pdf ( 4.78 мегабайт ) Кол-во скачиваний: 41
 
Go to the top of the page
 
+Quote Post
DASM
сообщение Sep 4 2013, 14:57
Сообщение #20


Гуру
******

Группа: Свой
Сообщений: 3 644
Регистрация: 28-05-05
Пользователь №: 5 493



Эээ.. но различные контроли ECC - не позволяет определить кто сбойнул ? Хотя вообще мне это сильно напоминает историю а ватчдоге - вечный спор - нужен он или нет.
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Sep 4 2013, 15:30
Сообщение #21


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(-=Sergei=- @ Sep 4 2013, 17:37) *
При обнаружении расхождения в поведении ядер, определить в каком именно из ядер произошел сбой нельзя. При обнаружения сбоя по расхождению ядер процессоры сваливаются в исключение по обработке этой ситуации, где уже программа решает что и как. При сваливании в обработчик исключения (это сродни софт ресету) ядра снова синхронизируются. И далее, перезупуск задачи, уход на альтернативные режимы обработки итп.


На схеме их инвертора выход ошибки идет сразу на сброс и никаких там самодиагностик.
Самодиагностика там отдельная тема.

Lock-step, ИМХО, не мера повышения надежности, а средство идентификации места возникновения ошибки (CPU или шина например ).
Благодаря этому в частности TI могут определить уровень SIL системы куда входит контроллер и прикинуть риски.

Там весь разговор крутится вокруг оценки рисков. А цифры по надежности у них в закрытых доках.
Мелким разработчикам вся эта тема вообще до фонаря.

А сценарий с вентилем мне кажется надуманным.
Go to the top of the page
 
+Quote Post
-=Sergei=-
сообщение Sep 5 2013, 05:29
Сообщение #22


Местный
***

Группа: Свой
Сообщений: 339
Регистрация: 26-10-04
Пользователь №: 985



Цитата(DASM @ Sep 4 2013, 18:57) *
Эээ.. но различные контроли ECC - не позволяет определить кто сбойнул ? Хотя вообще мне это сильно напоминает историю а ватчдоге - вечный спор - нужен он или нет.


ЕСС помогает исправлять сбои в памяти, в других узлах МК использования ECC затруднительно. Но иногда защищают регистровый файл ядра с помощью ЕСС. Есть работы где обычная схемотехника защищается ECC, но это приводить резкому падению скорости и росту размера, что лучше сделать троированную схему.

Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Sep 5 2013, 07:41
Сообщение #23


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(-=Sergei=- @ Sep 5 2013, 08:29) *
.... Есть работы где обычная схемотехника защищается ECC, но это приводить резкому падению скорости и росту размера, что лучше сделать троированную схему.


"Есть работы где обычная схемотехника защищается ECC" - перл!
Go to the top of the page
 
+Quote Post
-=Sergei=-
сообщение Sep 5 2013, 08:20
Сообщение #24


Местный
***

Группа: Свой
Сообщений: 339
Регистрация: 26-10-04
Пользователь №: 985



Цитата(AlexandrY @ Sep 5 2013, 11:41) *
"Есть работы где обычная схемотехника защищается ECC" - перл!


http://www.cs.york.ac.uk/rts/docs/DAC-1964...FILES/P0705.PDF
Go to the top of the page
 
+Quote Post
yes
сообщение Sep 5 2013, 10:19
Сообщение #25


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



Цитата(AlexandrY @ Sep 5 2013, 11:41) *
"Есть работы где обычная схемотехника защищается ECC" - перл!

я не знаю, что такое "стандартная схемотехника" в данном контексте,
но вообще это
стандартная практика, у того же LEON3FT от Гейслера (который любим и нашим отечественным космосом) конвеер защищается BCH кодами, при ошибке может либо аппаратно перезапуститься, либо сгенерить эксепшин - взависимости от того сколько гейтов не жалко

впринцыпе можно сгенерить коды для сумматоров и умножителей (АЛУ), я про это не слышал, ну и скажем так - я не академический деятель, а практикующий инженер, да и эта тематика не такая открытая, как ARM архитектура sm.gif

а два ядра ставят из экономии, хоть по утру но на свои sm.gif . все-таки не космос, троирование видно дорого и/или нецелесообразно (это мои измышления)
Go to the top of the page
 
+Quote Post

2 страниц V  < 1 2
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 19th June 2025 - 00:48
Рейтинг@Mail.ru


Страница сгенерированна за 0.01447 секунд с 7
ELECTRONIX ©2004-2016