|
|
  |
Целостность конфигурации ПЛИС, Как определить в процессе работы |
|
|
|
Jan 30 2005, 12:49
|

Гуру
     
Группа: Админы
Сообщений: 3 621
Регистрация: 18-10-04
Из: Москва
Пользователь №: 904

|
Readback это, конечно, хорошо. Но ведь в процессе самого чтения конфигурации тоже может возникнуть ошибка, т.е. конфигурация будет правильной, но считана будет неправильно... Мне кажется, что если есть высокие требования надежности, то стоит не заморачиваться на чтение конфигурации на ходу, а посмотреть в сторону Actel с их ProAsic. Ну и конечно использовать дублирование.
--------------------
BR, Makc В недуге рождены, вскормлены тленом, подлежим распаду. (с) У.Фолкнер.
|
|
|
|
|
Jan 30 2005, 13:08
|
Частый гость
 
Группа: Свой
Сообщений: 88
Регистрация: 15-10-04
Из: Новочеркасск
Пользователь №: 886

|
Цитата(makc @ Jan 30 2005, 15:49) Мне кажется, что если есть высокие требования надежности, то стоит не заморачиваться на чтение конфигурации на ходу, а посмотреть в сторону Actel с их ProAsic. Ну и конечно использовать дублирование.  Я бы не сказал, что требования к надежности крайне высоки. Например, при выявлении неправильной работы не будет проблемой перезагрузить конфигурацию или перезапустить устройство. Но как выявить эту неправильную работу - вот в чем вопрос. Дублирование - это, конечно, хорошо, но, может, есть более простые методы? Кстати, есть ли у кого информация о том, насколько вероятно искажение конфигурации ПЛИС? Может, я слишком усложняю себе жизнь и такие искажения маловероятны? PS: К слову, сейчас пока смотрим в сторону FPGA от Altera, т.к. есть небольшой опыт их использования (ACEX)
|
|
|
|
|
Jan 30 2005, 13:55
|

Их либе дих ...
     
Группа: СуперМодераторы
Сообщений: 2 010
Регистрация: 6-09-04
Из: Russia, Izhevsk
Пользователь №: 609

|
to makc <Readback это, конечно, хорошо. Но ведь в процессе самого чтения конфигурации тоже может возникнуть ошибка, т.е. конфигурация будет правильной, но считана будет неправильно... > Все таки вероятность этого мизерна.
<Мне кажется, что если есть высокие требования надежности, то стоит не заморачиваться на чтение конфигурации на ходу, а посмотреть в сторону Actel с их ProAsic.> Ну а я бы "по заморачивался" над тем, чтоб среду разработки и отладки не менять.
to DPL Можно попробовать через JTAG контроллировать содержимое.
--------------------
Усы, борода и кеды - вот мои документы :)
|
|
|
|
|
Jan 30 2005, 14:49
|

Гуру
     
Группа: Админы
Сообщений: 3 621
Регистрация: 18-10-04
Из: Москва
Пользователь №: 904

|
Цитата(DPL @ Jan 30 2005, 16:08) Я бы не сказал, что требования к надежности крайне высоки. Например, при выявлении неправильной работы не будет проблемой перезагрузить конфигурацию или перезапустить устройство. Но как выявить эту неправильную работу - вот в чем вопрос. Дублирование - это, конечно, хорошо, но, может, есть более простые методы? Всегда есть некоторые требования к вероятности безотказной работы (или вероятности отказа). В зависимости от того, насколько они велики нужно выбирать средства борьбы с отказами. И если в качестве средства контроля рассматривать чтения конфигурации устройства, то тут сразу встает вопрос - а насколько часто нужно читать конфигурацию устройства, чтобы быть уверенным в том, что устройство работает правильно. Т.е. тут надежность зависит от частоты контроля правильности работы (по конфигурации). А ведь может быть элементарный отказ аппаратуры... И в этом случае конфигурация может быть правильной, а функционирование - нет. Поэтому появляется дублирование и т.д.
--------------------
BR, Makc В недуге рождены, вскормлены тленом, подлежим распаду. (с) У.Фолкнер.
|
|
|
|
|
Jan 30 2005, 14:49
|
Частый гость
 
Группа: Свой
Сообщений: 88
Регистрация: 15-10-04
Из: Новочеркасск
Пользователь №: 886

|
Цитата(one_man_show @ Jan 30 2005, 17:01) На мой взгляд самый верный способо достижения надежности помимо выбора "лучшего" компонента (что практически невозможно), это определение критериев сбоя. Что считать в Вашей системе сбойной ситуацией? Именно в этом случае и перегрузить конфигурацию ПЛИС и перезапустить другие компоненты, типа МК. 2 one_man_show: Видимо, только так и придется поступать. Я надеялся, что есть способы определить сбой заблаговременно, пока он еще не проявил себя 2 vetal: Спасибо, попробую посмотреть, что они пишут о сбоях. 2 makc: Дело в том, что в случае с ПЛИС я вообще не знаю, какие специфичные для них средства контроля существуют (опыта нет) - отсюда и вопрос. Что касается обеспечения надежности на уровне системы - это вопрос другой, хотя и включающий этот. Его решение для нашей системы я вижу.
|
|
|
|
|
Jan 30 2005, 14:52
|

Гуру
     
Группа: Админы
Сообщений: 3 621
Регистрация: 18-10-04
Из: Москва
Пользователь №: 904

|
Цитата(3.14 @ Jan 30 2005, 16:55) <Readback это, конечно, хорошо. Но ведь в процессе самого чтения конфигурации тоже может возникнуть ошибка, т.е. конфигурация будет правильной, но считана будет неправильно... > Все таки вероятность этого мизерна. Согласен, она может быть небольшой. Но это будет зависеть он нескольких факторов, в т.ч. частоты работы JTAG'a. И все-равно эта вероятность будет. Цитата <Мне кажется, что если есть высокие требования надежности, то стоит не заморачиваться на чтение конфигурации на ходу, а посмотреть в сторону Actel с их ProAsic.> Ну а я бы "по заморачивался" над тем, чтоб среду разработки и отладки не менять. Ну почемуже сразу менять среду разработки?  Ведь можно использовать практически один и тот же софт (Synplify) и разные PAR. Так что я не могу сказать, что это большая сложность. И, к тому же, нужно выбирать для определенной задачи походящий инструмент, если есть такая возможность.  Цитата(DPL @ Jan 30 2005, 17:49) 2 makc: Дело в том, что в случае с ПЛИС я вообще не знаю, какие специфичные для них средства контроля существуют (опыта нет) - отсюда и вопрос. Что касается обеспечения надежности на уровне системы - это вопрос другой, хотя и включающий этот. Его решение для нашей системы я вижу. Мне кажется, что в случае ПЛИС можно подумать о контроле функционирования на уровне отдельных узлов проекта ПЛИС. Так для встроенной памяти можно ввести контроль по четности, критичные узлы продублировать и сравнивать получающиеся в них значения. И т.д. Аналогичный трюк можно сделать и на уровне системы, но это ведь не всегда возможно...
--------------------
BR, Makc В недуге рождены, вскормлены тленом, подлежим распаду. (с) У.Фолкнер.
|
|
|
|
|
Jan 30 2005, 15:36
|

Их либе дих ...
     
Группа: СуперМодераторы
Сообщений: 2 010
Регистрация: 6-09-04
Из: Russia, Izhevsk
Пользователь №: 609

|
to makc <... Но это будет зависеть он нескольких факторов, в т.ч. частоты работы JTAG'a. ...> Хотя это больше уже похоже на придерание к словам (моей стороны), но ошибка в JTAG цепи зависит от длинны линии (согласовывать или нет), а не от частоты работы (т.к. буфера не меняются), и от "экранированности" (наводок) линий. Вот с последним могут быть проблемы. Ну еще, не вижу ничего страшного в том, что FPGA ошибочно перезагрузиться. Ведь автор заявляет, что ничего страшного в этом нет, хотя для меня это загадка
--------------------
Усы, борода и кеды - вот мои документы :)
|
|
|
|
|
Jan 30 2005, 16:30
|

Гуру
     
Группа: Админы
Сообщений: 3 621
Регистрация: 18-10-04
Из: Москва
Пользователь №: 904

|
Цитата(3.14 @ Jan 30 2005, 18:36) to makc <... Но это будет зависеть он нескольких факторов, в т.ч. частоты работы JTAG'a. ...> Хотя это больше уже похоже на придерание к словам (моей стороны), но ошибка в JTAG цепи зависит от длинны линии (согласовывать или нет), а не от частоты работы (т.к. буфера не меняются), и от "экранированности" (наводок) линий. Вот с последним могут быть проблемы. Никакого придирания к словам тут нет.  Все верно, причины ошибок выделены верно. Но с ростом частоты вероятность ошибки будет расти, т.к. перечисленные факторы будут оказывать все большее влияние. К тому же нужно не забывать, что размер конфигурационной памяти большинства современных FPGA далеко не один килобит, а тысячи. Цитата Ну еще, не вижу ничего страшного в том, что FPGA ошибочно перезагрузиться. Ведь автор заявляет, что ничего страшного в этом нет, хотя для меня это загадка  Для меня тоже.
--------------------
BR, Makc В недуге рождены, вскормлены тленом, подлежим распаду. (с) У.Фолкнер.
|
|
|
|
|
Jan 30 2005, 20:10
|

Гуру
     
Группа: Админы
Сообщений: 3 621
Регистрация: 18-10-04
Из: Москва
Пользователь №: 904

|
Цитата(3.14 @ Jan 30 2005, 20:32) <... Но с ростом частоты вероятность ошибки будет расти, т.к. перечисленные факторы будут оказывать все большее влияние. ...> При нормально согласованной линии, влияние будет оказывать только наводимая ЭДС, а она от частоты работы JTAG не зависит. Вот мы и пришли к закономерному выводу.  Если все делать нормально (правильно), то проблем не будет.  Но вот только одна есть проблема - даже если все правильно спроектировано, то это правильно спроектированное может быть неправильно изготовлено и это бывает довольно часто. Я думаю, что Вы с этим знакомы не по наслышке. PS: А что касается наведенной ЭДС - так ведь можно же заэкранироваться. Хотя, если говорить про JTAG, разведенный на плате, то это опять же вопрос правильного проектирования платы.
--------------------
BR, Makc В недуге рождены, вскормлены тленом, подлежим распаду. (с) У.Фолкнер.
|
|
|
|
|
Jan 31 2005, 06:09
|
Частый гость
 
Группа: Свой
Сообщений: 88
Регистрация: 15-10-04
Из: Новочеркасск
Пользователь №: 886

|
Цитата(3.14 @ Jan 30 2005, 18:36) Ну еще, не вижу ничего страшного в том, что FPGA ошибочно перезагрузиться. Ведь автор заявляет, что ничего страшного в этом нет, хотя для меня это загадка  Как совершенно справедливо заметил one_man_show, "наличие сигналов PowerGood, мониторов питания и сторожевых таймеров в системах повышенной надежности считается аксиомой". А для чего это все? Вероятно, чтобы остановить|перезапустить систему в случае возникновения определенных отказов  . Т.е., как ни крути, система должна быть готова к тому, что перезапуск возможен и должна быть спроектирована так, чтобы этот перезапуск существенно не повлиял на ее работу. В свете этого перезагрузка ПЛИС - это лишь одна из операций по восстановлению работоспособности.
|
|
|
|
|
Jan 31 2005, 06:51
|
Местный
  
Группа: Свой
Сообщений: 258
Регистрация: 3-08-04
Пользователь №: 434

|
Цитата(DPL @ Jan 30 2005, 14:34) Здравствуйте. В связи с необходимостью принятия решения о целесообразности применения ПЛИС возник такой вопрос: а как можно (и можно ли) определить, правильно ли она функционирует? Вот, например, загрузили в нее файл конфигурации, она заработала, а затем произошел сбой в конфигурационных данных (скачок питания, помеха и тд). Как выявить эту ситуацию? Для ОЗУ, например, можно посчитать контрольную сумму. А как для ПЛИС? Буду благодарен за любые советы или ссылки. Wse FPGA Altera kontrolirujut prawilnostj konfiguracionnyh dannyh w processe zagruzki (kontrolj CRC). Rjad mikroshem (naprimer, STRATIX II) kontrolirujut prawilnostj zagruzki periodicheski ( w dopolnenie k nachalnomu kontrolju), i w sluchae oshibki wystawljajut flag, kotoryj mozhet bytj ispolzowan dlja zapuska perekonfiguracii.
|
|
|
|
|
Jan 31 2005, 08:33
|
Участник

Группа: Свой
Сообщений: 42
Регистрация: 24-12-04
Пользователь №: 1 658

|
В подобной ситуации сначала необходимо принять решение о целесообразности применения сотрудников задающих такие вопросы  Если сбои в вашей системе могут привести к изменению конфигурации и тому подобному то нет никакой уверенности в том что все остальное оборудование (которое между прочим будет проверять правильность конфигурации) работает как надо. Есть только один способ борьбы с последствиями сбоев, помех и т.п. - не допускать их самих
|
|
|
|
|
Jan 31 2005, 10:01
|
Частый гость
 
Группа: Свой
Сообщений: 88
Регистрация: 15-10-04
Из: Новочеркасск
Пользователь №: 886

|
Цитата(Igor_S @ Jan 31 2005, 09:51) Wse FPGA Altera kontrolirujut prawilnostj konfiguracionnyh dannyh w processe zagruzki (kontrolj CRC). Rjad mikroshem (naprimer, STRATIX II) kontrolirujut prawilnostj zagruzki periodicheski Спасибо. Не могли бы Вы подсказать документы, где об этом почитать подробнее? Может, Вы знаете что-то попроще STRATIX II, ведущее себя аналогично? Цитата(Vitus @ Jan 31 2005, 11:33) Есть только один способ борьбы с последствиями сбоев, помех и т.п. - не допускать их самих. К сожалению, у нас нет специалистов, способных решать задачи подобным образом. Боюсь, не только у нас, но и вообще. Нам как-то привычнее формулировать задачу так: "сбой может возникнуть". Наша задача - минимизировать вероятность его возникновения, а в случае возникновения - своевременно выявить его и принять меры к недопущению|устранению последствий.
|
|
|
|
|
Jan 31 2005, 13:16
|
Местный
  
Группа: Свой
Сообщений: 258
Регистрация: 3-08-04
Пользователь №: 434

|
Цитата(DPL @ Jan 31 2005, 13:01) Цитата(Igor_S @ Jan 31 2005, 09:51) Wse FPGA Altera kontrolirujut prawilnostj konfiguracionnyh dannyh w processe zagruzki (kontrolj CRC). Rjad mikroshem (naprimer, STRATIX II) kontrolirujut prawilnostj zagruzki periodicheski Спасибо. Не могли бы Вы подсказать документы, где об этом почитать подробнее? Может, Вы знаете что-то попроще STRATIX II, ведущее себя аналогично? Prilagaemyj fajl Application Note AN357, wrode eta fumkcija estj w STRATIX, STRATIX II, STRATIX GX, CYCLONE. Woobshe, nado smotretj datasheet konkretnyh mikroshem - no, wrode, ni w kakih drugih serijah ja etu fumkciju ne widel. Hotja, dolzhen skazatj, ja nikogda ne ispolzowal etu funkciju, dazhe w STRATIX. Nikakih problem so sbojami konfiguracii zamecheno ne bylo (plata w sostawe Industrial PC, rabotaet kruglosutochno).
Прикрепленные файлы
an357.pdf ( 134.98 килобайт )
Кол-во скачиваний: 703
|
|
|
|
|
Feb 1 2005, 06:43
|
Частый гость
 
Группа: Свой
Сообщений: 88
Регистрация: 15-10-04
Из: Новочеркасск
Пользователь №: 886

|
Цитата(Igor_S @ Jan 31 2005, 16:16) Hotja, dolzhen skazatj, ja nikogda ne ispolzowal etu funkciju, dazhe w STRATIX. Nikakih problem so sbojami konfiguracii zamecheno ne bylo (plata w sostawe Industrial PC, rabotaet kruglosutochno). Благодарю за файл и информацию. У меня похожая область применения и режим работы, так что Ваш практический опыт будет мне полезен.
|
|
|
|
|
Feb 1 2005, 09:55
|

Помогу, чем смогу
     
Группа: Админы
Сообщений: 2 786
Регистрация: 28-05-04
Из: Москва
Пользователь №: 25

|
Цитата(Vitus @ Jan 31 2005, 11:33) В подобной ситуации сначала необходимо принять решение о целесообразности применения сотрудников задающих такие вопросы  Несколько раз перечитал, все-таки скажу: пожалуйста, воздержитесь от подобных высказываний, получается резковато. Мы здесь никого не поучаем, а делимся опытом. Цитата Есть только один способ борьбы с последствиями сбоев, помех и т.п. - не допускать их самих А это, к сожалению, очень далеко от реальности
--------------------
|
|
|
|
|
Feb 2 2005, 08:23
|
Участник

Группа: Новичок
Сообщений: 23
Регистрация: 18-11-04
Из: Чернигов, Украина
Пользователь №: 1 167

|
Наиболее применимыми (в плане затрат) решениями для борьбы с сбоями конфигурации являются: 1) периодическая перепрошивка (в моменты бездействия) 2) методы контроля целосности (внешний контроллер считывает прошивку - сравнивает с эталоном и перезагружает ПЛИС в случае различий) 3) методы резервирования (на уровне проекта и на уровне крискала) В данном случае я прошу обратить внимание на то, что некоторые фирмы заявляя о аппаратной потдержке 3-х кратного резервирования дублируют сами блоки, а систему принятия решений - нет. Отсюда при сбое системы принятия решения (вероятность маленькая но есть) данные аппаратные решения теряют все свои преемущества. Также обратите внимание на контроль выходов ПЛИС (сбои в выходных и входных буферах встречаются с неменьшей вероятностью)
--------------------
WBR KNK
|
|
|
|
|
Feb 2 2005, 09:15
|
Участник

Группа: Свой
Сообщений: 42
Регистрация: 24-12-04
Пользователь №: 1 658

|
Прошу прощения за резкозть!
|
|
|
|
|
Feb 2 2005, 13:51
|
Местный
  
Группа: Свой
Сообщений: 205
Регистрация: 21-12-04
Из: Киев
Пользователь №: 1 593

|
В тему надежности : мое руководство (а мы пытаемся "сесть" на ПЛИСы) прослышало, что Альтеровские ПЛИСы страдают спорадическими (чисто, внатуре случайными) отказами от раз-в-неделю до раз-в-месяц. Без всякой закономерности и непредсказуемо  и потому - только Xilinx А что народ бывалый по этому поводу думает ? Замечали таковое ?
--------------------
На "нет" и "нах" :)
|
|
|
|
|
Feb 9 2005, 06:32
|
Участник

Группа: Свой
Сообщений: 35
Регистрация: 27-01-05
Из: Ярославль
Пользователь №: 2 228

|
Цитата(Димыч @ Feb 8 2005, 17:46) В реальном проекте мне пришлось применять банальную перезагрузку ПЛИС ...сложные автоматы и пр. - переставали работать (в результате помех). Может быть дело еще в том, что автоматы должны иметь (т.е. их нужно прописывать) способы выхода из некорректных состояний. Где-то в описании на AHDL так и написано. Чтож касательно вероятности перехода автомата в такое состояние - то она имеется  . Вообще тема контроля правильности функционирования ПЛИС - весьма интересная.
|
|
|
|
|
Feb 9 2005, 07:02
|

Гуру
     
Группа: Админы
Сообщений: 3 621
Регистрация: 18-10-04
Из: Москва
Пользователь №: 904

|
Цитата(Roamer @ Feb 9 2005, 09:32) Цитата(Димыч @ Feb 8 2005, 17:46) В реальном проекте мне пришлось применять банальную перезагрузку ПЛИС ...сложные автоматы и пр. - переставали работать (в результате помех). Может быть дело еще в том, что автоматы должны иметь (т.е. их нужно прописывать) способы выхода из некорректных состояний. Где-то в описании на AHDL так и написано. Чтож касательно вероятности перехода автомата в такое состояние - то она имеется  . Что-то я не понял, каким образом можно описать выход из некорректного состояния. (Или имеется в виду ресет?  ) Правильно спроектированный автомат не должен переходить в запрещенные состояния и если это происходит, то это либо ошибка проектирования, либо аппаратная несправность. Причем если эта неисправность носит случайный характер, то можно предусмотреть сигнал принудительного перевода автомата в заранее заданное состояние (сигнал сброса).
--------------------
BR, Makc В недуге рождены, вскормлены тленом, подлежим распаду. (с) У.Фолкнер.
|
|
|
|
|
Feb 9 2005, 08:00
|
Участник

Группа: Свой
Сообщений: 35
Регистрация: 27-01-05
Из: Ярославль
Пользователь №: 2 228

|
Цитата(makc @ Feb 9 2005, 10:02) Что-то я не понял, каким образом можно описать выход из некорректного состояния. (Или имеется в виду ресет?  ) Нет, не ресет в данном случае. Все как написал jojo: действительно при проектировании обеспечить переход из некорректных состояний в корректные (читай - описать все состояния). Цитата(makc @ Feb 9 2005, 10:02) ...то можно предусмотреть сигнал принудительного перевода автомата в заранее заданное состояние (сигнал сброса). А вот это ИМХО точно нужно, покрайней мере для начальной установки.
|
|
|
|
|
Mar 31 2011, 10:31
|

Местный
  
Группа: Свой
Сообщений: 218
Регистрация: 2-02-09
Из: Харьков
Пользователь №: 44 266

|
Теме UP! Как определить целостность конфигурации в ПЛИС Xilinx серии Spartan? ... Читая документацию (ug380) про конфигурацию spartan six Код "During readback, the user reads all configuration memory cells, including the current values on all user memory elements (LUT RAM, SRL16, and block RAM)." Тоесть на выходе мы имеем реальное текущее состояние ячеек. Конечно возлагание на внешнее устройство функций сравнивания прошивки и сброса ПЛИС, ограничивается надежностью этого устройства. Фактически мы можем похоронить заживо полностью рабочее устройство (в медицине такая практика была)... Вообще 100%-но гарантировать, что устройство исправно никто не может. Здесь важно определить степень параноидальности и выбрать самый оптимальный (надежный) вариант. Мне интересно мнение разработчиков, которые проектировали системы повышенной безопасности (типа 10exp-12)... как они боролись с данной проблемой? Читая документацию Xilinx вижу как сильно они позаботились о загрузке правильной конфигурации. Неужели они не позаботились о ее целостности и сохранности? Если есть внутренние устройства CRC, WatchDog, Reset on error... неужели нельзя было сделать работу CRC циклическим для проверки целостности внутренней конфигурации (может это оно и есть? CONFIG POST_CRC_ACTION = [HALT | CONTINUE]) . Ведь бывают же случаи частичного разрушения кристалла, "зависания" (залипания) ПЛИС ... Или может быть такая ситуация, когда выгорела ножка ПЛИС, а конфигурация в полном порядке... как тогда быть, господа разработчики?
|
|
|
|
|
Apr 1 2011, 13:07
|

Знающий
   
Группа: Свой
Сообщений: 815
Регистрация: 7-06-06
Из: Харьков
Пользователь №: 17 847

|
Цитата(ADA007 @ Mar 31 2011, 13:31)  ... Ведь бывают же случаи частичного разрушения кристалла, "зависания" (залипания) ПЛИС ... Или может быть такая ситуация, когда выгорела ножка ПЛИС, а конфигурация в полном порядке... как тогда быть, господа разработчики? А ведь существует возможность внешнего контроля работоспособности модулька! Взять компакт- ПиСиАй. Там во внешний мир зарезервированы сигналы Джитага для граничного сканирования. Пром-компьютер имеет возможность быстрого контроля подключённого к себе модулька(Всю цепочку БИС, что на борту модуля) на предмет годности паек, целостности линий, а в пределе, проверку сквозного функционирования нужных частей проекта (не в реальном времени) , перезаливки памяти и ,если оставить в проекте тестовые блочки, считывание-запись памяти в ПЛИСине, как в штатном режиме SignalProbe. Да тут можно нагородить любые варианты! Вот только стоить это будет дорого!!! Вот и по внешним признакам жизни модулька тоже можно убедиться в правильности своего модулька. Опять таки через граничное сканирование. Существует целая наука по организации тестопригодности изделий.
|
|
|
|
|
Apr 4 2011, 05:21
|

Местный
  
Группа: Свой
Сообщений: 218
Регистрация: 2-02-09
Из: Харьков
Пользователь №: 44 266

|
Цитата(Мур @ Apr 1 2011, 16:07)  А ведь существует возможность внешнего контроля работоспособности модулька! Взять компакт- ПиСиАй. Там во внешний мир зарезервированы сигналы Джитага для граничного сканирования. Пром-компьютер имеет возможность быстрого контроля подключённого к себе модулька(Всю цепочку БИС, что на борту модуля) на предмет годности паек, целостности линий, а в пределе, проверку сквозного функционирования нужных частей проекта (не в реальном времени) , перезаливки памяти и ,если оставить в проекте тестовые блочки, считывание-запись памяти в ПЛИСине, как в штатном режиме SignalProbe. М-да...это всё мне напоминает избитый философский вопрос кто же будет охранять охранника? Цитата(Мур @ Apr 1 2011, 16:07)  Да тут можно нагородить любые варианты! Вот только стоить это будет дорого!!! Так для этого и был поднят вопрос => Что оптимальнее? Цитата(Мур @ Apr 1 2011, 16:07)  Вот и по внешним признакам жизни модулька тоже можно убедиться в правильности своего модулька. Опять таки через граничное сканирование. Существует целая наука по организации тестопригодности изделий. Увы, если б можно было проводить Boundary scan (граничное сканирование) в процессе работы "модлуька" так чтобы это не мешало остальной работе - было бы очень кстати...
|
|
|
|
|
Apr 4 2011, 06:09
|

Знающий
   
Группа: Свой
Сообщений: 815
Регистрация: 7-06-06
Из: Харьков
Пользователь №: 17 847

|
Цитата(ADA007 @ Apr 4 2011, 09:21)  М-да...это всё мне напоминает избитый философский вопрос кто же будет охранять охранника? Чудес не бывает. Вам обязательно нужен внешний наблюдатель. Цитата(ADA007 @ Apr 4 2011, 09:21)  Так для этого и был поднят вопрос => Что оптимальнее? Хотя-бы по косвенным признакам. Вводите в систему тестовые циклы одновременно с рабочими. Цитата(ADA007 @ Apr 4 2011, 09:21)  Увы, если б можно было проводить Boundary scan (граничное сканирование) в процессе работы "модлуька" так чтобы это не мешало остальной работе - было бы очень кстати... А что вам мешает так и сделать? Без ганичного,- в лоб. В Альтере вставочки(доступные через ДЖИТАГ) легко делаются в любое место. Чисто организационный вопрос!  А почему бы вам не перейти на ACTEL? Одноразово прошили и останется только проблема контакта ножек и внешнего мира...
Сообщение отредактировал Мур - Apr 4 2011, 06:37
|
|
|
|
|
Apr 4 2011, 07:41
|

Местный
  
Группа: Свой
Сообщений: 218
Регистрация: 2-02-09
Из: Харьков
Пользователь №: 44 266

|
Цитата(Мур @ Apr 4 2011, 09:09)  Чудес не бывает. Вам обязательно нужен внешний наблюдатель. Да, я согласен, но как писалось выше Цитата(i-mir @ Apr 1 2011, 20:53) для сложных микросхем этот уровень составляет 10е-5 ... 10е-7 то есть надежность собаки, которая охраняет охранника ниже или такая же. Цитата(Мур @ Apr 4 2011, 09:09)  Хотя-бы по косвенным признакам. Вводите в систему тестовые циклы одновременно с рабочими. Если ПЛИС будет проверять сама себя на отказ, кому надо такое устройство? Цитата(Мур @ Apr 4 2011, 09:09)  А почему бы вам не перейти на ACTEL? Одноразово прошили и останется только проблема контакта ножек и внешнего мира... Читаем внимательнее вопрос и не оффтопим Цитата Как определить целостность конфигурации в ПЛИС Xilinx серии Spartan?
|
|
|
|
|
Apr 4 2011, 08:31
|

Знающий
   
Группа: Свой
Сообщений: 815
Регистрация: 7-06-06
Из: Харьков
Пользователь №: 17 847

|
Цитата(ADA007 @ Apr 4 2011, 11:41)  Да, я согласен, но как писалось выше то есть надежность собаки, которая охраняет охранника ниже или такая же. Послушайте, Внешяя =дежурная собака= может быть нормальным охранником? Мои друзья всегда закладывали вотч-дог к ПЛИС(на всякий случай) для перезаливки при пропаже динамики по одной из линий. Просто и эффективно! Цитата(ADA007 @ Apr 4 2011, 11:41)  Если ПЛИС будет проверять сама себя на отказ, кому надо такое устройство?  Я не о том говорил. ПЛИС всё равно что обрабатывать. Я предложил забрасывать извне тестовую задачу. Внешний арбитр знает какой цикл рабочий а какой тестовый. Самому себя проверять-нонсенс! Цитата(ADA007 @ Apr 4 2011, 11:41)  Читаем внимательнее вопрос и не оффтопим Извините, увлёкся!...
|
|
|
|
|
Apr 26 2011, 07:54
|

Гуру
     
Группа: Свой
Сообщений: 2 002
Регистрация: 17-01-06
Из: Томск, Россия
Пользователь №: 13 271

|
Цитата(ADA007 @ Mar 31 2011, 17:31)  Как определить целостность конфигурации в ПЛИС Xilinx серии Spartan? Если есть внутренние устройства CRC, WatchDog, Reset on error... неужели нельзя было сделать работу CRC циклическим для проверки целостности внутренней конфигурации (может это оно и есть? CONFIG POST_CRC_ACTION = [HALT | CONTINUE]) . Ведь бывают же случаи частичного разрушения кристалла, "зависания" (залипания) ПЛИС ... Есть такая функция, мы её используем: http://www.xilinx.com/support/documentatio...uides/ug332.pdfПод заголовком "Post-Configuration CRC (Extended Spartan-3A Family Only)". Об этом писал уважаемый Igor_S: Цитата(Igor_S @ Jan 31 2005, 13:51)  Wse FPGA Altera kontrolirujut prawilnostj konfiguracionnyh dannyh w processe zagruzki (kontrolj CRC). Rjad mikroshem (naprimer, STRATIX II) kontrolirujut prawilnostj zagruzki periodicheski ( w dopolnenie k nachalnomu kontrolju), i w sluchae oshibki wystawljajut flag, kotoryj mozhet bytj ispolzowan dlja zapuska perekonfiguracii.
--------------------
Зная себе цену, нужно ещё и пользоваться спросом...
|
|
|
|
|
Jun 21 2011, 23:29
|

Частый гость
 
Группа: Участник
Сообщений: 82
Регистрация: 1-03-10
Пользователь №: 55 731

|
здесь ранее писали про то, что альтеравские девайсы имеют блок CRC, но возникли два вопроса: 1)так как этот блок находится в плис, что как пролетит супер заряженная частица и нарушит его работу? можно как-нибудь прочесть cfm у плис и сравнить с тем, что у неё в озу и на основании этого сделать вывод о правильности работы? или есть только один вариант, через некоторое время постоянно передергивать питание, что бы происходило чтение в озу?
2)предположим, что придумана какая-то система резервирования, которая в случае отказа, допустим перепрошивает плис. как (и возможно ли это) убедиться в том, что если отказ возникнет, система действительно сработает?
|
|
|
|
|
Jun 30 2011, 13:55
|

Местный
  
Группа: Свой
Сообщений: 218
Регистрация: 2-02-09
Из: Харьков
Пользователь №: 44 266

|
Цитата(Mikron @ Jun 22 2011, 02:29)  здесь ранее писали про то, что альтеравские девайсы имеют блок CRC, но возникли два вопроса: 1)так как этот блок находится в плис, что как пролетит супер заряженная частица и нарушит его работу? можно как-нибудь прочесть cfm у плис и сравнить с тем, что у неё в озу и на основании этого сделать вывод о правильности работы? или есть только один вариант, через некоторое время постоянно передергивать питание, что бы происходило чтение в озу?
2)предположим, что придумана какая-то система резервирования, которая в случае отказа, допустим перепрошивает плис. как (и возможно ли это) убедиться в том, что если отказ возникнет, система действительно сработает? Как итог всему выше сказанному могу только написать:"Вероятность чего-либо всё равно остается от неё никуда не деться. У нас существует целый отдел, который занимается вопросами вероятности отказа разрабатываемых приборов. Полностью безотказной работы устройства вы не добьётесь НИКОГДА!!! Поэтому опирайтесь исключительно на цифры. У разных частей ПЛИС вероятность отказа разная даже внутри кристалла, для регистров - она своя, для блочной памяти - своя. Если надо заказчику вероятность 10е-11, то разрабатывайте систему защиты от отказов в соответствии с требованиями!".
|
|
|
|
|
Jul 5 2011, 10:47
|
Участник

Группа: Участник
Сообщений: 71
Регистрация: 14-11-07
Пользователь №: 32 325

|
Цитата(DPL @ Jan 30 2005, 15:34)  Здравствуйте. В связи с необходимостью принятия решения о целесообразности применения ПЛИС возник такой вопрос: а как можно (и можно ли) определить, правильно ли она функционирует? Вот, например, загрузили в нее файл конфигурации, она заработала, а затем произошел сбой в конфигурационных данных (скачок питания, помеха и тд). Как выявить эту ситуацию? Для ОЗУ, например, можно посчитать контрольную сумму. А как для ПЛИС? Буду благодарен за любые советы или ссылки. Если не определились с семейством ПЛИС, то посмотрите FLASH ПЛИС Actel. В отличии от Альтеры и Xilinx у них конфигурация не сбивается от помех или скачков питания. Даже от радиции она не сбивается. И не надо будет ломать голову над этой проблемой.
|
|
|
|
|
Jul 8 2011, 09:35
|
Группа: Новичок
Сообщений: 4
Регистрация: 18-06-11
Пользователь №: 65 767

|
Как отмечалось выше у Xilinx есть функция проверки CRC конфигурации кристалла. Т.е. внутренний сторож проверяет сохранность конфигурации, сравнивая текущее CRC кристалла с эталонным, которое считывается при загрузке. При не совпадении CRC выдается ошибка (выход типа open drain) и если я не ошибаюсь, то имеется возможность перезапука. Данная опция есть у SPARTAN 3A и выше.
|
|
|
|
|
Jul 8 2011, 14:45
|
Знающий
   
Группа: Участник
Сообщений: 881
Регистрация: 21-03-10
Из: _// \\_
Пользователь №: 56 107

|
Цитата(ADA007 @ Jun 30 2011, 17:55)  Как итог всему выше сказанному могу только написать:"Вероятность чего-либо всё равно остается от неё никуда не деться. У нас существует целый отдел, который занимается вопросами вероятности отказа разрабатываемых приборов. Полностью безотказной работы устройства вы не добьётесь НИКОГДА!!! Поэтому опирайтесь исключительно на цифры. У разных частей ПЛИС вероятность отказа разная даже внутри кристалла, для регистров - она своя, для блочной памяти - своя. Если надо заказчику вероятность 10е-11, то разрабатывайте систему защиты от отказов в соответствии с требованиями!". А мне вот думается, что цифры по надежности - это полное шаманство и профанация. И методики расчета - тоже полная туфта. Ну, то есть, есть теория, которая построена на аксиоматике теории вероятностей, а есть практика, в которой нет никаких аксиом. Поэтому создание надежной техники - искусство, и только огромный опыт предыдущих поколений методом проб и ошибок позволяет не городить охранника для охранника для охранника (и т.д.), а сказать, что вот функциональный сбой по факту, и вот меры по его восстановлению за заданный интервал времени. Когда я спрашиваю взрослых людей, много лет занимающихся разработкой ответственной техники, о том, как практически убедиться в эффективности своих мер по повышению надежности, то они ничего внятного ответить не могут. Элементная база устаревает морально и снимается с производства быстрее, чем желаемый срок ее надежного функционирования. Как можно в таких условиях что-то исправить на основе измеренной на практике статистики, а не придуманной теоретиками?! Я уже не говорю о том, что при нашем "порядке" две партии изделий с интервалом год могут и не собрать совершенно одинаково, детали другой партии или вообще замены на другого производителя, платы другой партии, монтаж на оборудовании, отработавшем еще год без обслуживания, другие паяльные материалы. Поэтому я считаю, что правы те, кто говорит, что не надо проверять целостность конфигурации ПЛИС, а надо проверять целостность обрабатываемых данных. Система будет надежнее, если она не будет понапрасну перезагружаться, если откажет конфигурация ячеек, которые вообще не участвуют в проекте.
|
|
|
|
|
Sep 16 2014, 11:11
|
Группа: Новичок
Сообщений: 7
Регистрация: 23-08-14
Пользователь №: 82 630

|
Прочитал 3 страницы, но почему то ответа я не нашёл. Все же как можно контролировать целостность ? Нужна отдельная плис ? Или реализовать внутри конкретной плис ? Или все же как то возможно через jtag ?
|
|
|
|
|
Sep 16 2014, 13:21
|

Местный
  
Группа: Свой
Сообщений: 426
Регистрация: 23-02-12
Пользователь №: 70 424

|
Цитата(Hoodwin @ Jul 8 2011, 17:45)  Когда я спрашиваю взрослых людей, много лет занимающихся разработкой ответственной техники, о том, как практически убедиться в эффективности своих мер по повышению надежности, то они ничего внятного ответить не могут. Элементная база устаревает морально и снимается с производства быстрее, чем желаемый срок ее надежного функционирования. Как можно в таких условиях что-то исправить на основе измеренной на практике статистики, а не придуманной теоретиками?! методика проведения испытаний на надёжность аднака надо.... если устройство супернадёжно то тогда ставят на испытание N штук + меры увеличивающие старение (обычно термоцеклирование)... да - испытывать дорого и сложно, отсюда и цена.... бывает и по несколько месяцев 10 приборов непрерывно надо в термокамере держать... Всякие теоретико-логико-математико доказательства тож используются ...особенно буржуями чтобы туфту прорекламировать и впарить... называют это safety а не reliability... ------- Что касается reliability Считаю постановку вопроса о том как бороться с проблнемами некорекной. Вначале нужно определить какие факторы воздействуют, а потом построить модель отказов и уш только потом - придумывать способы повышения надёжности.... У кого тут есть какая инфа? По вероятностям отказа, по влиянию внешних факторов.... Вот мне кажется, что надёжность пайки пинов раз в 1000 хуже, чем вероятность некоректного всасывания прошивки... так-что лутше просто пины дублировать, чем о высоких материях думать (CRC, TRM итп) Опять-же, надёжность источника питания (DC-DC) наверняка раз в 100 ниже вероятности отказа ПЛИС...Так-что и тут не о CRC надо думать.... -------- Что касается safety Тут нужно придумать способ определения того, работает ли устройство правильно сейчас или нет... думаю однозначного ответа трудно найти, и в этой области просто море патентов (способов) как этого добится... Как варианты: 1) Self Checking Design (напр. кодирование внутренних сигналов с битом чётности). Он кстати требует Self Checking Checker схемы и такие есть. 2) Проверка на системном уровне. Кстати - самое популярное решение. Напр. наша ПЛИС делает сжатие данных. Встраиваем микроконтроллер который периодически прогоняет тестовый пакет данных с известным результатом через нашу ПЛИС. Напр. ПЛИС конвертит формат данных - включаем loopback на удалённом конце и прогоняем PRBS пакеты. 3) можно встроить DFT структуры и прогонять ATPG внешним микроконтролером. 4) Можно встроить BIST тесты внутри цифры и переодически их запускать (напр. тесты памяти). Цитата(GeorgyBey @ Feb 2 2005, 16:51)  В тему надежности : мое руководство (а мы пытаемся "сесть" на ПЛИСы) прослышало, что Альтеровские ПЛИСы страдают спорадическими (чисто, внатуре случайными) отказами от раз-в-неделю до раз-в-месяц. А что народ бывалый по этому поводу думает ? Замечали таковое ? Из нескольких милионов штук микросхем, которые прошли полный цикл производственного тестирования, заказчики нам возвращают 1-2 шт... Причина возврата - отказ или сбой... Так вот - отказ почти всегда это ESD пробой из-за небрежности заказчика... ну и 1 на 10 милионов - дефект технологии (типа окисление переходного отверствия или есчё что...) Такч-то "переодический отказ раз в месяц" - это не поломка ПЛИС. Если у вас с питанием, волновым согласованием внешних линий передачи итп. всё 100% ОК и это именно ПЛИС, то тут скорее проблемы дизайна из-за: - Cross Domain Clocking ошибки (приводят к метастабильностям) - либо некоректно заданы STA констрейны (вот скважность осцилятора вы как в STA констрейнах учли? А как девиацию напряжения питания в STA учли? итд...) ...тоже кстати к метастабильности приводят... Боротся с этим (ошибками в ДНК  ) можно только верификацией (UVM вам поможет) и натурными испытаниями (и не забываем о functional coverage при этом)
|
|
|
|
|
Sep 17 2014, 05:33
|
Группа: Новичок
Сообщений: 7
Регистрация: 23-08-14
Пользователь №: 82 630

|
На верное не правильно выразился. Точнее не до рассказал. Xilinx Virtex есть я так понимаю порт ICAP он позволяет контролировать построчно и исправлять конфигурацию. Только как с ним работать внутри самой плис ? Или отдельно ставить ? Если можно внутри то как описать его работу(на каком языке? Есть пример?) Вот примерно так. Я представляю. Спасибо.
|
|
|
|
|
Sep 17 2014, 07:40
|
Местный
  
Группа: Свой
Сообщений: 271
Регистрация: 6-12-11
Из: Taganrog
Пользователь №: 68 701

|
Ох, "искусственный интеллект" никак сам себя не может научиться оценить, как м большинство людей со своим естественным плохо рефлексируют и хорошо брешут, в отличие от оценок остальных наружу ?  Я бы лично (в целях минимизации) использовал только прозвучавшую здесь несколько раз идею о периодически вклинивающихся тестах из Центра -- на что заточена данная прошивка, то ей и командовать с известными исходными данными/выходом (пусть рандомно выбираемыми), сравнивать полученные результаты. Плохо, если "Центра" нет и принимать решение должен тот же самый "мозг", в котором мы не уверены на 100%, тут надо читать психиатрические форумы, причём древние, без демократических извратов, та наука развивалась ведь дольше и на более сложном материале  Абстрагируясь от типа и конкретики данного кристалла, для каждого самописного блочка можно встраивать самодиагностику и сводить всё воедино, но только для покупных ядер это потребовать достаточно проблематично, и вдруг глюканёт ячейка на объединении сигналов... Склифосовский, короче  Вообще, parity биты незря сейчас заложены во всех ПЛИС-памятях -- их первым делом будет крушить при пролёте *-частиц и других проблемных ситуациях с вероятностью обнаружения 1/2, гораздо менее вероятны остальные типы глюков. Другое дело, что нет жёсткого их (parity) образования и хранения/сравнения в каждой логической ячейке после конфигурирования -- экономически невыгодно со всех сторон в открытой продукции. Перегрузка конфигурации на лету может быть не очень удобной -- после этого Центр должен перегрузить и себя целиком, ибо "горячее включение" ПЛИС может потребовать её такой перенастройки и перевстраивания в систему, что мало не покажется. Тут лучшее решение -- энергонезависимая конфигурация на флэши, которую здесь много раз пропагандировали. Но раз те ПЛИС не хочется использовать, то других плюсов у них нет, в основном минусы ? Вообще, надо разрабатывать свои защищённые СБИС и наворачивать там, что угодно. Практика -- критерий истины, как учили М-Э-Л-s ещё 25 лет назад, так что соломку стелить лучше там, где уже были падения, заранее "теоретически" бояться не стоит, по статистике падежей и надо ориентироваться и бороть проблему. Боюсь, что "хороших" в этом отношении кристаллов нам никогда не продавали и не продадут, а своё когда наладится, тогда заживём !
|
|
|
|
|
Sep 23 2014, 05:33
|
Группа: Новичок
Сообщений: 7
Регистрация: 23-08-14
Пользователь №: 82 630

|
В Xilinx tcnm блок ICAP. Не могу понять как проверить его работу ? Судя по описанию он именно представляет доступ к конфигурационной памяти....
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|