Цитата(Hoodwin @ Jul 8 2011, 17:45)

Когда я спрашиваю взрослых людей, много лет занимающихся разработкой ответственной техники, о том, как практически убедиться в эффективности своих мер по повышению надежности, то они ничего внятного ответить не могут. Элементная база устаревает морально и снимается с производства быстрее, чем желаемый срок ее надежного функционирования. Как можно в таких условиях что-то исправить на основе измеренной на практике статистики, а не придуманной теоретиками?!
методика проведения испытаний на надёжность аднака надо....
если устройство супернадёжно то тогда ставят на испытание N штук + меры увеличивающие старение (обычно термоцеклирование)...
да - испытывать дорого и сложно, отсюда и цена.... бывает и по несколько месяцев 10 приборов непрерывно надо в термокамере держать...
Всякие теоретико-логико-математико доказательства тож используются ...особенно буржуями чтобы туфту прорекламировать и впарить... называют это safety а не reliability...
-------
Что касается reliability
Считаю постановку вопроса о том как бороться с проблнемами некорекной.
Вначале нужно определить какие факторы воздействуют, а потом построить модель отказов и уш только потом - придумывать способы повышения надёжности....
У кого тут есть какая инфа? По вероятностям отказа, по влиянию внешних факторов....
Вот мне кажется, что надёжность пайки пинов раз в 1000 хуже, чем вероятность некоректного всасывания прошивки... так-что лутше просто пины дублировать, чем о высоких материях думать (CRC, TRM итп)
Опять-же, надёжность источника питания (DC-DC) наверняка раз в 100 ниже вероятности отказа ПЛИС...Так-что и тут не о CRC надо думать....
--------
Что касается safety
Тут нужно придумать способ определения того, работает ли устройство правильно сейчас или нет...
думаю однозначного ответа трудно найти, и в этой области просто море патентов (способов) как этого добится...
Как варианты:
1) Self Checking Design (напр. кодирование внутренних сигналов с битом чётности).
Он кстати требует Self Checking Checker схемы и такие есть.
2) Проверка на системном уровне. Кстати - самое популярное решение.
Напр. наша ПЛИС делает сжатие данных. Встраиваем микроконтроллер который периодически прогоняет тестовый пакет данных с известным результатом через нашу ПЛИС.
Напр. ПЛИС конвертит формат данных - включаем loopback на удалённом конце и прогоняем PRBS пакеты.
3) можно встроить DFT структуры и прогонять ATPG внешним микроконтролером.
4) Можно встроить BIST тесты внутри цифры и переодически их запускать (напр. тесты памяти).
Цитата(GeorgyBey @ Feb 2 2005, 16:51)

В тему надежности :
мое руководство (а мы пытаемся "сесть" на ПЛИСы) прослышало, что Альтеровские ПЛИСы страдают спорадическими (чисто, внатуре случайными) отказами от раз-в-неделю до раз-в-месяц.
А что народ бывалый по этому поводу думает ? Замечали таковое ?
Из нескольких милионов штук микросхем, которые прошли полный цикл производственного тестирования, заказчики нам возвращают 1-2 шт...
Причина возврата - отказ или сбой...
Так вот - отказ почти всегда это ESD пробой из-за небрежности заказчика...
ну и 1 на 10 милионов - дефект технологии (типа окисление переходного отверствия или есчё что...)
Такч-то "переодический отказ раз в месяц" - это не поломка ПЛИС.
Если у вас с питанием, волновым согласованием внешних линий передачи итп. всё 100% ОК и это именно ПЛИС, то тут скорее проблемы дизайна из-за:
- Cross Domain Clocking ошибки (приводят к метастабильностям)
- либо некоректно заданы STA констрейны (вот скважность осцилятора вы как в STA констрейнах учли? А как девиацию напряжения питания в STA учли? итд...) ...тоже кстати к метастабильности приводят...
Боротся с этим (ошибками в ДНК

) можно только верификацией (UVM вам поможет) и натурными испытаниями (и не забываем о functional coverage при этом)