Всем добрый день!
Используется связка контроллеров STM32F407 с Ethernet, набортными свичами, lwip, аппаратной чексуммой и широковещательным udp-обменом. Время от времени происходит проблема: как показывает лог Вайршарка, один случайный контроллер из тех, которые посылают чаще, чем другие (порядка 200 пак./с.), вроде как перестает считать чексумму исходящих пакетов (ставит 0 в Header checksum и UDP checksum) или, реже, дает некорректную чек-сумму. Из-за этого другие теряют с ним связь. Этой ситуации предшествует обрезанный или склеенный с другим пакет (что странно, но не критично), после чего все пакеты следуют или без чек-суммы, или с некорректной. Ситуация может устраниться, может устраниться временно, может не устраниться - до передергивания Ethernet-кабеля, что через прерывание вызывает ETH_Stop/ETH_Start (stm32f4x7_eth.c), ETH_FlushTransmitFIFO и пр. (HAL-драйвер не используется). Вероятно, очищение fifo микросхемы каким-то образом и исправляет ситуацию.
Случайный сброс признаков аппаратной чексуммы в дескрипторах я исключил - задавал им 1 прямо перед выставлением признака OWN. (Еще при нагрузочном тестировании зафиксировал попадание в лог редких одиночных пакетов с нулевой Header checksum, но с корректной UDP checksum и без левого пакета перед этим. Непонятно, связано ли это вообще с основной проблемой.)
Скажите, есть ли вероятность, что сама микросхема перестает корректно считать чек-сумму (потому что пакеты, в остальном, она выдает корректно)? Если нет, то куда копать: lwip, еще какая-то работа с dma? Даташит, само собой, я изучал, и ситуаций, подпадающих под нулевую crc, у нас вроде как нет.
Сообщение отредактировал cyrax0 - Mar 10 2016, 09:35
|