|
Разрушение FAT (в FatFs) |
|
|
|
Feb 10 2016, 15:53
|
Профессионал
    
Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763

|
Странно ведет себя один приорчик на F407, FatFs R0.09, 2011г. Пишется стрим на флешку, примерно гигабайт в час. Запись разбита на "1 файл = пол часа". Т.е. пол часа пишется в tmp файл, потом он переименовывается в реальное имя с номером, и дальше опять пишется в tmp файл. Между файлами делается unmount/mount, проовали даже питание флешки выключать/ и включать снова. И все как бы было ОК, пока мы писали свой стрим по часу-два. Все работало идеально, флешки в основном исползовали 2-4ГБ, иноогда 8ГБ
А когда попробовали писать подольше да на флешках 8-16ГБ - видим проблему, появляющуюся примерно через 5-6 часов. Девайс продолжает писать, но если его остановить, то флешка уже не читается, фат разрушена, в итоге -> ее под format.
Все вызываемые функции FatFs - с проверкой, что FR_ОК возвращается если нет - сообщение на дисплей. И там ничего! Девайс может 10-14 часов писать (на 16ГБ флешку), потом его останавливешь - и всё, выяснить когда чего произошло уже не получается. У нас с напарником (код исходной мой, 4-х летней давности, но сейчас он с этим девайсом возится) уже все мысли кончились, не только по тому как найти баг, но и вобще в каком направлении поисков двигаться! Ну разве что, попробовать поставить послеледнюю версию FatFs?
Ну не может же такого быть, чтобы если по какой-то причине слетел фат, что при этом все функции f_open, f_close, f_write, f_rename, f_mount возвращают FR_OK?!
Ни у кого небыло ничего подобного? Или мож кто чего умного подскажет, как дальше искать?
|
|
|
|
|
Feb 10 2016, 21:01
|
Гуру
     
Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025

|
Цитата(Allregia @ Feb 10 2016, 17:53)  Ни у кого небыло ничего подобного? Или мож кто чего умного подскажет, как дальше искать? 0. проанализируйте посекторно что именно испортилось и где (я обычно WinHex пользую) 1. FAT16 или FAT32? А если поменять? 2. SDIO или SPI? А если поменять? 3. Поищите на самом нижнем уровне, то есть то что самописное к железу доступается. 4. Скорость-помехи-качество питания- качество флэшки? 5. Если проблема появляется практически регулярно- посадите логический анализатор и запишите эти самые 10 часов обмена, в параллель можете и какие-то логические сигналы генерировать и писать в качестве реперных точек, сильно помогает при разборках, а меньше 8-каналки сейчас и не найти анализатор.
|
|
|
|
|
Feb 11 2016, 02:37
|
Частый гость
 
Группа: Участник
Сообщений: 97
Регистрация: 24-07-08
Из: Иркутск
Пользователь №: 39 180

|
Цитата(Allregia @ Feb 11 2016, 00:53)  Или мож кто чего умного подскажет, как дальше искать? 1. Limits: "File size: Upto 4G-1 bytes. (by FAT specs.)" 2. f_sync Используете?
|
|
|
|
|
Feb 11 2016, 15:59
|
Профессионал
    
Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763

|
Цитата(Ruslan1 @ Feb 10 2016, 22:01)  0. проанализируйте посекторно что именно испортилось и где (я обычно WinHex пользую) 1. FAT16 или FAT32? А если поменять? 2. SDIO или SPI? А если поменять? 3. Поищите на самом нижнем уровне, то есть то что самописное к железу доступается. 4. Скорость-помехи-качество питания- качество флэшки? 5. Если проблема появляется практически регулярно- посадите логический анализатор и запишите эти самые 10 часов обмена, в параллель можете и какие-то логические сигналы генерировать и писать в качестве реперных точек, сильно помогает при разборках, а меньше 8-каналки сейчас и не найти анализатор. 0: ok, посмотрим. 1: Fat32 конечно, фат16 не может быть на 16ГБ носителе (больше 2гб - только фат32) 2: SDIO, 4bit 3: пытаемся. 4: питание от батарейки через LDO, флешки разные пробовали. 5: куда его посадить? Цитата 1. Limits: "File size: Upto 4G-1 bytes. (by FAT specs.)" 2. f_sync Используете? 1: стрим примерно 1гигабайт/час, пишем файлы по пол часа, т.е. по пол гига. и глюк происходит примерно на 10-12-м файле (5-6 часов записи). 2: нет, смысл? Цитата The f_sync function performs the same process as f_close function but the file is left opened and can continue read/write/seek operations to the file. This is suitable for the applications that open files for a long time in write mode, such as data logger. Performing f_sync function of periodic or immediataly after f_write function can minimize the risk of data loss due to a sudden blackout or an unintentional media removal. но у нас нет ни блекаута ни mеdia removal, хотя попробовать всунуть периодический вызов f_sync можно, попробуем.
|
|
|
|
|
Feb 12 2016, 08:20
|
Профессионал
    
Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763

|
Цитата(mantech @ Feb 11 2016, 22:00)  Попробуйте уменьшить частоту клока, было раз подобное, правда через какое-то время писало кашу-малашу... Уменьшил скорость клока - стало нормально, потом плату переразвели, укоротили проводники до разъема - и со старыми клоками стало работать... Клоки уменьшить попробуем, хотя бы ради эксперимента, но не думаю что это что-то даст - 5 часов-же оно работает! К тому-же, там от проца до разъема флешки - пол сантиметра, проц в БГА почти под ней стоит. P.S. Пытаемся понять, что за такое магическое число "5 часов" (ну от 5-ти до 6-ти) - до 4-4.5 часов записи, никогда ничего не происходило, полет нормальный! Еще более непонятно - между записью файлов делалось umnount, выключение питания флешки, пауза в сотню миллисеунд (данные в это время в ФИФО писались), потом включение питания флешки, f_mount, f_open, f_write. ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения - вот что совершенно непонятно! (вот не помню только ,делали при этом еще и включение/включение самого SDIO порта). Писать пробовали и на чистую флешку, и на частично забитую всякой ерундой.
|
|
|
|
|
Feb 12 2016, 12:21
|
Гуру
     
Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025

|
Все-таки попробуйте логическим анализатором, подключив его ко всем линиям SD-карты. Понимаю, что объем данных огромен и главная проблема синхронизироваться с моментом когда произошел сбой, но можно попробовать увидеть разницу в диагамме между участками "работает" и "не работает". Автоматическое декодирование SPI в байты сам использую (на Saleae logic analyzer), но вот SDIO в данные он вроде бы напрямую не умеет, нужно в интернете посмотреть как (есть какие-то софтовые проекты-примочки к нему дополнительные)
Так удалось выяснить, что именно портится на флешке? статистику результатов набрали? Например, один и тот же кластер, или один и тот же номер сектора в кластере или та же страница(сектор) таблицы FAT.
Проанализируйте что именно сбивается и попробуйте эту ситуацию детектировать проверками. Скорее всего сбой в FAT, можно хоть раз в пару секунд проверять его целостность. Кстати, в FAT можно увеличить число копий таблицы FAT на диске, можно их использовать для проверок валидности.
|
|
|
|
|
Feb 12 2016, 12:33
|
Местный
  
Группа: Участник
Сообщений: 356
Регистрация: 9-06-07
Пользователь №: 28 315

|
Цитата ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?
--------------------
Хорошую систему делают из стандартных блоков нестандартно мыслящие инженеры.
|
|
|
|
|
Feb 15 2016, 08:54
|
Местный
  
Группа: Участник
Сообщений: 356
Регистрация: 9-06-07
Пользователь №: 28 315

|
Цитата Увеличить частоту системного времени? Для начала проанализировать на предмет переполнения или возможных ошибок при определении дельты по времени записи.
--------------------
Хорошую систему делают из стандартных блоков нестандартно мыслящие инженеры.
|
|
|
|
|
Feb 15 2016, 11:41
|
Знающий
   
Группа: Участник
Сообщений: 643
Регистрация: 29-05-09
Из: Германия
Пользователь №: 49 725

|
Цитата(редактор @ Feb 12 2016, 13:33)  тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами? Эту тему я поддержу. Насколько мне помнится, в FatFS есть циклы и таймауты в них. Последние должны реализовываться так, чтобы можно было прервать эти циклы, то есть, работать от прерываний и модифицировать флаги/переменные, анализируемые в циклах внутри FatFS. Например, в моей системе, которая есть синхронная round robin по типу protothreads, я вынужден был ответвиться от обработчика SystemTick, чтобы модифицировать то, что нужно для FatFS. Как раскрыта тема в системе у ТС? Может срабатывает какой-то таймаут раньше времени, потому что, например, 5 часов это 18000 секунд, а это около 16K, а если в 10мс тиках, то это 18мио тиков, что есть около 24-битного числа (а SysTick - это 24 бита). Это я выдаю нагорА всякий бред, но может что войдет в резонанс в голове у ТС...
|
|
|
|
|
Feb 22 2016, 18:21
|
Профессионал
    
Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763

|
Коллеги, большое спасибо за продолжение обсуждения, пока меня небыло (командировка). Нашими усилиями было выяснено, что сбой происходит тогда, когда СУММАРНЫЙ обьем файлов перезодит через границу 4Гб. Было попробовано на другом железе, со старой и новой FatFs, и даже двумя компиляторми (Кейл и ИАР). Пробовали даже писать не в корневой каталог, а также с синком и без (тормозит он конкретно, если после каждого f_write вызывать!) Писали блоками, равными кластеру (32К) - так быстрее всего. От входных данных отвязались, и стали просто писать в цикле с максимальной скоростью - ну не ждать же 5-6 часов! Может быть, у кого есть какая-нибудь система с сд-карточкой, работающей через sdio, может у себя попробовать, вот процедура, которую сегодня пробовали: CODE #define block_size 32768 #define blocks_in_mb (1024L*1024/block_size) #define mb_in_file 500 //--- #define start_file 0 #define file_num 10 // char fn[13]; // void TestLog(void){ u32 i,j,k, bw; FRESULT res; // Font=fnt16x8lat; if(IsSDReady()){ // это просто проверка контакта, что карточка вставлена SDPowerOn(); delay_ms(100); if(CheckSD()){ // check OK // test ------------------ ClrScr(); //f_chdir("/as"); for(i=start_file;i<file_num+start_file;i++){ sprintf((char *)fn, "/as/fn.%d",i); res = f_open(&fsrc, fn, FA_CREATE_ALWAYS | FA_WRITE); if(res==FR_OK){ SDFileOpen=1; // simulate working file Show_String((u8 *)fn,2,0); // record for(j=0; j<mb_in_file;j++){ sprintf((char *)txt, "Rec: %d MB ",j+1); Show_String(txt,6,0);
for(k=0;k<blocks_in_mb;k++){ res=f_write(&fsrc, &SDBuffer[0], block_size, &bw); if(res!=FR_OK){ f_close(&fsrc); sprintf((char *)txt, "Write Error:%d %d",j+1,k); Show_String(txt,4,0); while(1); } res=f_sync(&fsrc); if(res!=FR_OK){ f_close(&fsrc); sprintf((char *)txt, "Sync Error:%d %d",j+1,k); Show_String(txt,4,0); while(1); } } } res=f_close(&fsrc); if(res!=FR_OK){ f_close(&fsrc); sprintf((char *)txt, "Close error:%d %d",j,k); Show_String(txt,4,0); while(1); } } } //--------------------------------- Show_String("Write Complete", 0,0); SDPowerOff(); while(1); //------------------------------ }else{ // check fails SDPowerOff(); ClrScr();// return; return; } } // no SD Show_String(" No SD Card ",2,0); WaitNoKey(); WaitKey(); WaitNoKey(); ClrScr(); return; } //-------------------- // функция инициализирует и монтирует карточку: static u8 CheckSD(u8 a){ SD_Error SDInitResult; FRESULT res; ClrScr(); SDInitResult=SD_Init(); if(SDInitResult==SD_OK){ Show_String("SD Init OK ",2,0); delay_ms(1000); res=f_mount( 0, &MSD_fatfs ); if ( res!= FR_OK ){ sprintf((char *)txt,"FS Fail %02d ",res); Show_String(txt,4,10); delay_ms(1000); WaitNoKey(); WaitKey(); WaitNoKey(); return 0; } // FS OK Show_String("FS Mount ",4,0); delay_ms(1000); WaitNoKey(); return 1; } // SD Init fails: sprintf((char *)txt,"SD Init Fail %02d",SDInitResult); Show_String(txt,2,0); delay_ms(1000); WaitNoKey(); WaitKey(); WaitNoKey(); return 0; } //------------------------ Функции вывода на дисплей или ожидания кнопок можно закомментировать, или свои подставить. У нас результаты такие: если file_num =8, то эти 8 байлов пишутся без проблем. Если 9 и больше - все проходит до конца без сообщений об ошибках, но карточка на компе уже не читается, просит форматирования. Т.е сбой происходит в 9-ми файле. именно там переход границы 4Гб. Но даже если поставить писать 10 файлов, то программа дорабатывает до конца без ошибок, хот ошибка по идее, была еще в 9-м! Можно попробовать не сразу 9-10 файло в писать, а сначала #define start_file 0 #define file_num 8 записать 8 файлов, потом поставить: #define start_file 8 #define file_num 1 // или 2 и дописать еще 1-2. Каждый файл 500мб.
Сообщение отредактировал IgorKossak - Feb 23 2016, 09:06
Причина редактирования: [codebox] для длинного кода, [code] - для короткого!
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|