реклама на сайте
подробности

 
 
2 страниц V   1 2 >  
Reply to this topicStart new topic
> Разрушение FAT (в FatFs)
Allregia
сообщение Feb 10 2016, 15:53
Сообщение #1


Профессионал
*****

Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763



Странно ведет себя один приорчик на F407, FatFs R0.09, 2011г.
Пишется стрим на флешку, примерно гигабайт в час.
Запись разбита на "1 файл = пол часа".
Т.е. пол часа пишется в tmp файл, потом он переименовывается в реальное имя с номером, и дальше опять пишется в tmp файл.
Между файлами делается unmount/mount, проовали даже питание флешки выключать/ и включать снова.
И все как бы было ОК, пока мы писали свой стрим по часу-два. Все работало идеально, флешки в основном исползовали 2-4ГБ, иноогда 8ГБ

А когда попробовали писать подольше да на флешках 8-16ГБ - видим проблему, появляющуюся примерно через 5-6 часов. Девайс продолжает писать, но если его остановить, то флешка уже не читается, фат разрушена, в итоге -> ее под format.

Все вызываемые функции FatFs - с проверкой, что FR_ОК возвращается если нет - сообщение на дисплей.
И там ничего! Девайс может 10-14 часов писать (на 16ГБ флешку), потом его останавливешь - и всё, выяснить когда чего произошло уже не получается.
У нас с напарником (код исходной мой, 4-х летней давности, но сейчас он с этим девайсом возится) уже все мысли кончились, не только по тому как найти баг, но и вобще в каком направлении поисков двигаться! Ну разве что, попробовать поставить послеледнюю версию FatFs?

Ну не может же такого быть, чтобы если по какой-то причине слетел фат, что при этом все функции f_open, f_close, f_write, f_rename, f_mount возвращают FR_OK?!

Ни у кого небыло ничего подобного? Или мож кто чего умного подскажет, как дальше искать?
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Feb 10 2016, 21:01
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(Allregia @ Feb 10 2016, 17:53) *
Ни у кого небыло ничего подобного? Или мож кто чего умного подскажет, как дальше искать?

0. проанализируйте посекторно что именно испортилось и где (я обычно WinHex пользую)
1. FAT16 или FAT32? А если поменять?
2. SDIO или SPI? А если поменять?
3. Поищите на самом нижнем уровне, то есть то что самописное к железу доступается.
4. Скорость-помехи-качество питания- качество флэшки?
5. Если проблема появляется практически регулярно- посадите логический анализатор и запишите эти самые 10 часов обмена, в параллель можете и какие-то логические сигналы генерировать и писать в качестве реперных точек, сильно помогает при разборках, а меньше 8-каналки сейчас и не найти анализатор.
Go to the top of the page
 
+Quote Post
e-serg
сообщение Feb 11 2016, 02:37
Сообщение #3


Частый гость
**

Группа: Участник
Сообщений: 97
Регистрация: 24-07-08
Из: Иркутск
Пользователь №: 39 180



Цитата(Allregia @ Feb 11 2016, 00:53) *
Или мож кто чего умного подскажет, как дальше искать?

1. Limits: "File size: Upto 4G-1 bytes. (by FAT specs.)"
2. f_sync Используете?
Go to the top of the page
 
+Quote Post
Allregia
сообщение Feb 11 2016, 15:59
Сообщение #4


Профессионал
*****

Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763



Цитата(Ruslan1 @ Feb 10 2016, 22:01) *
0. проанализируйте посекторно что именно испортилось и где (я обычно WinHex пользую)
1. FAT16 или FAT32? А если поменять?
2. SDIO или SPI? А если поменять?
3. Поищите на самом нижнем уровне, то есть то что самописное к железу доступается.
4. Скорость-помехи-качество питания- качество флэшки?
5. Если проблема появляется практически регулярно- посадите логический анализатор и запишите эти самые 10 часов обмена, в параллель можете и какие-то логические сигналы генерировать и писать в качестве реперных точек, сильно помогает при разборках, а меньше 8-каналки сейчас и не найти анализатор.


0: ok, посмотрим.
1: Fat32 конечно, фат16 не может быть на 16ГБ носителе (больше 2гб - только фат32)
2: SDIO, 4bit
3: пытаемся.
4: питание от батарейки через LDO, флешки разные пробовали.
5: куда его посадить?

Цитата
1. Limits: "File size: Upto 4G-1 bytes. (by FAT specs.)"
2. f_sync Используете?


1: стрим примерно 1гигабайт/час, пишем файлы по пол часа, т.е. по пол гига. и глюк происходит примерно на 10-12-м файле (5-6 часов записи).
2: нет, смысл?
Цитата
The f_sync function performs the same process as f_close function but the file is left opened and can continue read/write/seek operations to the file. This is suitable for the applications that open files for a long time in write mode, such as data logger. Performing f_sync function of periodic or immediataly after f_write function can minimize the risk of data loss due to a sudden blackout or an unintentional media removal.


но у нас нет ни блекаута ни mеdia removal, хотя попробовать всунуть периодический вызов f_sync можно, попробуем.
Go to the top of the page
 
+Quote Post
mantech
сообщение Feb 11 2016, 21:00
Сообщение #5


Гуру
******

Группа: Участник
Сообщений: 2 219
Регистрация: 16-08-12
Из: Киров
Пользователь №: 73 143



Цитата(Allregia @ Feb 11 2016, 18:59) *
2: SDIO, 4bit


Попробуйте уменьшить частоту клока, было раз подобное, правда через какое-то время писало кашу-малашу... Уменьшил скорость клока - стало нормально, потом плату переразвели, укоротили проводники до разъема - и со старыми клоками стало работать...
Go to the top of the page
 
+Quote Post
Allregia
сообщение Feb 12 2016, 08:20
Сообщение #6


Профессионал
*****

Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763



Цитата(mantech @ Feb 11 2016, 22:00) *
Попробуйте уменьшить частоту клока, было раз подобное, правда через какое-то время писало кашу-малашу... Уменьшил скорость клока - стало нормально, потом плату переразвели, укоротили проводники до разъема - и со старыми клоками стало работать...

Клоки уменьшить попробуем, хотя бы ради эксперимента, но не думаю что это что-то даст - 5 часов-же оно работает!
К тому-же, там от проца до разъема флешки - пол сантиметра, проц в БГА почти под ней стоит.

P.S. Пытаемся понять, что за такое магическое число "5 часов" (ну от 5-ти до 6-ти) - до 4-4.5 часов записи, никогда ничего не происходило, полет нормальный!
Еще более непонятно - между записью файлов делалось umnount, выключение питания флешки, пауза в сотню миллисеунд (данные в это время в ФИФО писались), потом включение питания флешки, f_mount, f_open, f_write.
ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения - вот что совершенно непонятно!
(вот не помню только ,делали при этом еще и включение/включение самого SDIO порта).
Писать пробовали и на чистую флешку, и на частично забитую всякой ерундой.
Go to the top of the page
 
+Quote Post
Alechek
сообщение Feb 12 2016, 09:23
Сообщение #7


Профессионал
*****

Группа: Свой
Сообщений: 1 241
Регистрация: 15-11-05
Из: Челябинск
Пользователь №: 10 882



Цитата(Allregia @ Feb 12 2016, 13:20) *
ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения - вот что совершенно непонятно!

Магия может пролазить через питание. Какой температурный режим?
Go to the top of the page
 
+Quote Post
Allregia
сообщение Feb 12 2016, 11:18
Сообщение #8


Профессионал
*****

Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763



Цитата(Alechek @ Feb 12 2016, 10:23) *
Магия может пролазить через питание. Какой температурный режим?


Скоп в питании ничего не видит, по температуре проблем нет, тем более что оно сейчас раскрытое без корпуса на столе лежит. Про на довольно низкой частоте работает (32МГц, и когда работал на 168МГц, было тоже самое).

Впору точно шамана с бубном приглашать....
Go to the top of the page
 
+Quote Post
ViKo
сообщение Feb 12 2016, 11:41
Сообщение #9


Универсальный солдатик
******

Группа: Модераторы
Сообщений: 8 634
Регистрация: 1-11-05
Из: Минск
Пользователь №: 10 362



Попробуйте записывать намного чаще. Наверное, дождетесь сбоя намного раньше.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Feb 12 2016, 12:21
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Все-таки попробуйте логическим анализатором, подключив его ко всем линиям SD-карты. Понимаю, что объем данных огромен и главная проблема синхронизироваться с моментом когда произошел сбой, но можно попробовать увидеть разницу в диагамме между участками "работает" и "не работает".
Автоматическое декодирование SPI в байты сам использую (на Saleae logic analyzer), но вот SDIO в данные он вроде бы напрямую не умеет, нужно в интернете посмотреть как (есть какие-то софтовые проекты-примочки к нему дополнительные)


Так удалось выяснить, что именно портится на флешке? статистику результатов набрали?
Например, один и тот же кластер, или один и тот же номер сектора в кластере или та же страница(сектор) таблицы FAT.

Проанализируйте что именно сбивается и попробуйте эту ситуацию детектировать проверками. Скорее всего сбой в FAT, можно хоть раз в пару секунд проверять его целостность.
Кстати, в FAT можно увеличить число копий таблицы FAT на диске, можно их использовать для проверок валидности.
Go to the top of the page
 
+Quote Post
редактор
сообщение Feb 12 2016, 12:33
Сообщение #11


Местный
***

Группа: Участник
Сообщений: 356
Регистрация: 9-06-07
Пользователь №: 28 315



Цитата
ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения

тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?


--------------------
Хорошую систему делают из стандартных блоков нестандартно мыслящие инженеры.
Go to the top of the page
 
+Quote Post
Alechek
сообщение Feb 12 2016, 12:35
Сообщение #12


Профессионал
*****

Группа: Свой
Сообщений: 1 241
Регистрация: 15-11-05
Из: Челябинск
Пользователь №: 10 882



Цитата(редактор @ Feb 12 2016, 17:33) *
тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?

Увеличить частоту системного времени?
Go to the top of the page
 
+Quote Post
редактор
сообщение Feb 15 2016, 08:54
Сообщение #13


Местный
***

Группа: Участник
Сообщений: 356
Регистрация: 9-06-07
Пользователь №: 28 315



Цитата
Увеличить частоту системного времени?

Для начала проанализировать на предмет переполнения или возможных ошибок при определении дельты по времени записи.


--------------------
Хорошую систему делают из стандартных блоков нестандартно мыслящие инженеры.
Go to the top of the page
 
+Quote Post
KnightIgor
сообщение Feb 15 2016, 11:41
Сообщение #14


Знающий
****

Группа: Участник
Сообщений: 643
Регистрация: 29-05-09
Из: Германия
Пользователь №: 49 725



Цитата(редактор @ Feb 12 2016, 13:33) *
тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?

Эту тему я поддержу.
Насколько мне помнится, в FatFS есть циклы и таймауты в них. Последние должны реализовываться так, чтобы можно было прервать эти циклы, то есть, работать от прерываний и модифицировать флаги/переменные, анализируемые в циклах внутри FatFS. Например, в моей системе, которая есть синхронная round robin по типу protothreads, я вынужден был ответвиться от обработчика SystemTick, чтобы модифицировать то, что нужно для FatFS. Как раскрыта тема в системе у ТС? Может срабатывает какой-то таймаут раньше времени, потому что, например, 5 часов это 18000 секунд, а это около 16K, а если в 10мс тиках, то это 18мио тиков, что есть около 24-битного числа (а SysTick - это 24 бита). Это я выдаю нагорА всякий бред, но может что войдет в резонанс в голове у ТС...

Go to the top of the page
 
+Quote Post
Allregia
сообщение Feb 22 2016, 18:21
Сообщение #15


Профессионал
*****

Группа: Свой
Сообщений: 1 047
Регистрация: 28-06-07
Из: Israel
Пользователь №: 28 763



Коллеги, большое спасибо за продолжение обсуждения, пока меня небыло (командировка).
Нашими усилиями было выяснено, что сбой происходит тогда, когда СУММАРНЫЙ обьем файлов перезодит через границу 4Гб.
Было попробовано на другом железе, со старой и новой FatFs, и даже двумя компиляторми (Кейл и ИАР).
Пробовали даже писать не в корневой каталог, а также с синком и без (тормозит он конкретно, если после каждого f_write вызывать!)
Писали блоками, равными кластеру (32К) - так быстрее всего.
От входных данных отвязались, и стали просто писать в цикле с максимальной скоростью - ну не ждать же 5-6 часов!

Может быть, у кого есть какая-нибудь система с сд-карточкой, работающей через sdio, может у себя попробовать, вот процедура, которую сегодня пробовали:
CODE
#define block_size 32768
#define blocks_in_mb (1024L*1024/block_size)
#define mb_in_file 500
//---
#define start_file 0
#define file_num 10
//
char fn[13];
//
void TestLog(void){
u32 i,j,k, bw;
FRESULT res;
//
Font=fnt16x8lat;
if(IsSDReady()){ // это просто проверка контакта, что карточка вставлена
SDPowerOn();
delay_ms(100);
if(CheckSD()){ // check OK
// test ------------------
ClrScr();
//f_chdir("/as");
for(i=start_file;i<file_num+start_file;i++){
sprintf((char *)fn, "/as/fn.%d",i);
res = f_open(&fsrc, fn, FA_CREATE_ALWAYS | FA_WRITE);
if(res==FR_OK){
SDFileOpen=1; // simulate working file
Show_String((u8 *)fn,2,0);

// record
for(j=0; j<mb_in_file;j++){
sprintf((char *)txt, "Rec: %d MB ",j+1);
Show_String(txt,6,0);

for(k=0;k<blocks_in_mb;k++){
res=f_write(&fsrc, &SDBuffer[0], block_size, &bw);
if(res!=FR_OK){
f_close(&fsrc);
sprintf((char *)txt, "Write Error:%d %d",j+1,k);
Show_String(txt,4,0);
while(1);
}
res=f_sync(&fsrc);
if(res!=FR_OK){
f_close(&fsrc);
sprintf((char *)txt, "Sync Error:%d %d",j+1,k);
Show_String(txt,4,0);
while(1);
}
}
}
res=f_close(&fsrc);
if(res!=FR_OK){
f_close(&fsrc);
sprintf((char *)txt, "Close error:%d %d",j,k);
Show_String(txt,4,0);
while(1);
}
}
}
//---------------------------------
Show_String("Write Complete", 0,0);
SDPowerOff();
while(1);
//------------------------------
}else{ // check fails
SDPowerOff();
ClrScr();// return;
return;
}
} // no SD
Show_String(" No SD Card ",2,0);
WaitNoKey();
WaitKey();
WaitNoKey();
ClrScr();
return;
}
//--------------------
// функция инициализирует и монтирует карточку:
static u8 CheckSD(u8 a){
SD_Error SDInitResult;
FRESULT res;
ClrScr();
SDInitResult=SD_Init();
if(SDInitResult==SD_OK){
Show_String("SD Init OK ",2,0);
delay_ms(1000);
res=f_mount( 0, &MSD_fatfs );
if ( res!= FR_OK ){
sprintf((char *)txt,"FS Fail %02d ",res);
Show_String(txt,4,10);
delay_ms(1000);
WaitNoKey();
WaitKey();
WaitNoKey();
return 0;
} // FS OK
Show_String("FS Mount ",4,0);
delay_ms(1000);
WaitNoKey();
return 1;
}
// SD Init fails:
sprintf((char *)txt,"SD Init Fail %02d",SDInitResult);
Show_String(txt,2,0);
delay_ms(1000);
WaitNoKey();
WaitKey();
WaitNoKey();
return 0;
}
//------------------------


Функции вывода на дисплей или ожидания кнопок можно закомментировать, или свои подставить.
У нас результаты такие: если file_num =8, то эти 8 байлов пишутся без проблем. Если 9 и больше - все проходит до конца без сообщений об ошибках, но карточка на компе уже не читается, просит форматирования.
Т.е сбой происходит в 9-ми файле. именно там переход границы 4Гб.
Но даже если поставить писать 10 файлов, то программа дорабатывает до конца без ошибок, хот ошибка по идее, была еще в 9-м!


Можно попробовать не сразу 9-10 файло в писать, а сначала
#define start_file 0
#define file_num 8

записать 8 файлов,
потом поставить:
#define start_file 8
#define file_num 1 // или 2

и дописать еще 1-2.


Каждый файл 500мб.

Сообщение отредактировал IgorKossak - Feb 23 2016, 09:06
Причина редактирования: [codebox] для длинного кода, [code] - для короткого!
Go to the top of the page
 
+Quote Post

2 страниц V   1 2 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 5th July 2025 - 20:55
Рейтинг@Mail.ru


Страница сгенерированна за 0.01498 секунд с 7
ELECTRONIX ©2004-2016