реклама на сайте
подробности

 
 
3 страниц V   1 2 3 >  
Reply to this topicStart new topic
> Архиватор в микроконтроллере с малым требованием к ресурсам, сделать в МК архив, который на PC можно будет штатно разжать
Ruslan1
сообщение Nov 22 2016, 08:58
Сообщение #1


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Здравствуйте!

Имеется кучка файлов, которые можно поделить на две группы
1) длинные текстовые- например, лог 6 мегабайт ежедневно
2) куча коротких текстовых - например, ежедневно директория с 1440 файлами по 200 байт (ежеминутные данные)

Хочу их заархивировать с целью:
группа1 - чтобы уменьшить размер (важно при передаче)
группа2 - чтобы уменьшить количество файлов, просто склейка в один файл без сжатия уже подходит (то есть что-то типа tar уже достаточно) - важно для хранения.

Архивация происходит периодически и не в реальном времени- например, раз в сутки для уже собранных файлов. То есть изменять архив не нужно и скорость работы функции не важна, фоновая задача.
Обязательное требование- чтобы на компьютере это можно было разжать, используя доступные в интернете стандартные архиваторы, а не писать свой распаковщик. Я точно не буду применять архиватор в нестандартный архив.
И еще крайне желательно, чтобы задача не требовала больших объемов памяти (временных буферов) во время работы. При этом скорость работы практически не важна.


Вопрос: есть ли примеры решения таких задач? аппноты какие-нибудь, блоги, линки....
Обычно на МК решается обратная задача - разжать (прошивку, образ итд), да и то из нестандартного формата, а вот упаковщики в "стандартный" архив как-то не попадаются.

Ни и если кто-то может рассказать про личный опыт, что за архиватор применяли на МК, буду безмерно счастлив.

конкретно буду реализовывать на STM32F4, если это важно
Go to the top of the page
 
+Quote Post
Огурцов
сообщение Nov 22 2016, 09:18
Сообщение #2


Гуру
******

Группа: Участник
Сообщений: 3 928
Регистрация: 28-03-07
Из: РФ
Пользователь №: 26 588



есть же какой-то зип открытый, только возьми и скомпили
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Nov 22 2016, 09:40
Сообщение #3


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(Ruslan1 @ Nov 22 2016, 10:58) *
Я точно не буду применять архиватор в нестандартный архив.


Тестировал кучку разных движков сжатия - https://geektimes.ru/post/264558/
Там среди прочего найдете проект под VisualStudio на PC. Можно экспериментировать с разными файлами насчет сжатия.
Но без ресурсов готовтесь к тому, что сжатие будет никакое.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 22 2016, 10:50
Сообщение #4


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(AlexandrY @ Nov 22 2016, 11:40) *
Тестировал кучку разных движков сжатия - https://geektimes.ru/post/264558/
Там среди прочего найдете проект под VisualStudio на PC. Можно экспериментировать с разными файлами насчет сжатия.
Но без ресурсов готовтесь к тому, что сжатие будет никакое.

опять же проблема, что хочу чтобы стандартные распаковщики мой файл понимали. Например, фраза вроде
Цитата
zlib —...... Является обобщением алгоритма сжатия данных DEFLATE, используемого в их компрессоре данных gzip.

Ну никак не говорит, так смогу я сжатое этой zlib разжать стандартным gzip или не смогу. И так практически везде. Такое ощущение, что подавляющее большинство делает "вещь в себе", под свой же распаковщик.

Про ресурсы- сколько-то килобайт под буфер могу найти (ну, может десяток). Да и файлы лежат рядом, могу доступаться к ним и перечитывать сколько угодно раз, без полного перемещения файла в RAM.

Цитата(Огурцов @ Nov 22 2016, 11:18) *
есть же какой-то зип открытый, только возьми и скомпили

jszip ?

собственно, группа2 (много коротких файлов затарить в один, можно и без сжатия) интересует больше (задача с более высоким приоритетом). Может быть, это будут два разных метода и разные архиваторы, не обязательно все-в-одном.
A tar кто-то реализовывал на микроконтроллере?
Go to the top of the page
 
+Quote Post
aiwa
сообщение Nov 22 2016, 12:20
Сообщение #5


Местный
***

Группа: Участник
Сообщений: 301
Регистрация: 13-12-15
Из: Харьков
Пользователь №: 89 682



minilzo
(__http://www.oberhumer.com/opensource/lzo/)
Go to the top of the page
 
+Quote Post
vladec
сообщение Nov 22 2016, 12:39
Сообщение #6


Профессионал
*****

Группа: Свой
Сообщений: 1 167
Регистрация: 3-10-05
Из: Москва
Пользователь №: 9 158



zip-ы, rar-ы, tar-ы и т.п. требуют для своей работы больших ресурсов, для микроконтроллера реально по затратам арифметическое сжатие.
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Nov 22 2016, 12:51
Сообщение #7


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(vladec @ Nov 22 2016, 14:39) *
zip-ы, rar-ы, tar-ы и т.п. требуют для своей работы больших ресурсов, для микроконтроллера реально по затратам арифметическое сжатие.


Все эти алгоритмы параметрезированы. Распаковщики эту параметризацию понимают. Поэтому вы полностью управляете ресурсами. Любой засунете в пару десятков килобайт.
Дело только в том что сжатие такое дело, что чем меньше памяти под словари тем хуже сжатие.

Но TC скорее нужен не алгоритм сжатия, а формат контейнеров. Это другая тема.
Мои zip файлы компьютер понимает, но контейнер для многих файлов в одном zip-е я не делал.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 22 2016, 13:03
Сообщение #8


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(aiwa @ Nov 22 2016, 14:20) *
minilzo
(__http://www.oberhumer.com/opensource/lzo/)

Спасибо, буду думать (делать планирую буду ближе к новому году или даже после, чуть времени есть).
Все идет к тому что если хочу стандартный (zip какой-нить) то нужно больше усилий чем для нестандартного.
В принципе, наверное возможно и нестандарт, если разница в ресурсах велика....
в-общем-то оборудование небытовое, думаю смогу аргументировать применение и какого-нить небытового lzo.

Цитата(AlexandrY @ Nov 22 2016, 14:51) *
Все эти алгоритмы параметрезированы. Распаковщики эту параметризацию понимают. Поэтому вы полностью управляете ресурсами. Любой засунете в пару десятков килобайт.
Дело только в том что сжатие такое дело, что чем меньше памяти под словари тем хуже сжатие.

Но TC скорее нужен не алгоритм сжатия, а формат контейнеров. Это другая тема.
Мои zip файлы компьютер понимает, но контейнер для многих файлов в одном zip-е я не делал.

Я в начале написал, у меня два разных случая в одном проекте
Для одного нужен сжиматель без контейнера, для другого- именно контейнер без сжимателя.

Причем прямо сейчас контейнер более востребован чем сжиматель. Неужто tar сложный формат, я почему-то думал что там не так все сложно.

А свой нестандартный последний сжиматель я еще в институте делал, по Хафману, на Z80 и ассемблере. Для курсовой сжимателя хватило, разжиматель пусть другие делают sm.gif
Go to the top of the page
 
+Quote Post
HardEgor
сообщение Nov 22 2016, 13:48
Сообщение #9


Гуру
******

Группа: Свой
Сообщений: 2 223
Регистрация: 3-03-06
Из: Tomsk
Пользователь №: 14 925



Цитата(Ruslan1 @ Nov 22 2016, 20:03) *
Причем прямо сейчас контейнер более востребован чем сжиматель. Неужто tar сложный формат, я почему-то думал что там не так все сложно.

tar это вообще элементарщина, был придуман чтобы потоково лить файлы на ленту.
Просто все привыкли что сейчас он еще заворачивается в gzip, вот и переживают...

Вообще по-хорошему надо найти исходники самого древнего unix - там будет и tar и gzip для минимальных ресурсов.
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Nov 22 2016, 16:47
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Цитата(AlexandrY @ Nov 22 2016, 12:40) *
Но без ресурсов готовтесь к тому, что сжатие будет никакое.

Глупости. На меге делал модем. Там было сжатие. Примерно 2 коэффициент. Сжатие в потоке даже с адаптивным словарём очень мало рерурсов ест. А распаковка - вообще 0. На CM3 даже не заметишь.
Существенный выигрыш получается при увеличении размера словаря и если словарь предопределён, до начала сжатия.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 22 2016, 17:09
Сообщение #11


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(HardEgor @ Nov 22 2016, 15:48) *
tar это вообще элементарщина, был придуман чтобы потоково лить файлы на ленту.
Просто все привыкли что сейчас он еще заворачивается в gzip, вот и переживают...

Вообще по-хорошему надо найти исходники самого древнего unix - там будет и tar и gzip для минимальных ресурсов.

Да, я на это и надеялся, просто не открывал совсем, боялся испугаться sm.gif
а как открыл, так просветлел сильно и сразу. может кому еще пригодится, тут ссылки оставлю:
этого и этого, по-моему, вполне хватит для написания своего тара.

ну и просто обсуждение : тут и тут про тар "на пальцах на русском"

В-общем, спасибо огромное, с контейнером все понятно, красиво и просто, и непонятно что тут "ресурсами" называть sm.gif
а это была более срочная часть роботы, чем сжиматель, так что вдвойне приятно.- сделаю это, а сжиматель потом, он не так приоритетен

Осталось понять что со сжимателем делать, но теперь это совсем не срочно.

Цитата(SasaVitebsk @ Nov 22 2016, 18:47) *
Глупости. На меге делал модем. Там было сжатие. Примерно 2 коэффициент. Сжатие в потоке даже с адаптивным словарём очень мало рерурсов ест. А распаковка - вообще 0. На CM3 даже не заметишь.
Существенный выигрыш получается при увеличении размера словаря и если словарь предопределён, до начала сжатия.

Что именно использовали на Меге, какой упаковщик?

у меня файл завершен и записан на диск, и времени много. Могу хоть 10 раз его перечитать если это для составления и корректировки полного словаря нужно. Но вот RAM хотелось бы экономить.
Адаптивный словарь меня скорее всего тоже устроит. Текст, причем только нижняя половина ASCII, много похожих строк. То есть по малой части текста можно очень неплохо подходящий всему тексту словарь сделать. Zip эти 6 мегабайт жмет в 10 раз (на минимальной степени сжатия, 1), на максимальной (9) - в 15 раз жмет.
Go to the top of the page
 
+Quote Post
AlexandrY
сообщение Nov 22 2016, 17:10
Сообщение #12


Ally
******

Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050



Цитата(SasaVitebsk @ Nov 22 2016, 18:47) *
Глупости. На меге делал модем. Там было сжатие. Примерно 2 коэффициент. Сжатие в потоке даже с адаптивным словарём очень мало рерурсов ест. А распаковка - вообще 0. На CM3 даже не заметишь.
Существенный выигрыш получается при увеличении размера словаря и если словарь предопределён, до начала сжатия.


Самая дурь, это называть какие-либо конкретные коэффициенты сжатия.
Хотите подкину файл который после вашего сжатия не уменьшится, а увеличится в объеме? biggrin.gif
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Nov 22 2016, 19:06
Сообщение #13


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Речь шла о текстовом документе.
Скажем так. Пробовал пересжимать его зипом Особо выигрыша не было.
По сути алгоритм не изменился. Ничего нового не выдумали. Я уже писал. Играет роль размер словаря (особенно на крупных файлах) и предустановленный словарь. Причём словарь можно сделать наиболее употребляемый в данном случае. Это даст существенный выигрыш.
Как вариант взять и пропустить тексты через архиватор с стандартным словарём. После чего выделить получившийся закинуть на обе стороны.
В любом случае само сжатие/ распаковка используют мало ресурсов. Не в пример крипто. Только память. Памяти по нынешним временам 64к - не о чём.
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Nov 22 2016, 19:14
Сообщение #14


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(SasaVitebsk @ Nov 22 2016, 21:06) *
Речь шла о текстовом документе.

"Имя, сестра, имя!"
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Nov 22 2016, 19:19
Сообщение #15


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Цитата(Ruslan1 @ Nov 22 2016, 22:14) *
"Имя, сестра, имя!"

biggrin.gif
Я писал свой алгоритм для модема. Но все архиваторы построены в основе своей на https://ru.wikipedia.org/wiki/Алгоритм_Лемп..._—_Зива_—_Велча.
То есть ZIP, на сколько я понимаю.
ЗЫ: Прошу прощения, посмотрел, оказывается я не прав. Буква Z ввела в заблуждение. Ну и когда RAR смотришь - там про словарь тоже указывается. Короче я использовал модифицированный метод словаря. Который в модемах применяется. Там словарь передаётся прямо в потоке. И параллельно формируется на обоих концах. Сжатый файл таким методом, сжимается ZIPом совсем не значительно.
Go to the top of the page
 
+Quote Post

3 страниц V   1 2 3 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 20th July 2025 - 21:22
Рейтинг@Mail.ru


Страница сгенерированна за 0.01503 секунд с 7
ELECTRONIX ©2004-2016