реклама на сайте
подробности

 
 
> Создание Электронной Библиотеки, Кто чем?
shasik
сообщение Jun 18 2007, 08:22
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Есть некоторое количество книг в pdf, djvu, chm и др. Упарило бегить по каталогам и искать нужную. Подскажите какими программами пользуетесь для создания электронной библиотеки. Создание простого списка файлов - это не то. А так чтобы красиво было да с поиском и т.п. В нете посмотрел. Есть, есть разные. А хорошие то какие?

Ссылки на программы приветствуются.
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
umup
сообщение Jul 6 2007, 07:44
Сообщение #2


Местный
***

Группа: Свой
Сообщений: 226
Регистрация: 2-06-06
Пользователь №: 17 720



А что, "поиск" в проводнике или total commander не работает ?

Я делал двумя методами :

- простой - переименовывал файлы в соответствии с их полным названием, автором, годом и т.д. и раскидывал по подпапкам в соответствии с темой книги;
- более сложный (когда книг очень много) - каждую книгу или набор файлов - в архив, в архив - файл XML с информацией о книге/авторе/дате и т.д., потом программкой на Питоне генерируется HTML со списком книг, отсортированном по темам и алфавиту. По сравнению с BOOKSEER или базами данных преимущество в переносимости и кроссплатформенности - вся информация о книге содержится вместе с ней, работает на любых системах.
Go to the top of the page
 
+Quote Post
shasik
сообщение Jul 9 2007, 05:19
Сообщение #3


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(umup @ Jul 6 2007, 10:44) *
А что, "поиск" в проводнике или total commander не работает ?


Если у Вас книги в *.txt, то тогда конечно. А если DJVU? А если книг 20 имеют одинаковое название, например: Цифровая обработка сигналов, Справочник по ЦОС, ЦОС речевых сигналов и т.д? А если нужно найти не название книги, а конкретную тему Ваш способ поможет? А если книг несколько тысяч?

Зачем нужен total чтобы найти книгу, название которой и так знаешь, а по содержимому в djvu пролет полный
Go to the top of the page
 
+Quote Post
TsAN
сообщение Jul 9 2007, 17:27
Сообщение #4


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



Цитата(shasik @ Jul 9 2007, 09:19) *
А если нужно найти не название книги, а конкретную тему Ваш способ поможет? А если книг несколько тысяч?
Цитата(shasik @ Jul 9 2007, 09:19) *
а по содержимому в djvu пролет полный
Как-то плохо представляю алгоритм поиска, скажем, конкретной темы, в djvu файле, который получен со стороны и не содержит ни OCR-слоя, ни закладок. Не, можно, конечно, и оцифровку сделать, и букмарки расставить. Можно, в конце-концов, листая книгу, и запись в какой-либо базе данных заполнить - дабы её использованием поиск по нужным параметрам обеспечить. Да вот только небольшая мелочь: делать-то всё это придётся исключительно самому, да ещё и практически для всех книг. Напр., коллективно примерно таким вот образом подшивку журнала "Наука и жизнь" за 1990-2005 гг создали: там и полнотекстовой поиск работает; и букмарки, по которым можно навигацию и по рубрикам, и по авторам, и по номерам организовать, имеются. Но журналов-то этих пока что менее двух сотен. А если книг таких действительно несколько тысяч окажется? И, если работать в одиночку, то останется ли после завершения всей этой черновой работы время, чтобы её плодами воспользоваться?
Извиняйте за оффтоп, но - в вышеприведённом аспекте - вопрос, IMHO, разумно и несколько шире, и, возможно, в отдельном топике, рассмотреть. А именно: не кто какими программами для создания/сопровождения своей личной электронной библиотеки пользуется, а какие из них выбрать (а возможно, необходимые и разработать придётся), чтобы совместное их использование было бы и максимально эффективно, и суммарные затраты ручного (ввод данных) труда минимизировало. В последнем случае я имею в виду, что всю необходимую информацию достаточно будет ввести всего лишь только один раз на каком-то определённом этапе создания электронной книги - и результатом можно пользоваться всем участникам проекта, независимо, скажем, от ОС.

Удачи!
Go to the top of the page
 
+Quote Post
shasik
сообщение Jul 10 2007, 05:47
Сообщение #5


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(TsAN @ Jul 9 2007, 20:27) *
Как-то плохо представляю алгоритм поиска, скажем, конкретной темы, в djvu файле, который получен со стороны и не содержит ни OCR-слоя, ни закладок.


В нете есть програмки и командные файлы к ним, которые
1. сохраняют некоторые страницы djvu в tiff
2. добавляют текстовый файл в файлу djvu (типа OCR).

Делаем следующее:
1. переименовываем файлы по определенному закону
2. переписываем соответствующим образом батники (командные файлы) для работы не с одним файлом, а группой файлов
3. Делаем с помощью finereader'а OCR
4. Запихиваем *.txt в *.djvu

Ручная работы - п.3, отстальное более-менее автоматизировано.
Делал так. Если честно, то подзае...., есть определенные подводные камни. Может что по-лучше посоветуете, плз.
Go to the top of the page
 
+Quote Post
TsAN
сообщение Jul 10 2007, 18:19
Сообщение #6


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



shasik, ну так и я об этом же тяжком труде говорил, а Вы конкретизировали. Беда в том, что в такой ситуации, пользуясь словами автора известных первоисточников, посоветовать можно, IMHO, только одно - лучше меньше, да лучше. Т.е., ежели что выкладывать, так луше одну-две книги до нормального товарного вида довести, чем за этот же срок десяток сырцов вывалить, с которыми затем другие мучаться будут. Конечно, бывают ситуации, когда материал позарез срочно нужен - и здесь уж не до товарного вида: лишь бы разобрать можно было. Тут вот ещё какой фактор вмешивается: преобразование tiff в djvu народ почти всегда выполняет с потерями, т.е., со снижением качества. В то время как материал со сканера можно непосредственно в tiff'ах получить - и безо всяких потерь. Поэтому, за редким исключением, всю обработку лучше выполнять с оригинальных tiff'ов, а не с тех, кои из djvu выгнаны. К величайшему сожалению, на практике делать книгу в электронном виде от начала до конца выполнимо далеко не всегда: у кого-то просто нет доступа к сканеру или нужным книгам, кто-то не может свои отсканированные материалы в djvu перегнать, кто-то в принципе не применяет OCR, ибо все равно оцифровка с ошибками выполняется, а делать полную вычитку - на это времени нет. Можно, конечно, пытаться усилия объединить, однако это получается даже гораздо реже, чем одному весь процесс вести.
Относительно ручной работы. Что-то мне кажется, что и по п.3 уже должны быть наработаны методы автоматизации. Вопросы сканирования, обработки и сборки применительно к создаю электронных книг обсуждаются на многих форумах, так что если есть желание и силы заниматься этим регулярно, то, наверное, имеет смысл там потолкаться: и к уже достигнутым технологиям можно будет приобщиться, и чужие ошибки учесть.

А вот на счёт посоветовать что-нибудь получше - вопрос спорный, ибо субьективизма в нём много. Лично я использую имя файла как записи базы данных: автор(ы), название, издательство, год издания, формат/качество, количество страниц, ISBN, рубрика. Достоинства: получил файл, переименовал по форме, положил в нужный каталог - вот и вся ручная работа, ибо всё остальное можно выполнить при помощи разного рода автоматических примочек. Явный недостаток: при очень большом количестве книг, особенно незнакомых, всё ж таки желательно иметь что-нибудь типа краткого содержания или аннотации. К счастью, в последнее время стало признаком хорошего тона: если выкладываешь книгу - приведи и её характеристику. Поэтому, скачивая книгу, имеет смысл сохранить рядом и эту информацию - возможно, когда-либо это позволит не набивать её заново - т.е., примерно так, как это делает ув. umup в случае, когда книг много. Материал, так сказать, для книжного обозрения.

Удачи!
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- shasik   Создание Электронной Библиотеки   Jun 18 2007, 08:22
- - el34   пользую dtSearch от www.dtsearch.com доволен...   Jun 18 2007, 08:25
|- - shasik   Цитата(el34 @ Jun 18 2007, 11:25) пользую...   Jun 21 2007, 05:36
|- - Nixon   Цитата(shasik @ Jun 21 2007, 08:36) Посмо...   Jun 22 2007, 07:55
- - arttab   BOOKSEER но не очень даволен   Jun 18 2007, 15:56
- - Nixon   google desktop с плагинами.   Jun 19 2007, 06:39
|- - _artem_   Цитата(Nixon @ Jun 19 2007, 09:39) google...   Aug 1 2007, 00:46
- - varvar_p   Мы пользуемся Sharepoint . Для группы разработчико...   Jun 21 2007, 07:07
|- - TsAN   Цитата(umup @ Jul 6 2007, 11:44) переимен...   Jul 8 2007, 16:22
- - Sergu   Пользуюсь Архивариусом 3000 для поиска по книжкам,...   Jul 9 2007, 08:29
- - Escorial   А может кто знает программу которая является униве...   Jul 31 2007, 15:38
|- - TsAN   Escorial, так ведь, IMHO, и сам файл в формате htm...   Jul 31 2007, 17:48
- - _artem_   Крайне прискорбно но следует отметить факт что pdf...   Aug 2 2007, 23:32
|- - Alex B._   Цитата(_artem_ @ Aug 3 2007, 03:32) Госпо...   Aug 4 2007, 09:50
- - Losik   Вопрос в тему. Может кто занимался составлением кл...   Aug 3 2007, 22:28
- - alextix   Пользуюсь Greenstone http://www.greenstone.org/ по...   Aug 4 2007, 10:14
|- - shasik   Цитата(alextix @ Aug 4 2007, 13:14) Польз...   Aug 28 2007, 13:04
|- - shasik   Возникла другая проблема. Я теперь просто расклад...   Dec 26 2007, 07:06
- - umup   ЦитатаНапример, понравилась страничка, нажал кнопк...   Aug 4 2007, 21:19
- - _artem_   Спасибо за ссылки . Архивариус вроде бы есть на а...   Aug 4 2007, 22:34
- - kipmaster   У меня куча даташитов, документов Оффиса, Аcad, - ...   Dec 26 2007, 08:45
|- - shasik   Цитата(kipmaster @ Dec 26 2007, 10:45) To...   Dec 26 2007, 10:18
|- - Alex B._   Цитата(shasik @ Dec 26 2007, 13:18) А поп...   Dec 26 2007, 12:08
|- - shasik   Цитата(Alex B._ @ Dec 26 2007, 14:08) Уже...   Jan 29 2008, 10:23
- - Doka   а нет ли под эти задачи какого-нить _уже_придуманн...   Feb 16 2008, 15:59
|- - Sevrukov_Andrey   уже упоминался, до добавлю свой плюс в сторону арх...   Jan 16 2009, 10:28
|- - Sergu   Цитата(Sevrukov_Andrey @ Jan 16 2009, 13...   Jan 27 2009, 06:55
- - _pegas_   BookCollector - очень нравится   Jun 16 2008, 13:54
- - Doka   _pegas_ а подробней можно?? (сайт, основные возмож...   Jun 22 2008, 18:22
- - ukpyr   Цитатав связи с этим, интересен вопрос прикрутки л...   Jun 24 2008, 08:20
|- - Doka   Цитата(ukpyr @ Jun 24 2008, 12:20) можно ...   Jun 24 2008, 19:51
- - Mikle Klinkovsky   Во, только сегодня пробежало по Клерк.ру: Программ...   Jun 24 2008, 22:18
- - Doka   в развитии темы: наткнулся на просторах википедии ...   Jul 5 2008, 11:06
- - Yra   Я сначала переименовал почти все книжные файлы к в...   Jul 19 2008, 21:41
|- - Doka   Цитата(Yra @ Jul 20 2008, 01:41) Установи...   Jul 30 2008, 16:27
- - andr1791   Lizard Tech Virtual printer позволяет создать DjvU...   Apr 5 2009, 13:46
- - tsw   Virtual printer не всегда обеспечивает нужное каче...   Apr 11 2009, 11:53
- - White84   Свою библиотеку содержу в программе KuLinks. Вполн...   Mar 15 2010, 20:24
- - Mactovian   Использую программу WhereIsIt (_rutracker.org/foru...   Mar 16 2010, 10:16
- - KBH   Цитата(shasik @ Jun 18 2007, 12:22) Есть ...   Jul 24 2014, 07:53
|- - Anga   А вот существует ли каталогизатор, который умеет с...   Jan 27 2016, 22:54
|- - _Ⓐ_   Цитата(Anga @ Jan 28 2016, 01:54) А вот с...   Feb 4 2016, 10:46
|- - HardEgor   Цитата(_Ⓐ_ @ Feb 4 2016, 16:46) Фан...   Mar 29 2016, 10:54
- - tdocs.su   А я вот много лет уже веду гипертекстовую базу дан...   Jan 20 2015, 07:54
- - TSerg   Достаточно интересный free-продукт: DB-Note Этаки...   Feb 3 2016, 18:33


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 11th August 2025 - 19:06
Рейтинг@Mail.ru


Страница сгенерированна за 0.01487 секунд с 7
ELECTRONIX ©2004-2016