реклама на сайте
подробности

 
 
4 страниц V   1 2 3 > »   
Reply to this topicStart new topic
> Создание Электронной Библиотеки, Кто чем?
shasik
сообщение Jun 18 2007, 08:22
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Есть некоторое количество книг в pdf, djvu, chm и др. Упарило бегить по каталогам и искать нужную. Подскажите какими программами пользуетесь для создания электронной библиотеки. Создание простого списка файлов - это не то. А так чтобы красиво было да с поиском и т.п. В нете посмотрел. Есть, есть разные. А хорошие то какие?

Ссылки на программы приветствуются.
Go to the top of the page
 
+Quote Post
el34
сообщение Jun 18 2007, 08:25
Сообщение #2


инженер
****

Группа: Свой
Сообщений: 717
Регистрация: 4-03-05
Пользователь №: 3 064



пользую
dtSearch от
www.dtsearch.com
доволен...


--------------------
........поужинали вяленой рыбой, кот лежал рядом, молчали.......
Go to the top of the page
 
+Quote Post
arttab
сообщение Jun 18 2007, 15:56
Сообщение #3


Профессионал
*****

Группа: Свой
Сообщений: 1 432
Регистрация: 7-12-04
Из: Новосибирск
Пользователь №: 1 371



BOOKSEER но не очень даволен


--------------------
OrCAD, Altium,IAR, AVR....
Go to the top of the page
 
+Quote Post
Nixon
сообщение Jun 19 2007, 06:39
Сообщение #4


Гуру
******

Группа: Админы
Сообщений: 2 736
Регистрация: 17-06-04
Из: Киев
Пользователь №: 48



google desktop с плагинами.


--------------------
Вам помочь или не мешать?
Go to the top of the page
 
+Quote Post
shasik
сообщение Jun 21 2007, 05:36
Сообщение #5


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(el34 @ Jun 18 2007, 11:25) *
пользую
dtSearch от
www.dtsearch.com
доволен...

Скачал... Посмотрел... Жалею потраченного времени dialup'а... Не то , что требовалось...

Цитата(Nixon @ Jun 19 2007, 09:39) *
google desktop с плагинами.


Посмотрел... Если не секрет с какими именно плагинами, а то их, блин, целая куча, и почте все полезные какие-то, аж противно.

Цитата(arttab @ Jun 18 2007, 18:56) *
BOOKSEER но не очень даволен


Посмотрел... Зародыш того, что требуется. Функционал слабоват...
Go to the top of the page
 
+Quote Post
varvar_p
сообщение Jun 21 2007, 07:07
Сообщение #6


Участник
*

Группа: Участник
Сообщений: 71
Регистрация: 1-02-07
Из: Taiwan, Taipei
Пользователь №: 24 946



Мы пользуемся Sharepoint . Для группы разработчиков удобно обмениваться ссылками на документы, можно устанавливать права доступа к различным библиотекам документов..
Go to the top of the page
 
+Quote Post
Nixon
сообщение Jun 22 2007, 07:55
Сообщение #7


Гуру
******

Группа: Админы
Сообщений: 2 736
Регистрация: 17-06-04
Из: Киев
Пользователь №: 48



Цитата(shasik @ Jun 21 2007, 08:36) *
Посмотрел... Если не секрет с какими именно плагинами, а то их, блин, целая куча, и почте все полезные какие-то, аж противно.

Archives Plugin for Google Desktop Search - для расширения списка поддерживаемых форматов архивов (в основном из-за .rar)
и еще некоторые форматные.


--------------------
Вам помочь или не мешать?
Go to the top of the page
 
+Quote Post
umup
сообщение Jul 6 2007, 07:44
Сообщение #8


Местный
***

Группа: Свой
Сообщений: 226
Регистрация: 2-06-06
Пользователь №: 17 720



А что, "поиск" в проводнике или total commander не работает ?

Я делал двумя методами :

- простой - переименовывал файлы в соответствии с их полным названием, автором, годом и т.д. и раскидывал по подпапкам в соответствии с темой книги;
- более сложный (когда книг очень много) - каждую книгу или набор файлов - в архив, в архив - файл XML с информацией о книге/авторе/дате и т.д., потом программкой на Питоне генерируется HTML со списком книг, отсортированном по темам и алфавиту. По сравнению с BOOKSEER или базами данных преимущество в переносимости и кроссплатформенности - вся информация о книге содержится вместе с ней, работает на любых системах.
Go to the top of the page
 
+Quote Post
TsAN
сообщение Jul 8 2007, 16:22
Сообщение #9


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



Цитата(umup @ Jul 6 2007, 11:44) *
переименовывал файлы в соответствии с их полным названием, автором, годом и т.д. и раскидывал по подпапкам в соответствии с темой книги
Собственно говоря, при таком вот переименовании вся информация, необходимая для однозначной идентификации книги, оказывается приведённой в имени файла. И вот какой вопрос возникает: если книги уже правильно названы и распределены по каталогам в соответствии с тематикой - что мешает сгенерерировать, скажем, htlm-файл, в котором и прописать название книги и путь к ней? Ибо ежели вся необходимая информация о книге уже содержится в имени файла, её представляющего, так зачем ещё создавать архив, дублируя в него эту информацию? И, по мере пополнения библиотеки, повотрять процедуру генерации.
Более подробно о характеристиках такого html-файла уже было говорено, вроде даже ссылка с примером ещё жива.

Удачи!
Go to the top of the page
 
+Quote Post
shasik
сообщение Jul 9 2007, 05:19
Сообщение #10


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(umup @ Jul 6 2007, 10:44) *
А что, "поиск" в проводнике или total commander не работает ?


Если у Вас книги в *.txt, то тогда конечно. А если DJVU? А если книг 20 имеют одинаковое название, например: Цифровая обработка сигналов, Справочник по ЦОС, ЦОС речевых сигналов и т.д? А если нужно найти не название книги, а конкретную тему Ваш способ поможет? А если книг несколько тысяч?

Зачем нужен total чтобы найти книгу, название которой и так знаешь, а по содержимому в djvu пролет полный
Go to the top of the page
 
+Quote Post
Sergu
сообщение Jul 9 2007, 08:29
Сообщение #11


Участник
*

Группа: Участник
Сообщений: 67
Регистрация: 18-03-05
Пользователь №: 3 452



Пользуюсь Архивариусом 3000 для поиска по книжкам, статьям и документации
www.likasoft.com/ru/document-search/index.shtm
поддерживает все языки и форматы, какие только можно выдумать ;-)
Go to the top of the page
 
+Quote Post
TsAN
сообщение Jul 9 2007, 17:27
Сообщение #12


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



Цитата(shasik @ Jul 9 2007, 09:19) *
А если нужно найти не название книги, а конкретную тему Ваш способ поможет? А если книг несколько тысяч?
Цитата(shasik @ Jul 9 2007, 09:19) *
а по содержимому в djvu пролет полный
Как-то плохо представляю алгоритм поиска, скажем, конкретной темы, в djvu файле, который получен со стороны и не содержит ни OCR-слоя, ни закладок. Не, можно, конечно, и оцифровку сделать, и букмарки расставить. Можно, в конце-концов, листая книгу, и запись в какой-либо базе данных заполнить - дабы её использованием поиск по нужным параметрам обеспечить. Да вот только небольшая мелочь: делать-то всё это придётся исключительно самому, да ещё и практически для всех книг. Напр., коллективно примерно таким вот образом подшивку журнала "Наука и жизнь" за 1990-2005 гг создали: там и полнотекстовой поиск работает; и букмарки, по которым можно навигацию и по рубрикам, и по авторам, и по номерам организовать, имеются. Но журналов-то этих пока что менее двух сотен. А если книг таких действительно несколько тысяч окажется? И, если работать в одиночку, то останется ли после завершения всей этой черновой работы время, чтобы её плодами воспользоваться?
Извиняйте за оффтоп, но - в вышеприведённом аспекте - вопрос, IMHO, разумно и несколько шире, и, возможно, в отдельном топике, рассмотреть. А именно: не кто какими программами для создания/сопровождения своей личной электронной библиотеки пользуется, а какие из них выбрать (а возможно, необходимые и разработать придётся), чтобы совместное их использование было бы и максимально эффективно, и суммарные затраты ручного (ввод данных) труда минимизировало. В последнем случае я имею в виду, что всю необходимую информацию достаточно будет ввести всего лишь только один раз на каком-то определённом этапе создания электронной книги - и результатом можно пользоваться всем участникам проекта, независимо, скажем, от ОС.

Удачи!
Go to the top of the page
 
+Quote Post
shasik
сообщение Jul 10 2007, 05:47
Сообщение #13


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(TsAN @ Jul 9 2007, 20:27) *
Как-то плохо представляю алгоритм поиска, скажем, конкретной темы, в djvu файле, который получен со стороны и не содержит ни OCR-слоя, ни закладок.


В нете есть програмки и командные файлы к ним, которые
1. сохраняют некоторые страницы djvu в tiff
2. добавляют текстовый файл в файлу djvu (типа OCR).

Делаем следующее:
1. переименовываем файлы по определенному закону
2. переписываем соответствующим образом батники (командные файлы) для работы не с одним файлом, а группой файлов
3. Делаем с помощью finereader'а OCR
4. Запихиваем *.txt в *.djvu

Ручная работы - п.3, отстальное более-менее автоматизировано.
Делал так. Если честно, то подзае...., есть определенные подводные камни. Может что по-лучше посоветуете, плз.
Go to the top of the page
 
+Quote Post
TsAN
сообщение Jul 10 2007, 18:19
Сообщение #14


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



shasik, ну так и я об этом же тяжком труде говорил, а Вы конкретизировали. Беда в том, что в такой ситуации, пользуясь словами автора известных первоисточников, посоветовать можно, IMHO, только одно - лучше меньше, да лучше. Т.е., ежели что выкладывать, так луше одну-две книги до нормального товарного вида довести, чем за этот же срок десяток сырцов вывалить, с которыми затем другие мучаться будут. Конечно, бывают ситуации, когда материал позарез срочно нужен - и здесь уж не до товарного вида: лишь бы разобрать можно было. Тут вот ещё какой фактор вмешивается: преобразование tiff в djvu народ почти всегда выполняет с потерями, т.е., со снижением качества. В то время как материал со сканера можно непосредственно в tiff'ах получить - и безо всяких потерь. Поэтому, за редким исключением, всю обработку лучше выполнять с оригинальных tiff'ов, а не с тех, кои из djvu выгнаны. К величайшему сожалению, на практике делать книгу в электронном виде от начала до конца выполнимо далеко не всегда: у кого-то просто нет доступа к сканеру или нужным книгам, кто-то не может свои отсканированные материалы в djvu перегнать, кто-то в принципе не применяет OCR, ибо все равно оцифровка с ошибками выполняется, а делать полную вычитку - на это времени нет. Можно, конечно, пытаться усилия объединить, однако это получается даже гораздо реже, чем одному весь процесс вести.
Относительно ручной работы. Что-то мне кажется, что и по п.3 уже должны быть наработаны методы автоматизации. Вопросы сканирования, обработки и сборки применительно к создаю электронных книг обсуждаются на многих форумах, так что если есть желание и силы заниматься этим регулярно, то, наверное, имеет смысл там потолкаться: и к уже достигнутым технологиям можно будет приобщиться, и чужие ошибки учесть.

А вот на счёт посоветовать что-нибудь получше - вопрос спорный, ибо субьективизма в нём много. Лично я использую имя файла как записи базы данных: автор(ы), название, издательство, год издания, формат/качество, количество страниц, ISBN, рубрика. Достоинства: получил файл, переименовал по форме, положил в нужный каталог - вот и вся ручная работа, ибо всё остальное можно выполнить при помощи разного рода автоматических примочек. Явный недостаток: при очень большом количестве книг, особенно незнакомых, всё ж таки желательно иметь что-нибудь типа краткого содержания или аннотации. К счастью, в последнее время стало признаком хорошего тона: если выкладываешь книгу - приведи и её характеристику. Поэтому, скачивая книгу, имеет смысл сохранить рядом и эту информацию - возможно, когда-либо это позволит не набивать её заново - т.е., примерно так, как это делает ув. umup в случае, когда книг много. Материал, так сказать, для книжного обозрения.

Удачи!
Go to the top of the page
 
+Quote Post
Escorial
сообщение Jul 31 2007, 15:38
Сообщение #15


Частый гость
**

Группа: Свой
Сообщений: 104
Регистрация: 11-11-05
Из: Москва
Пользователь №: 10 714



А может кто знает программу которая является универсальным контейнером для документов формата htm, pdf, doc, xls и т.д. и интегрируется в браузер?

Например, понравилась страничка, нажал кнопку и ее содержимое сохранилось во внутренней базе данных программы в соответствующей рубрике, и чтобы программа понимала большинство популярных форматов.

Сейчас для этих целей используем сервер mediaWiki с хранением файлов на фтп. Но там пока ссылку на хранилище сделаешь, 100 лет пройдет. Хочется больше драг-n-дропа. 05.gif
Go to the top of the page
 
+Quote Post

4 страниц V   1 2 3 > » 
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 18th April 2024 - 23:26
Рейтинг@Mail.ru


Страница сгенерированна за 0.01509 секунд с 7
ELECTRONIX ©2004-2016