реклама на сайте
подробности

 
 
4 страниц V  < 1 2 3 4 >  
Reply to this topicStart new topic
> Создание Электронной Библиотеки, Кто чем?
TsAN
сообщение Jul 31 2007, 17:48
Сообщение #16


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



Escorial, так ведь, IMHO, и сам файл в формате html довольно прилично может выполнять функции оболочки-контейнера. Ежели работать под Win, так там некоторые просмоторщики, напр., для djvu или pdf, могут быть интегрированы в браузер; в случае же отсутствия таковой интерации просто запускается программа, обслуживающая нужный формат, и единственное отличие второго варианта от первого - так открытие документа в новом окне. В то же время сам формат html достаточно хорошо документирован, что позволяет при минимальных навыках программирования (ну хоть на старинном Бэйсике) самостоятельно написАть программу, вполне прилично генерирующую нужный html-файл с каким-либо описанием материала и ссылкой на него на основе любых текстовых файлов, напр., в простейшем случае - на основе файла, полученного командой dir /s >Spicok_knig.txt. Т.е., сохранили Вы что-то нужное - применили вышеупомянутую команду dir - запустили этот генератор - и получили готовый к употреблению html-контейнер, в который уже внесены все свежескачанные новые материалы, разложенные по разделам. Лень проделывать все эти процедуры - приписали их в командном файле и вытащили его на ярлык или кнопку - ну, типа ОБНОВИТЬ СПИСОК.
Едиственная сложность: чтобы ссылки какой-либо информацией снабдить - эту информацию необходимо где-то взять, ибо никакой генератор самостоятельно её не создаст. Однако функцию получения подобой информации о книге из нормального имени файла или из html-файла, сопровождающего выкладку, поручить такому генератору вполне возможно. Ну, м.б., с минимальным ручным редактированием, напр., если аннотация слишком большая - указать, что из неё надо включить в описание линка.

Удачи!
Go to the top of the page
 
+Quote Post
_artem_
сообщение Aug 1 2007, 00:46
Сообщение #17


учащийся
*****

Группа: Свой
Сообщений: 1 065
Регистрация: 29-10-05
Из: города контрастов
Пользователь №: 10 249



Цитата(Nixon @ Jun 19 2007, 09:39) *
google desktop с плагинами.


Никсон, вы за GDS ничего странного не замечали, типа сброс информации в инет или адваре ?


--------------------
Зачем лаять на караван , когда на него можно плюнуть?

Go to the top of the page
 
+Quote Post
_artem_
сообщение Aug 2 2007, 23:32
Сообщение #18


учащийся
*****

Группа: Свой
Сообщений: 1 065
Регистрация: 29-10-05
Из: города контрастов
Пользователь №: 10 249



Крайне прискорбно но следует отметить факт что pdftotext от GDS индексирует всего 10 тыс слов считая с начала документа. (кстати он должен отдельно сгружаться с гугл, внутри инсталяционки его нет).

Линк - http://desktop.google.com/support/bin/answ...amp;topic=11603

Господа товарищи , кто может привести параметры на другие search енДжины?


--------------------
Зачем лаять на караван , когда на него можно плюнуть?

Go to the top of the page
 
+Quote Post
Losik
сообщение Aug 3 2007, 22:28
Сообщение #19


Местный
***

Группа: Свой
Сообщений: 453
Регистрация: 22-04-07
Пользователь №: 27 235



Вопрос в тему. Может кто занимался составлением классификатора по электронике?
И второй вопрос, при сортировки статей и книжек довольно часто трудно определить куда их запихнуть, поддерживает ли какой-нибудь софт создание и обработку ссылок?
Go to the top of the page
 
+Quote Post
Alex B._
сообщение Aug 4 2007, 09:50
Сообщение #20


Знающий
****

Группа: Свой
Сообщений: 943
Регистрация: 6-07-04
Из: Санкт-Петербург
Пользователь №: 274



Цитата(_artem_ @ Aug 3 2007, 03:32) *
Господа товарищи , кто может привести параметры на другие search енДжины?

http://www.likasoft.com/ru/document-search/
Go to the top of the page
 
+Quote Post
alextix
сообщение Aug 4 2007, 10:14
Сообщение #21


Частый гость
**

Группа: Свой
Сообщений: 93
Регистрация: 20-11-05
Пользователь №: 11 127



Пользуюсь Greenstone http://www.greenstone.org/
после прочтения статьи http://itc.ua/print.phtml?ID=4548
Go to the top of the page
 
+Quote Post
umup
сообщение Aug 4 2007, 21:19
Сообщение #22


Местный
***

Группа: Свой
Сообщений: 226
Регистрация: 2-06-06
Пользователь №: 17 720



Цитата
Например, понравилась страничка, нажал кнопку и ее содержимое сохранилось во внутренней базе данных


может подойдет ScrapBook (плагин для FireFox) ?
сохраняет в локальной папке страницы с любой вложенностью и содержимым, управление скачанными страницами как закладками - организованы в виде дерева, страницы можно редактировать прямо в броузере - удалять ненужные блоки, картинки и т.п.
Go to the top of the page
 
+Quote Post
_artem_
сообщение Aug 4 2007, 22:34
Сообщение #23


учащийся
*****

Группа: Свой
Сообщений: 1 065
Регистрация: 29-10-05
Из: города контрастов
Пользователь №: 10 249



Спасибо за ссылки .
Архивариус вроде бы есть на аваксе - 3.88. Проверю как работает. DTsearch не понравился - у меня с rar'ом проблемы вышли.


--------------------
Зачем лаять на караван , когда на него можно плюнуть?

Go to the top of the page
 
+Quote Post
shasik
сообщение Aug 28 2007, 13:04
Сообщение #24


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(alextix @ Aug 4 2007, 13:14) *
Пользуюсь Greenstone http://www.greenstone.org/
после прочтения статьи http://itc.ua/print.phtml?ID=4548


После прочтения восторженных отзывов про GreenStone, восхитился. Не терпелось, решил не ждать и скачать... Скачал... Теперь сижу и жалею времени моего домашнего dial-up'а, потраченного на загрузку куска г%#на размером 46 МБ. Полный отстой!!!

Подробности нужны?
- Интерфейс сделан в стиле antiuser. Впрочем, это мелочь. Спасибо уже за то, что хоть с командной строки километровые команды вводить не надо. А то что все медленно отрисовывается, так это дело привычки.
- Индексирование. На некоторых html'ах подвисает (в логе что-то вроде "out of bounds"). Такая же история с pdf'ами: на некоторых просто клина ловит. Rar'ы не ест. Подумал, что, наверное, я дурак и просто пользоваться не умею. Решил потренироваться. Создал папку, в которую поместил 14 простых текстовых файлов. Общим объемом 7 метров. Попробовал создать свою электронную коллекцию. У меня двухядерный Pen'4 3ГГц, когда перегоняю фильмы, могу комфортно продолжать работать. Но если GreenStone обрабатывает тектовый файл, то об этом можно забыть. Проц загружен под завязку, даже окошки переключаются с ох$&%ной задержкой. А общее время обработки!!! За это время, что обрабатывались эти 14 файлов, я бы успел в ручную(!) (не говоря уже про метод Ctrl+C/Ctrl+V) создать на каждый файл описание в несколько абзацев. А ведь это были простые тесктовики! Проводник, Far, Total Commander и др. - все умеют искать текст в файлах, некоторые ищут и в архивах, причем делают это гораздо быстрее. В чем же смысл тогда? Конечно, если занурнуть в глубины настроек, подредактировать исходники этой программулины, разогнать Java'у и т.д., то возможно когда-нибудь что-нибудь получится, если повезет...

К слову, попробовал Архивариус 3000. Хотел сначала тоже обхаять, но потом познакомился с GreenStone...
В Архивариусе не понравилось следующее: обрабатывать тектовые файлы в Rar'ах отказался (unsupported format), пришлось поставить галочку "Извлекать файлы из архивов". В результате "индекс" для папки, в которой были 3814 архивов с тектовыми файлами весом 471 МБ, завесил на 1,5ГБ, т.е. 3 раза больше исходного. Зато представление результата поиска радует, понравился морфологический поиск. А инсталяшка всего то - 3,4 МБ!
Так вот, при настройках по умолчанию Архивариус обработал 3814 архивов быстрее, чем GreenStone 14 уже извлеченных из этих архивов текстовых документа. Вот такое вот быстродействие. Похоже, что новозеландцы это наши чукчи только в южном полушарии. Австралийцы про них тоже анектоды сочиняют.

Для себя сделал такой вывод: для текстовых файлов в архивах, если искать что-нибудь в них нужно часто, то заюзаю Архивариус, если не часто - то Total Commander с его поиском в архивах по содержимому. Но GreenStone не буду есть даже в "блокадном Ленинграде". IMHO. Ну, а для pdf'ов и djvu'шек буду продолжать пользовать файловой системой: логичная структура катологов и "ставящее все на свои места" имя файла. Достаточно удобно и не так уж и трудоемко. Сначала, конечно, сложно, а потом, когда необходимо добавить всего несколько новых файлов, как два байта переслать..

P.S. Попробовал GreenStone еще раз. Ведь так хвалят... Взял теперь 6 текстовиков общим размером 6,7 МБ. GreenStone работал чуть больше 5 минут (вот это скорость!), при этом я в IDE продолжал параллельно ковырять исходник. Размер получившейся my_lib составил 40,8 МБ (всего в 6 раз больше). Попробовал поиск: нашел не все знаки зодиака (в папке была книга на астрологииsmile.gif - вот она вероятная разгадка скорости! И попробуйте меня теперь переубедить, что ето есть крутая вестчь.

А ведь счастье есть, его не может не быть...
Go to the top of the page
 
+Quote Post
shasik
сообщение Dec 26 2007, 07:06
Сообщение #25


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Возникла другая проблема.

Я теперь просто раскладываю книги по тематическим папкам. А проблема в том, что у меня они хранятся дома и на работе. Пополнения могут прийти и туда, и туда.
Вопрос: как их синхронизировать? А точнее чем? Т.е. я взял очередное пополнение раскидал его по папкам. Программа-синхронизатор сделала "снимок", создала update, я принес его домой/на работу, запустил такую же программу, которая подхватила этот update и сама(!) раскидала пополнение по тем же папкам. Подскажите?
Go to the top of the page
 
+Quote Post
kipmaster
сообщение Dec 26 2007, 08:45
Сообщение #26


Частый гость
**

Группа: Свой
Сообщений: 90
Регистрация: 26-10-07
Из: Одесса
Пользователь №: 31 768



У меня куча даташитов, документов Оффиса, Аcad, - все разложено по проектам. Искать вручную нужный элемент нереально. Давно пользуюсь Copernic Desktop Search. Поиск занимает секунды. Прога индексирует файлы указанных типов по содержанию. Я очень доволен. Только djvu не знаю, а PDF - очень классно обрабатывает.

Цитата(shasik @ Dec 26 2007, 09:06) *
Вопрос: как их синхронизировать? А точнее чем?


Total Commander хорошо синхронизирует. Только на флэшке нужно носить весь архив. Дома и на работе запускаю синхронизацию и по списку несовпадений выбираю, что удалить, что скопировать.
Go to the top of the page
 
+Quote Post
shasik
сообщение Dec 26 2007, 10:18
Сообщение #27


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(kipmaster @ Dec 26 2007, 10:45) *
Total Commander хорошо синхронизирует. Только на флэшке нужно носить весь архив. Дома и на работе запускаю синхронизацию и по списку несовпадений выбираю, что удалить, что скопировать.

Что значит "носит весь архив"? Архив с новыми поступлениями или вообще весь? Просто у меня того, что называется "книга" около 20 ГБ, более 10000 файлов. Носить все на флэшке - это круто. А пополнения примерно раз в неделю, примерно по одной-две сотни файлов. Отсортировав все дома/на работе, не хочется еще раз в ручную(!) сортировать по папкам.
Go to the top of the page
 
+Quote Post
Alex B._
сообщение Dec 26 2007, 12:08
Сообщение #28


Знающий
****

Группа: Свой
Сообщений: 943
Регистрация: 6-07-04
Из: Санкт-Петербург
Пользователь №: 274



Цитата(shasik @ Dec 26 2007, 13:18) *
А пополнения примерно раз в неделю, примерно по одной-две сотни файлов. Отсортировав все дома/на работе, не хочется еще раз в ручную(!) сортировать по папкам.

Уже года два пользую вот это:
http://soft.softodrom.ru/ap/p2599.shtml
Синхронизирует в разы быстрее чем TotalCommander
оффсайт лежит почему-то но в кэше гугля инфа есть.
Go to the top of the page
 
+Quote Post
shasik
сообщение Jan 29 2008, 10:23
Сообщение #29


Местный
***

Группа: Свой
Сообщений: 319
Регистрация: 3-09-05
Из: Беларусь, Новополоцк
Пользователь №: 8 188



Цитата(Alex B._ @ Dec 26 2007, 14:08) *
Уже года два пользую вот это:
http://soft.softodrom.ru/ap/p2599.shtml
Синхронизирует в разы быстрее чем TotalCommander
оффсайт лежит почему-то но в кэше гугля инфа есть.


VuBrief 5.3 - то, что доктор прописал. Попробовал - понравилось!
Большое Спасибо За Наводку!
Go to the top of the page
 
+Quote Post
Doka
сообщение Feb 16 2008, 15:59
Сообщение #30


Electrical Engineer
******

Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778



а нет ли под эти задачи какого-нить _уже_придуманного_ стандарта, на основе XML ? (чтобы не выдумывать велосипед)

как я себе это представляю: каждый файл комплектуется файлом формата XML (метаданные) с идентичным названием, в котором описано всё, начиная от УДК или ISBN и MD5sum файла, заканчивая ключевыми тэгами книги (для быстрого поиска) и фото обложки в Base64.
такая децентрализованность может облегчить распространение электронных документов, каждый из которых комплектуется файлом XML (метаданные).
а для поиска/индексации использовать простую утилитку (благо сейчас XML подерживается на очень высоком уровне), которая бы просто лазила по каталогам и парсила все XML-файлы со стандартным и известным заголовком/структурой.
если библиотека _очень_большая - то как опция - сливать это в единый XML (кэш), а переиндексацию запускать оп прибытии новых документов.


--------------------
Блог iDoka.ru
CV linkedin.com/in/iDoka
Sources github.com/iDoka


Never stop thinking...........................
Go to the top of the page
 
+Quote Post

4 страниц V  < 1 2 3 4 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 25th April 2024 - 00:04
Рейтинг@Mail.ru


Страница сгенерированна за 0.01495 секунд с 7
ELECTRONIX ©2004-2016