реклама на сайте
подробности

 
 
> Нужна ли централизованная библиотека технической литературы?
Archonmaster
сообщение Jul 17 2011, 23:36
Сообщение #1





Группа: Новичок
Сообщений: 3
Регистрация: 17-04-08
Из: Москва
Пользователь №: 36 825



Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов. И предоставить к ним бесплатный доступ любого желающего пользователя с одного сервера, чтоб не нужно было ждать по 10 минут перед скачиванием на всяких deposit'ах.
Ради интереса попробовал тогда написать небольшой скрипт для поиска и выкачивания файлов в формате DJVU из пиринговых сетей. За 1 сутки работы скачалось более 10 000 книжек. Посмотрел на эту перемешанную кашу и задвинул идею на полку.

Сейчас вот возникла идея создания автоматизированного каталогизатора найденных книжек. Чтоб умная программа сама узнавала, какая книжка находится в файле, собирала в интернете информацию об издании (автор, аннотация, обложка и т.д.). И создать самостоятельно наполняющуюся базу данных.

Технически такая задача реализуема.
---------------------------

Функции:

1) все книги находятся на одном сервере и скачать их можно бесплатно и без ожидания времени
2) книги автоматически отыскиваются в интернете, в других библиотеках, в пиринговых сетях (едонки, торрентс, и т.д.) и сохраняются на централизованный сервер
3) автоматически создается описание книги с названием, автором, аннотацией, обложкой (без необходимости ручного ввода или модерации)
4) книга автоматически заносится в рубрикатор
5) есть возможность поиска по тексту в книгах (как на books.google.com)
6) пользователи могут самостоятельно добавить в библиотеку отсканированные ими книги.

---------------------------

А вот с практической точки зрения будет интересен такой ресурс?
Или достаточно тех источников, что уже есть в сети?
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Archonmaster
сообщение Jul 18 2011, 15:52
Сообщение #2





Группа: Новичок
Сообщений: 3
Регистрация: 17-04-08
Из: Москва
Пользователь №: 36 825



Цитата(nikolascha @ Jul 18 2011, 16:18) *
Вы не одиноки... в сети уже есть подобный проект - gen.lib.rus.ec. Присоединяйтесь к нему...

Да. Очень интересный ресурс, спасибо за ссылку. Вроде как даже там можно через FTP все скачать.
Вот еще один нашел http://reslib.com . На сколько я понял, там представлена вся коллекция мехматовской библиотеки.

Цитата(haker_fox @ Jul 18 2011, 11:23) *
С юридической точки зрения это незаконно. Нельзя копировать книги.

С юридической стороны я не рассматривал этот вопрос вообще. Пока что имеется только техническая идея. Даже не воплощенная в жизнь целиком, лишь отдельными кусками.
Во-первых, не разбираюсь в юр. делах. Во-вторых, мне интересно реализовать сервис с технической точки зрения - люблю решать сложные задачки. В-третьих, хочется создать ресурс прежде всего для себя. И если кто-то со стороны правоохранительных органов будет прессовать, то тогда придется закрыть все для публики, но для себя и знакомых хороший инструмент останется (я так понял, с мехматом произошло что-то подобное).

Если есть идеи, как можно избежать подобных сложностей, то расскажите, пожалуйста.
Сразу на ум приходит rutracker.org, когда будучи еще torrents.ru его хотели прикрыть. Но как прикопаться? ведь на сайте лежат лишь ссылки на файлы, которые хранятся бог знает у кого на компьютере. Конечно не хотелось бы располагать все в пиринговой сети, а собрать все реально на одном (или группе) носителе.

Вариант расположить все на зарубежных серваках, где-нибудь в африке (?), а доменное имя зарегать буржуйское, чтоб его не забанили.

Но, скажем, вконтакте вообще как-то не парится с хранением, скажем, фильмов. Пока не читал инфу про то, как им это удается.
Может, действительно проще расположить все книги у них? Тогда и на сервере можно денег сэкономить.

Цитата(haker_fox @ Jul 18 2011, 11:23) *
Даже если такой ресурс и будет создан, все равно в сети будут библиотеки. Поэтому идея собрать все в одном месте, мягко говоря, нереальна.

Также книги, которые можно найти в сети, менее ценны, чем материалы с платных ресурсов. Как правило, проблемно достать материалы конференций, научные работы и т.п.

Встает вопрос актуальности при наличии таких ресурсов, как приведены выше....
Хотя есть два важных нюанса, которых, наверное нигде еще не реализовано:
- хочется сделать робота, который бы мониторил интернет и сети обмена файлами, большие локальные сети (например, Home-ix). Собирал все, что там появляется. потому как многие люди (наверное) сканируют книжки и они так и оседают на жестких дисках. у меня у самого так, я штук 10 книг отсканировал, которых реально нигде в сети нет, но сделал это для себя, не выкладывал никуда, потому что банально лень оформить странички с описанием. а робот бы сам мог заниматься оформлением и прочей рутиной. сервис сам себя наполняет.
- внести элементы социальной сети, принципы википедии и т.д. т.е. чтоб книги можно было обсуждать, критиковать и прочее. чтоб можно было любому редактировать описание, исправлять ошибки в самих книжках, писать дополнительные какие-то отзывы, рецензии, просто развивать мысли, вложенные в текст.

Не знаю, до конца еще не сформулировал все, что я хочу...

-------------

В общем, я сейчас в глубоких раздумьях, стоит ли затевать создание такого ресурса или не тратить на него времени.
Пока что я остановился на том, что доделаю простого робота-паука и примитивного автоматического каталога. Добавлю функцию выстваления рейстинга со стороны пользователей, чтоб выбирать наиболее качественный вариант из сканов одной и той же книги. А дальше буду думать, что с этим делать.

Если кому интересна эта тема, отписывайтесь, пожалуйста. Мне хочется выяснить, будет это востребовано или нет.
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- Archonmaster   Нужна ли централизованная библиотека технической литературы?   Jul 17 2011, 23:36
- - haker_fox   QUOTE (Archonmaster @ Jul 18 2011, 08:36)...   Jul 18 2011, 07:23
- - nikolascha   Цитата(Archonmaster @ Jul 18 2011, 02:36)...   Jul 18 2011, 12:18
|- - nikolascha   Цитата(Archonmaster @ Jul 18 2011, 18:52)...   Jul 18 2011, 16:55
- - Xenia   Книги по электронике и смежным дисциплинам надо со...   Jul 18 2011, 17:03
- - a777   Ваш FTP не является общедоступным. Особенно для но...   Oct 6 2011, 08:23
- - ukpyr   http://bookfi.org/ http://www.twirpx.com/files/ ht...   Oct 6 2011, 09:45
|- - Xenia   Цитата(ukpyr @ Oct 6 2011, 13:45) http://...   Oct 6 2011, 10:39
|- - kovigor   Цитата(Xenia @ Oct 6 2011, 13:39) И, тем ...   Oct 6 2011, 11:34
||- - Xenia   Цитата(kovigor @ Oct 6 2011, 15:34) Все т...   Oct 6 2011, 11:52
||- - kovigor   Цитата(Xenia @ Oct 6 2011, 14:52) Доступ ...   Oct 6 2011, 12:01
||- - Xenia   Цитата(kovigor @ Oct 6 2011, 16:01) Напис...   Oct 6 2011, 12:54
||- - kovigor   Цитата(Xenia @ Oct 6 2011, 15:54) Решение...   Oct 6 2011, 12:58
|- - СветLANa   Цитата(Xenia @ Oct 6 2011, 17:39) ...Дело...   Oct 7 2011, 03:24
- - Anga   Цитата(Archonmaster @ Jul 18 2011, 03:36)...   Oct 6 2011, 16:15
- - AndrewN   QUOTE (Archonmaster @ Jul 18 2011, 03:36)...   Oct 12 2011, 18:22


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 29th July 2025 - 06:54
Рейтинг@Mail.ru


Страница сгенерированна за 0.01378 секунд с 7
ELECTRONIX ©2004-2016