реклама на сайте
подробности

 
 
2 страниц V   1 2 >  
Reply to this topicStart new topic
> Нужна ли централизованная библиотека технической литературы?
Archonmaster
сообщение Jul 17 2011, 23:36
Сообщение #1





Группа: Новичок
Сообщений: 3
Регистрация: 17-04-08
Из: Москва
Пользователь №: 36 825



Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов. И предоставить к ним бесплатный доступ любого желающего пользователя с одного сервера, чтоб не нужно было ждать по 10 минут перед скачиванием на всяких deposit'ах.
Ради интереса попробовал тогда написать небольшой скрипт для поиска и выкачивания файлов в формате DJVU из пиринговых сетей. За 1 сутки работы скачалось более 10 000 книжек. Посмотрел на эту перемешанную кашу и задвинул идею на полку.

Сейчас вот возникла идея создания автоматизированного каталогизатора найденных книжек. Чтоб умная программа сама узнавала, какая книжка находится в файле, собирала в интернете информацию об издании (автор, аннотация, обложка и т.д.). И создать самостоятельно наполняющуюся базу данных.

Технически такая задача реализуема.
---------------------------

Функции:

1) все книги находятся на одном сервере и скачать их можно бесплатно и без ожидания времени
2) книги автоматически отыскиваются в интернете, в других библиотеках, в пиринговых сетях (едонки, торрентс, и т.д.) и сохраняются на централизованный сервер
3) автоматически создается описание книги с названием, автором, аннотацией, обложкой (без необходимости ручного ввода или модерации)
4) книга автоматически заносится в рубрикатор
5) есть возможность поиска по тексту в книгах (как на books.google.com)
6) пользователи могут самостоятельно добавить в библиотеку отсканированные ими книги.

---------------------------

А вот с практической точки зрения будет интересен такой ресурс?
Или достаточно тех источников, что уже есть в сети?
Go to the top of the page
 
+Quote Post
haker_fox
сообщение Jul 18 2011, 07:23
Сообщение #2


Познающий...
******

Группа: Свой
Сообщений: 2 963
Регистрация: 1-09-05
Из: г. Иркутск
Пользователь №: 8 125



QUOTE (Archonmaster @ Jul 18 2011, 08:36) *
А вот с практической точки зрения будет интересен такой ресурс?

С юридической точки зрения это незаконно. Нельзя копировать книги.

Даже если такой ресурс и будет создан, все равно в сети будут библиотеки. Поэтому идея собрать все в одном месте, мягко говоря, нереальна.

Также книги, которые можно найти в сети, менее ценны, чем материалы с платных ресурсов. Как правило, проблемно достать материалы конференций, научные работы и т.п.


--------------------
Выбор.
Go to the top of the page
 
+Quote Post
nikolascha
сообщение Jul 18 2011, 12:18
Сообщение #3


Местный
***

Группа: Свой
Сообщений: 376
Регистрация: 20-06-09
Из: BY
Пользователь №: 50 480



Цитата(Archonmaster @ Jul 18 2011, 02:36) *
Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов. И предоставить к ним бесплатный доступ любого желающего пользователя с одного сервера...
Вы не одиноки... в сети уже есть подобный проект - gen.lib.rus.ec. Присоединяйтесь к нему...
Go to the top of the page
 
+Quote Post
Archonmaster
сообщение Jul 18 2011, 15:52
Сообщение #4





Группа: Новичок
Сообщений: 3
Регистрация: 17-04-08
Из: Москва
Пользователь №: 36 825



Цитата(nikolascha @ Jul 18 2011, 16:18) *
Вы не одиноки... в сети уже есть подобный проект - gen.lib.rus.ec. Присоединяйтесь к нему...

Да. Очень интересный ресурс, спасибо за ссылку. Вроде как даже там можно через FTP все скачать.
Вот еще один нашел http://reslib.com . На сколько я понял, там представлена вся коллекция мехматовской библиотеки.

Цитата(haker_fox @ Jul 18 2011, 11:23) *
С юридической точки зрения это незаконно. Нельзя копировать книги.

С юридической стороны я не рассматривал этот вопрос вообще. Пока что имеется только техническая идея. Даже не воплощенная в жизнь целиком, лишь отдельными кусками.
Во-первых, не разбираюсь в юр. делах. Во-вторых, мне интересно реализовать сервис с технической точки зрения - люблю решать сложные задачки. В-третьих, хочется создать ресурс прежде всего для себя. И если кто-то со стороны правоохранительных органов будет прессовать, то тогда придется закрыть все для публики, но для себя и знакомых хороший инструмент останется (я так понял, с мехматом произошло что-то подобное).

Если есть идеи, как можно избежать подобных сложностей, то расскажите, пожалуйста.
Сразу на ум приходит rutracker.org, когда будучи еще torrents.ru его хотели прикрыть. Но как прикопаться? ведь на сайте лежат лишь ссылки на файлы, которые хранятся бог знает у кого на компьютере. Конечно не хотелось бы располагать все в пиринговой сети, а собрать все реально на одном (или группе) носителе.

Вариант расположить все на зарубежных серваках, где-нибудь в африке (?), а доменное имя зарегать буржуйское, чтоб его не забанили.

Но, скажем, вконтакте вообще как-то не парится с хранением, скажем, фильмов. Пока не читал инфу про то, как им это удается.
Может, действительно проще расположить все книги у них? Тогда и на сервере можно денег сэкономить.

Цитата(haker_fox @ Jul 18 2011, 11:23) *
Даже если такой ресурс и будет создан, все равно в сети будут библиотеки. Поэтому идея собрать все в одном месте, мягко говоря, нереальна.

Также книги, которые можно найти в сети, менее ценны, чем материалы с платных ресурсов. Как правило, проблемно достать материалы конференций, научные работы и т.п.

Встает вопрос актуальности при наличии таких ресурсов, как приведены выше....
Хотя есть два важных нюанса, которых, наверное нигде еще не реализовано:
- хочется сделать робота, который бы мониторил интернет и сети обмена файлами, большие локальные сети (например, Home-ix). Собирал все, что там появляется. потому как многие люди (наверное) сканируют книжки и они так и оседают на жестких дисках. у меня у самого так, я штук 10 книг отсканировал, которых реально нигде в сети нет, но сделал это для себя, не выкладывал никуда, потому что банально лень оформить странички с описанием. а робот бы сам мог заниматься оформлением и прочей рутиной. сервис сам себя наполняет.
- внести элементы социальной сети, принципы википедии и т.д. т.е. чтоб книги можно было обсуждать, критиковать и прочее. чтоб можно было любому редактировать описание, исправлять ошибки в самих книжках, писать дополнительные какие-то отзывы, рецензии, просто развивать мысли, вложенные в текст.

Не знаю, до конца еще не сформулировал все, что я хочу...

-------------

В общем, я сейчас в глубоких раздумьях, стоит ли затевать создание такого ресурса или не тратить на него времени.
Пока что я остановился на том, что доделаю простого робота-паука и примитивного автоматического каталога. Добавлю функцию выстваления рейстинга со стороны пользователей, чтоб выбирать наиболее качественный вариант из сканов одной и той же книги. А дальше буду думать, что с этим делать.

Если кому интересна эта тема, отписывайтесь, пожалуйста. Мне хочется выяснить, будет это востребовано или нет.
Go to the top of the page
 
+Quote Post
nikolascha
сообщение Jul 18 2011, 16:55
Сообщение #5


Местный
***

Группа: Свой
Сообщений: 376
Регистрация: 20-06-09
Из: BY
Пользователь №: 50 480



Цитата(Archonmaster @ Jul 18 2011, 18:52) *
у меня у самого так, я штук 10 книг отсканировал, которых реально нигде в сети нет...
Что ж вы так... нужно залить это дело для сообщества на gen.lib.rus.ec

Цитата(Archonmaster)
Не знаю, до конца еще не сформулировал все, что я хочу...
-------------
В общем, я сейчас в глубоких раздумьях, стоит ли затевать создание такого ресурса или не тратить на него времени.
Пока что я остановился на том, что доделаю простого робота-паука и примитивного автоматического каталога. Добавлю функцию выстваления рейстинга со стороны пользователей, чтоб выбирать наиболее качественный вариант из сканов одной и той же книги. А дальше буду думать, что с этим делать.
Обсудите свои планы на форуме с тамошними библиотекарями... Может лучше объединить свои усилия с ними... Думаю, они уже накопили какой-то опыт в библиотечном деле..
Go to the top of the page
 
+Quote Post
Xenia
сообщение Jul 18 2011, 17:03
Сообщение #6


Гуру
******

Группа: Модератор FTP
Сообщений: 4 479
Регистрация: 20-02-08
Из: Москва
Пользователь №: 35 237



Книги по электронике и смежным дисциплинам надо собирать на нашем FTP! sm.gif
Go to the top of the page
 
+Quote Post
a777
сообщение Oct 6 2011, 08:23
Сообщение #7





Группа: Участник
Сообщений: 13
Регистрация: 19-02-05
Пользователь №: 2 759



Ваш FTP не является общедоступным. Особенно для новичков, которым эти книги собственно и нужны.

Сообщение отредактировал a777 - Oct 6 2011, 08:25
Go to the top of the page
 
+Quote Post
ukpyr
сообщение Oct 6 2011, 09:45
Сообщение #8


Профессионал
*****

Группа: Участник
Сообщений: 1 264
Регистрация: 17-06-08
Из: бандустан
Пользователь №: 38 347



http://bookfi.org/
http://www.twirpx.com/files/
http://www.poiskknig.ru/index.html
http://publ.lib.ru/ARCHIVES/

Сообщение отредактировал ukpyr - Oct 6 2011, 12:07
Go to the top of the page
 
+Quote Post
Xenia
сообщение Oct 6 2011, 10:39
Сообщение #9


Гуру
******

Группа: Модератор FTP
Сообщений: 4 479
Регистрация: 20-02-08
Из: Москва
Пользователь №: 35 237



Цитата(ukpyr @ Oct 6 2011, 13:45) *

Большущее вам спасибо за ссылки!

И, тем не менее, остаюсь во мнении, что собственная библиотека на ftp нам нужна и следует предпринимать усилия по ее пополнению.
Дело в том, что книги в электронных библиотеках очень плохо систематизированы по тематике, т.е. либо вообще никак не сгруппированы или сгруппированы на слишком крупные разделы, где все книги по электронике навалены в одну кучу. В этом смысле электронные библиотеки напоминают Google тем, что требуют сформировать запрос, достаточный для поиска книги по автору и/или названию. Тогда как большинство практических потребностей читателей сводится к тому, чтобы узнать, что имеется в библиотеке по интересующей их достаточно узкой тематике, не имея представления ни об авторах, ни о названии нужных им книг. Попробуйте для примера найти в электронных библиотеках книги про ARM - и вас с головой завалит всякой ерундой про армию sm.gif.

Опять же законы о пиратстве ужесточаются с каждым днем. В этой связи нет никакой уверенности в том, что, однажды проснувшись, мы не обнаружим, что все эти библиотеки общего пользования в одночасье исчезли.

И, наконец, мне просто жалко отступать после того, как сама затратила огромные усилия по систематизации и пополнению нашей ftp-библиотеки, увеличив ее размер почти в 2 раза.
Go to the top of the page
 
+Quote Post
kovigor
сообщение Oct 6 2011, 11:34
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 5 273
Регистрация: 30-03-10
Пользователь №: 56 295



Цитата(Xenia @ Oct 6 2011, 13:39) *
И, тем не менее, остаюсь во мнении, что собственная библиотека на ftp нам нужна и следует предпринимать усилия по ее пополнению.


Все так, но вот как туда попасть, в эту FTP - библиотеку ? Ссылочку хотя бы увидеть ...
Go to the top of the page
 
+Quote Post
Xenia
сообщение Oct 6 2011, 11:52
Сообщение #11


Гуру
******

Группа: Модератор FTP
Сообщений: 4 479
Регистрация: 20-02-08
Из: Москва
Пользователь №: 35 237



Цитата(kovigor @ Oct 6 2011, 15:34) *
Все так, но вот как туда попасть, в эту FTP - библиотеку ? Ссылочку хотя бы увидеть ...

Доступ в библиотеку только для "своих" sm.gif. Но с вашим огромным послужным списком (741 пост) попасть в "свои" не проблема - только напишите заявку по форме, и вы там.
Go to the top of the page
 
+Quote Post
kovigor
сообщение Oct 6 2011, 12:01
Сообщение #12


Гуру
******

Группа: Свой
Сообщений: 5 273
Регистрация: 30-03-10
Пользователь №: 56 295



Цитата(Xenia @ Oct 6 2011, 14:52) *
Доступ в библиотеку только для "своих" sm.gif. Но с вашим огромным послужным списком попасть в "свои" не проблема - только напишите заявку по форме, и вы там.


Угу. "По лицу видать - не раз доской почета отмечался ... ". sm.gif

Написал. Жду вашего решения ...
Go to the top of the page
 
+Quote Post
Xenia
сообщение Oct 6 2011, 12:54
Сообщение #13


Гуру
******

Группа: Модератор FTP
Сообщений: 4 479
Регистрация: 20-02-08
Из: Москва
Пользователь №: 35 237



Цитата(kovigor @ Oct 6 2011, 16:01) *
Написал. Жду вашего решения ...

Решение будет не мое, а администратора. Будем надеяться на положительное решение. Я же при ftp что-то вроде библиотекаря, к членству в "своих" отношения не имеющая.
Go to the top of the page
 
+Quote Post
kovigor
сообщение Oct 6 2011, 12:58
Сообщение #14


Гуру
******

Группа: Свой
Сообщений: 5 273
Регистрация: 30-03-10
Пользователь №: 56 295



Цитата(Xenia @ Oct 6 2011, 15:54) *
Решение будет не мое, а администратора. Будем надеяться на положительное решение. Я же при ftp что-то вроде библиотекаря, к членству в "своих" отношения не имеющая.


Спасибо, буду ждать ...
Go to the top of the page
 
+Quote Post
Anga
сообщение Oct 6 2011, 16:15
Сообщение #15


Местный
***

Группа: Свой
Сообщений: 342
Регистрация: 21-12-04
Из: Мытищи
Пользователь №: 1 598



Цитата(Archonmaster @ Jul 18 2011, 03:36) *
Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов.

Сейчас вот возникла идея создания автоматизированного каталогизатора найденных книжек. Чтоб умная программа сама узнавала, какая книжка находится в файле, собирала в интернете информацию об издании (автор, аннотация, обложка и т.д.). И создать самостоятельно наполняющуюся базу данных.


Очень поддерживаю. Я думаю у большинства людей, серьезно относящихся к своей профессии, рано или поздно возникает желание соорудить библиотеку нужных (или не очень biggrin.gif ) книг. Она быстро разрастается - начинаешь качать сотнями мегабайт. Значит нужно иметь базу данных по книгам и пополнять ее. Поэтому такой автоматизированный каталогизатор очень нужен!

И поисковый робот тоже нужен.
Так что, все три цели поддерживаю: и библиотеку, и автоматический каталогизатор, и поисковый робот
Go to the top of the page
 
+Quote Post

2 страниц V   1 2 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 19th July 2025 - 21:39
Рейтинг@Mail.ru


Страница сгенерированна за 0.01537 секунд с 7
ELECTRONIX ©2004-2016