|
Нужна ли централизованная библиотека технической литературы? |
|
|
|
Jul 17 2011, 23:36
|
Группа: Новичок
Сообщений: 3
Регистрация: 17-04-08
Из: Москва
Пользователь №: 36 825

|
Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов. И предоставить к ним бесплатный доступ любого желающего пользователя с одного сервера, чтоб не нужно было ждать по 10 минут перед скачиванием на всяких deposit'ах. Ради интереса попробовал тогда написать небольшой скрипт для поиска и выкачивания файлов в формате DJVU из пиринговых сетей. За 1 сутки работы скачалось более 10 000 книжек. Посмотрел на эту перемешанную кашу и задвинул идею на полку.
Сейчас вот возникла идея создания автоматизированного каталогизатора найденных книжек. Чтоб умная программа сама узнавала, какая книжка находится в файле, собирала в интернете информацию об издании (автор, аннотация, обложка и т.д.). И создать самостоятельно наполняющуюся базу данных.
Технически такая задача реализуема. ---------------------------
Функции:
1) все книги находятся на одном сервере и скачать их можно бесплатно и без ожидания времени 2) книги автоматически отыскиваются в интернете, в других библиотеках, в пиринговых сетях (едонки, торрентс, и т.д.) и сохраняются на централизованный сервер 3) автоматически создается описание книги с названием, автором, аннотацией, обложкой (без необходимости ручного ввода или модерации) 4) книга автоматически заносится в рубрикатор 5) есть возможность поиска по тексту в книгах (как на books.google.com) 6) пользователи могут самостоятельно добавить в библиотеку отсканированные ими книги.
---------------------------
А вот с практической точки зрения будет интересен такой ресурс? Или достаточно тех источников, что уже есть в сети?
|
|
|
|
|
Jul 18 2011, 07:23
|

Познающий...
     
Группа: Свой
Сообщений: 2 963
Регистрация: 1-09-05
Из: г. Иркутск
Пользователь №: 8 125

|
QUOTE (Archonmaster @ Jul 18 2011, 08:36)  А вот с практической точки зрения будет интересен такой ресурс? С юридической точки зрения это незаконно. Нельзя копировать книги. Даже если такой ресурс и будет создан, все равно в сети будут библиотеки. Поэтому идея собрать все в одном месте, мягко говоря, нереальна. Также книги, которые можно найти в сети, менее ценны, чем материалы с платных ресурсов. Как правило, проблемно достать материалы конференций, научные работы и т.п.
--------------------
Выбор.
|
|
|
|
|
Jul 18 2011, 12:18
|
Местный
  
Группа: Свой
Сообщений: 376
Регистрация: 20-06-09
Из: BY
Пользователь №: 50 480

|
Цитата(Archonmaster @ Jul 18 2011, 02:36)  Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов. И предоставить к ним бесплатный доступ любого желающего пользователя с одного сервера... Вы не одиноки... в сети уже есть подобный проект - gen.lib.rus.ec. Присоединяйтесь к нему...
|
|
|
|
|
Jul 18 2011, 15:52
|
Группа: Новичок
Сообщений: 3
Регистрация: 17-04-08
Из: Москва
Пользователь №: 36 825

|
Цитата(nikolascha @ Jul 18 2011, 16:18)  Вы не одиноки... в сети уже есть подобный проект - gen.lib.rus.ec. Присоединяйтесь к нему... Да. Очень интересный ресурс, спасибо за ссылку. Вроде как даже там можно через FTP все скачать. Вот еще один нашел http://reslib.com . На сколько я понял, там представлена вся коллекция мехматовской библиотеки. Цитата(haker_fox @ Jul 18 2011, 11:23)  С юридической точки зрения это незаконно. Нельзя копировать книги. С юридической стороны я не рассматривал этот вопрос вообще. Пока что имеется только техническая идея. Даже не воплощенная в жизнь целиком, лишь отдельными кусками. Во-первых, не разбираюсь в юр. делах. Во-вторых, мне интересно реализовать сервис с технической точки зрения - люблю решать сложные задачки. В-третьих, хочется создать ресурс прежде всего для себя. И если кто-то со стороны правоохранительных органов будет прессовать, то тогда придется закрыть все для публики, но для себя и знакомых хороший инструмент останется (я так понял, с мехматом произошло что-то подобное). Если есть идеи, как можно избежать подобных сложностей, то расскажите, пожалуйста. Сразу на ум приходит rutracker.org, когда будучи еще torrents.ru его хотели прикрыть. Но как прикопаться? ведь на сайте лежат лишь ссылки на файлы, которые хранятся бог знает у кого на компьютере. Конечно не хотелось бы располагать все в пиринговой сети, а собрать все реально на одном (или группе) носителе. Вариант расположить все на зарубежных серваках, где-нибудь в африке (?), а доменное имя зарегать буржуйское, чтоб его не забанили. Но, скажем, вконтакте вообще как-то не парится с хранением, скажем, фильмов. Пока не читал инфу про то, как им это удается. Может, действительно проще расположить все книги у них? Тогда и на сервере можно денег сэкономить. Цитата(haker_fox @ Jul 18 2011, 11:23)  Даже если такой ресурс и будет создан, все равно в сети будут библиотеки. Поэтому идея собрать все в одном месте, мягко говоря, нереальна.
Также книги, которые можно найти в сети, менее ценны, чем материалы с платных ресурсов. Как правило, проблемно достать материалы конференций, научные работы и т.п. Встает вопрос актуальности при наличии таких ресурсов, как приведены выше.... Хотя есть два важных нюанса, которых, наверное нигде еще не реализовано: - хочется сделать робота, который бы мониторил интернет и сети обмена файлами, большие локальные сети (например, Home-ix). Собирал все, что там появляется. потому как многие люди (наверное) сканируют книжки и они так и оседают на жестких дисках. у меня у самого так, я штук 10 книг отсканировал, которых реально нигде в сети нет, но сделал это для себя, не выкладывал никуда, потому что банально лень оформить странички с описанием. а робот бы сам мог заниматься оформлением и прочей рутиной. сервис сам себя наполняет. - внести элементы социальной сети, принципы википедии и т.д. т.е. чтоб книги можно было обсуждать, критиковать и прочее. чтоб можно было любому редактировать описание, исправлять ошибки в самих книжках, писать дополнительные какие-то отзывы, рецензии, просто развивать мысли, вложенные в текст. Не знаю, до конца еще не сформулировал все, что я хочу... ------------- В общем, я сейчас в глубоких раздумьях, стоит ли затевать создание такого ресурса или не тратить на него времени. Пока что я остановился на том, что доделаю простого робота-паука и примитивного автоматического каталога. Добавлю функцию выстваления рейстинга со стороны пользователей, чтоб выбирать наиболее качественный вариант из сканов одной и той же книги. А дальше буду думать, что с этим делать. Если кому интересна эта тема, отписывайтесь, пожалуйста. Мне хочется выяснить, будет это востребовано или нет.
|
|
|
|
|
Jul 18 2011, 16:55
|
Местный
  
Группа: Свой
Сообщений: 376
Регистрация: 20-06-09
Из: BY
Пользователь №: 50 480

|
Цитата(Archonmaster @ Jul 18 2011, 18:52)  у меня у самого так, я штук 10 книг отсканировал, которых реально нигде в сети нет... Что ж вы так... нужно залить это дело для сообщества на gen.lib.rus.ec Цитата(Archonmaster) Не знаю, до конца еще не сформулировал все, что я хочу... ------------- В общем, я сейчас в глубоких раздумьях, стоит ли затевать создание такого ресурса или не тратить на него времени. Пока что я остановился на том, что доделаю простого робота-паука и примитивного автоматического каталога. Добавлю функцию выстваления рейстинга со стороны пользователей, чтоб выбирать наиболее качественный вариант из сканов одной и той же книги. А дальше буду думать, что с этим делать. Обсудите свои планы на форуме с тамошними библиотекарями... Может лучше объединить свои усилия с ними... Думаю, они уже накопили какой-то опыт в библиотечном деле..
|
|
|
|
|
Oct 6 2011, 08:23
|
Группа: Участник
Сообщений: 13
Регистрация: 19-02-05
Пользователь №: 2 759

|
Ваш FTP не является общедоступным. Особенно для новичков, которым эти книги собственно и нужны.
Сообщение отредактировал a777 - Oct 6 2011, 08:25
|
|
|
|
|
Oct 6 2011, 10:39
|

Гуру
     
Группа: Модератор FTP
Сообщений: 4 479
Регистрация: 20-02-08
Из: Москва
Пользователь №: 35 237

|
Цитата(ukpyr @ Oct 6 2011, 13:45)  Большущее вам спасибо за ссылки! И, тем не менее, остаюсь во мнении, что собственная библиотека на ftp нам нужна и следует предпринимать усилия по ее пополнению. Дело в том, что книги в электронных библиотеках очень плохо систематизированы по тематике, т.е. либо вообще никак не сгруппированы или сгруппированы на слишком крупные разделы, где все книги по электронике навалены в одну кучу. В этом смысле электронные библиотеки напоминают Google тем, что требуют сформировать запрос, достаточный для поиска книги по автору и/или названию. Тогда как большинство практических потребностей читателей сводится к тому, чтобы узнать, что имеется в библиотеке по интересующей их достаточно узкой тематике, не имея представления ни об авторах, ни о названии нужных им книг. Попробуйте для примера найти в электронных библиотеках книги про ARM - и вас с головой завалит всякой ерундой про армию  . Опять же законы о пиратстве ужесточаются с каждым днем. В этой связи нет никакой уверенности в том, что, однажды проснувшись, мы не обнаружим, что все эти библиотеки общего пользования в одночасье исчезли. И, наконец, мне просто жалко отступать после того, как сама затратила огромные усилия по систематизации и пополнению нашей ftp-библиотеки, увеличив ее размер почти в 2 раза.
|
|
|
|
|
Oct 6 2011, 16:15
|
Местный
  
Группа: Свой
Сообщений: 342
Регистрация: 21-12-04
Из: Мытищи
Пользователь №: 1 598

|
Цитата(Archonmaster @ Jul 18 2011, 03:36)  Как-то давным давно зародилась у меня идея взять да и собрать из интернета все существующие сканы книжек в одном месте, чтоб не нужно было лазить по поисковикам и куче сайтов.
Сейчас вот возникла идея создания автоматизированного каталогизатора найденных книжек. Чтоб умная программа сама узнавала, какая книжка находится в файле, собирала в интернете информацию об издании (автор, аннотация, обложка и т.д.). И создать самостоятельно наполняющуюся базу данных. Очень поддерживаю. Я думаю у большинства людей, серьезно относящихся к своей профессии, рано или поздно возникает желание соорудить библиотеку нужных (или не очень  ) книг. Она быстро разрастается - начинаешь качать сотнями мегабайт. Значит нужно иметь базу данных по книгам и пополнять ее. Поэтому такой автоматизированный каталогизатор очень нужен! И поисковый робот тоже нужен. Так что, все три цели поддерживаю: и библиотеку, и автоматический каталогизатор, и поисковый робот
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|