реклама на сайте
подробности

 
 
 
Reply to this topicStart new topic
> DJVU 2 WORD
Obi
сообщение May 25 2006, 17:50
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 262
Регистрация: 18-12-05
Из: Perth, WA
Пользователь №: 12 375



Подскажите пожалуйста программку для преобразования отсканированного текста (формат DJVU) в обычный wordовсий формат. Что-то типа проги pdf2word или pdf2html.
Заранее спасибо!


--------------------
"We choose to go to the moon in this decade and do the other things, not because they are easy, but because they are hard,"
- John F. Kennedy in September 1962.
Go to the top of the page
 
+Quote Post
Alex11
сообщение May 25 2006, 18:24
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 2 106
Регистрация: 23-10-04
Из: С-Петербург
Пользователь №: 965



Как я понимаю, столько не живут. Тут может быть только последовательный перевод в картинку, а затем распознавалкой типа FineReader'а в текст.
Go to the top of the page
 
+Quote Post
kst
сообщение May 26 2006, 07:49
Сообщение #3


Частый гость
**

Группа: Свой
Сообщений: 141
Регистрация: 16-06-05
Из: Нижний Новгород
Пользователь №: 6 065



Поддерживаю.
Я распечатываю DJVU в формат pdf на виртуальном принтере pdfFactory. Затем получившийся pdf-ник открываю в FineReader. Лучшего способа не знаю.
Go to the top of the page
 
+Quote Post
msn
сообщение May 26 2006, 22:11
Сообщение #4


Частый гость
**

Группа: Свой
Сообщений: 126
Регистрация: 1-01-06
Из: Украина, Киев
Пользователь №: 12 759



В FineReader 8 есть небольшая утилита для захвата текста прямо с экрана Screenshot Reader, очень удобно, если нужно оперативно распознавать не большой объем. Выделил прямо на экране кусок из отсканированной книги и через 2-3 секунды распознанный текст уже в буфере / word / …
Go to the top of the page
 
+Quote Post
kst
сообщение Jun 5 2006, 12:44
Сообщение #5


Частый гость
**

Группа: Свой
Сообщений: 141
Регистрация: 16-06-05
Из: Нижний Новгород
Пользователь №: 6 065



Цитата(msn @ May 27 2006, 02:11) *
В FineReader 8 есть небольшая утилита для захвата текста прямо с экрана Screenshot Reader, очень удобно, если нужно оперативно распознавать не большой объем. Выделил прямо на экране кусок из отсканированной книги и через 2-3 секунды распознанный текст уже в буфере / word / …
Оказывается похожую штуку можно провернуть и в FineRider 7. Нажимаем Alt+PrintScreen (или просто PrintScreen) открываем FineRider, Ctrl+V. Распознаем вставленную картинку.
Go to the top of the page
 
+Quote Post
Alexandr
сообщение Jun 5 2006, 13:12
Сообщение #6


Знающий
****

Группа: Модераторы
Сообщений: 804
Регистрация: 1-12-04
Пользователь №: 1 283



На самом деле все зависит от того кто этот DJVU жал. Формат DJVU позволяет добавлять распознанный текст, который также как в PDF - файлах можно выделить и скопировать. Однако возни при создании такого DJVU файла много. Поэтому я всего несколько штук таких встречал.


--------------------
Иван Сусанин - первый полупроводник
Go to the top of the page
 
+Quote Post
Thistle
сообщение Jun 5 2006, 17:39
Сообщение #7


Частый гость
**

Группа: Участник
Сообщений: 99
Регистрация: 29-11-05
Пользователь №: 11 563



Действительно, ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет....(да и вообще возможности формата ДеЖавю зачастую ооочень нерационально используются).... а проще всего дежавюку в текст перевести imho следующим образом : 1.ищем в сети прогу(есть очнь хорошая весч от молдавских, вроде, камрадов) ктороая переводит дежавюку в картинку(Jpeg, tiff, многостраничный tiff)
2. грузим соотв. файлы в файнридер и жмём распознать....
3. сохраняем результат....

инджой...

ЗЫ не забывайте про гугль
Go to the top of the page
 
+Quote Post
Neznayka
сообщение Jun 7 2006, 07:28
Сообщение #8


Знающий
****

Группа: Свой
Сообщений: 719
Регистрация: 14-07-05
Из: Москва
Пользователь №: 6 787



Уважаемый LordN на своем сайте предлагает нескоько программок для работы с DJVU-форматом http://lord-n.narod.ru/plugin.html


--------------------
Go to the top of the page
 
+Quote Post
Vanёk
сообщение Jun 7 2006, 18:24
Сообщение #9


Частый гость
**

Группа: Свой
Сообщений: 94
Регистрация: 14-03-06
Из: Russia, Vidnoe
Пользователь №: 15 249



Цитата(Thistle @ Jun 5 2006, 21:39) *
Действительно, ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет....(да и вообще возможности формата ДеЖавю зачастую ооочень нерационально используются)....

А не могли бы вы подсказать, как при переводе в DJVU можно создать этот текстовый слой? В DjvuSolo есть такая возможность? smile3046.gif


--------------------
Puro delirio, una chochez verdadera.
Go to the top of the page
 
+Quote Post
LordN
сообщение Jun 7 2006, 19:17
Сообщение #10


Знающий
****

Группа: Свой
Сообщений: 704
Регистрация: 15-10-05
Из: г.Томск
Пользователь №: 9 686



Цитата
А не могли бы вы подсказать, как при переводе в DJVU можно создать этот текстовый слой

надо найти дежавю-мэйкер с OCR.
раньше тут http://www.scan-elib.narod.ru/djvu/ (это вообще самая большая подборка в русской сети халявных ссылок на проги для дежавюшек) был Document Express Enterprise with DjVu v5.1 build 946 (with Asian OCR) я им OCR в дежавю вставляю.


--------------------
C уважением, LordN.
Go to the top of the page
 
+Quote Post
TsAN
сообщение Jun 24 2006, 09:02
Сообщение #11


Частый гость
**

Группа: Свой
Сообщений: 129
Регистрация: 15-07-05
Пользователь №: 6 828



Vanёk, вот здесь есть небольшое описание (pdf) про то, как сделать хорошую элетронную книгу. Расписаны все этапы: начиная со сканирования и заканчивая внедрением текстового слоя и сбором содержания. А вот тут - IMHO, тот же самый материал в формате doc.
Цитата(Thistle @ Jun 5 2006, 21:39) *
ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет
Ну, судя, скажем, по зеркалу на хоумлинуксе, этого не скажешь. Хотя в отношении технической литературы Вы, к сожалению, правы: методики качественного изготовления электронных книг в И-нете находятся без особых проблем, однако IMHO, далеко не все создаваемую эл. книгу доводят до хорошего качества.

Удачи!
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 17th June 2025 - 18:47
Рейтинг@Mail.ru


Страница сгенерированна за 0.01426 секунд с 7
ELECTRONIX ©2004-2016