Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: DJVU 2 WORD
Форум разработчиков электроники ELECTRONIX.ru > Cистемный уровень проектирования > Документация
Obi
Подскажите пожалуйста программку для преобразования отсканированного текста (формат DJVU) в обычный wordовсий формат. Что-то типа проги pdf2word или pdf2html.
Заранее спасибо!
Alex11
Как я понимаю, столько не живут. Тут может быть только последовательный перевод в картинку, а затем распознавалкой типа FineReader'а в текст.
kst
Поддерживаю.
Я распечатываю DJVU в формат pdf на виртуальном принтере pdfFactory. Затем получившийся pdf-ник открываю в FineReader. Лучшего способа не знаю.
msn
В FineReader 8 есть небольшая утилита для захвата текста прямо с экрана Screenshot Reader, очень удобно, если нужно оперативно распознавать не большой объем. Выделил прямо на экране кусок из отсканированной книги и через 2-3 секунды распознанный текст уже в буфере / word / …
kst
Цитата(msn @ May 27 2006, 02:11) *
В FineReader 8 есть небольшая утилита для захвата текста прямо с экрана Screenshot Reader, очень удобно, если нужно оперативно распознавать не большой объем. Выделил прямо на экране кусок из отсканированной книги и через 2-3 секунды распознанный текст уже в буфере / word / …
Оказывается похожую штуку можно провернуть и в FineRider 7. Нажимаем Alt+PrintScreen (или просто PrintScreen) открываем FineRider, Ctrl+V. Распознаем вставленную картинку.
Alexandr
На самом деле все зависит от того кто этот DJVU жал. Формат DJVU позволяет добавлять распознанный текст, который также как в PDF - файлах можно выделить и скопировать. Однако возни при создании такого DJVU файла много. Поэтому я всего несколько штук таких встречал.
Thistle
Действительно, ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет....(да и вообще возможности формата ДеЖавю зачастую ооочень нерационально используются).... а проще всего дежавюку в текст перевести imho следующим образом : 1.ищем в сети прогу(есть очнь хорошая весч от молдавских, вроде, камрадов) ктороая переводит дежавюку в картинку(Jpeg, tiff, многостраничный tiff)
2. грузим соотв. файлы в файнридер и жмём распознать....
3. сохраняем результат....

инджой...

ЗЫ не забывайте про гугль
Neznayka
Уважаемый LordN на своем сайте предлагает нескоько программок для работы с DJVU-форматом http://lord-n.narod.ru/plugin.html
Vanёk
Цитата(Thistle @ Jun 5 2006, 21:39) *
Действительно, ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет....(да и вообще возможности формата ДеЖавю зачастую ооочень нерационально используются)....

А не могли бы вы подсказать, как при переводе в DJVU можно создать этот текстовый слой? В DjvuSolo есть такая возможность? smile3046.gif
LordN
Цитата
А не могли бы вы подсказать, как при переводе в DJVU можно создать этот текстовый слой

надо найти дежавю-мэйкер с OCR.
раньше тут http://www.scan-elib.narod.ru/djvu/ (это вообще самая большая подборка в русской сети халявных ссылок на проги для дежавюшек) был Document Express Enterprise with DjVu v5.1 build 946 (with Asian OCR) я им OCR в дежавю вставляю.
TsAN
Vanёk, вот здесь есть небольшое описание (pdf) про то, как сделать хорошую элетронную книгу. Расписаны все этапы: начиная со сканирования и заканчивая внедрением текстового слоя и сбором содержания. А вот тут - IMHO, тот же самый материал в формате doc.
Цитата(Thistle @ Jun 5 2006, 21:39) *
ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет
Ну, судя, скажем, по зеркалу на хоумлинуксе, этого не скажешь. Хотя в отношении технической литературы Вы, к сожалению, правы: методики качественного изготовления электронных книг в И-нете находятся без особых проблем, однако IMHO, далеко не все создаваемую эл. книгу доводят до хорошего качества.

Удачи!
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.