forum.rastrnet.ru

forum.rastrnet.ru (http://forum.rastrnet.ru/index.php)
-   Техническая библиотека (http://forum.rastrnet.ru/forumdisplay.php?f=105)
-   -   Оцифровка книжки... (http://forum.rastrnet.ru/showthread.php?t=22052)

Track 15.09.2006 22:55

Оцифровка книжки...
 
Хочу сделать электронный вариант книжки - самоучителя. желательно под Adobe Reader. Adobe Reader - это, как я понимаю, "читалка".
А вот, чем создавать файлы для него? И желательно ссылочку на то, как ей пользоваться...

Греттир 15.09.2006 23:03

Ридер это вовсе не читалка, а программа понимающая достаточно универсальный формат файла pdf. А файлы такого формата с обычного бумажного носителя - можно создавать а) методом простого сканирования - помещения отсканированной картинки в любую графическую программу (например Корел0 и последующим экспортом pdf файла; б) если книжка в электронном виде - то процесс сканирования отпадает, а pdf сейчас можно сделать практически из любой программы.

Track 15.09.2006 23:24

Попробовал в Photoshop создать файл pdf. Получилось.
Но... Отсканированная страница, как была картинкой, так и осталась картинкой. Желательно, все же текст иметь в виде текста. И как сохранить несколько десятков страниц в одном файле?

Маркшейдер 15.09.2006 23:32

Установи программу abbyFineReaderftp://ftp2.rastrnet.ru/incoming/Soft...0%F4%E8%EA%E0/.
  1. запусти ее
  2. там вверху будет несколько кнопок, можешь выбрать, сканировать или вставить рисунок.
  3. после этого нижми расспознать,
  4. и потом проверить
  5. ну а в конце у тебя будет текстовый файл.
Все!

Paul 15.09.2006 23:46

Не совсем понятно, какую такую книжку. Если у Вас имееться исходник, например в doc, то не соменно pdf. Для этого можно воспользоваться каким-нибудь pdf принтером.

Если исходника нет, будете сканировать-с, - то НЕСОМНЕННО djvu. Только он. Ибо:
- не надо распозновать и исправлять ошибки
- ни чего не исказиться
- размер в разы будет меньше (при разумном подходе)

В одно время я лично делал книжку в 500 страниц:
1) Берете FineReader, настраиваете это дело на ч/б скан, атомат через секун 5 - усе, только листайте (хотя мож у Вас на сканере есть кнопка, тогда извиняйте мудака)
2) В FineReader 8 есть фича - обрезка, вот ей КАЖДУЮ страницу режим.
3) Далее дообрезка этого дела в IrfanView (ибо после FireReader есть разница в пару пикселей)
4) Вот, теперь эти тифчики можно в djvu
5) Эти же тифчики в FireReader 7, распознаем-с
6) Распознаный проект с помощью Гентчу суем в djvu - вот он OCR
7) С помощью долгого мучения с регулярками и прочей шелухи возможно родить и содержание. Суем в djvu с помощью EmbedBookmarks.

Вот и все. Результат тут.

Ну, есть ещё один путь - сканить в FineReader (в нем нужно усе сканить, что потоком, удобно ж) и сохранить в pdf - так многие и делают, получаеться геморой под 50 мегоф, которой к тому ж и глючно просматриваеться.

Track 15.09.2006 23:46

Да, но в Word-е нет в сохранении формата pdf...

Греттир 15.09.2006 23:50

Есть не сохранение а экспорт смотри в меню файл внимательнее

Paul 15.09.2006 23:52

Цитата:

Сообщение от Track (Сообщение 334421)
Да, но в Word-е нет в сохранении формата pdf...

*9/incoming/Soft/Офисные пакеты/PDFprinter
Нужно поставить эти две штуки и у Вас будет PDF-принтер, очень таки удобный. В отличие от монстра Acrobat.

Track 16.09.2006 00:00

Цитата:

Сообщение от Греттир (Сообщение 334424)
Есть не сохранение а экспорт смотри в меню файл внимательнее

В Word-е, в меню файл, не вижу экспорта. Только "сохранить" и "сохранить как..."
Цитата:

Сообщение от Pavel L (Сообщение 334432)
.... В отличие от монстра Acrobat...

А Acrobat, что из себя представляет?

GreeN 16.09.2006 11:52

По моему Pavel L и так уже всё расжевал, но я так понял что кто то чего то недогоняет, да я признаться не всегда улавливал канву вопроса, потому пробегусь по верхам поновой :)
Берёшь книшку, сканишь прогой FineReader (и 7 и 8 на 9ке лежат), можешь сразу сохранять в .PDF, можешь заслать в распознавалку и перегнать в .DOC (но незабудь после этого сделать вычитку :) и исправить ошибки :)), как сделать .DJVU читай инструкцию Павла.
Если ты не сканишь, то уже говори из какого формата в какой ты собрался прегонять, как из .DOC получить .PDF Павел же описал один из вариантов.


Текущее время: 06:15. Часовой пояс GMT +7.

Powered by vBulletin® Version 3.8.4 Patch Level 5
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot

Форум открыт в июле 2004 г.