forum.rastrnet.ru

forum.rastrnet.ru (http://forum.rastrnet.ru/index.php)
-   Техническая библиотека (http://forum.rastrnet.ru/forumdisplay.php?f=105)
-   -   Оцифровка книжки... (http://forum.rastrnet.ru/showthread.php?t=22052)

snoopy 16.09.2006 12:09

Цитата:

Сообщение от Track (Сообщение 334433)
А Acrobat, что из себя представляет?

Adobe Acrobat, читалка .pdf`ов, только намного дольше грузица чем тот же Foxit PDF reader.

GreeN 16.09.2006 12:11

Цитата:

Сообщение от SnoopY (Сообщение 334497)
Adobe Acrobat, читалка .pdf`ов, только намного дольше грузица чем тот же Foxit PDF reader.

не только, есть и full версии :)...

Paul 16.09.2006 15:17

Track, ответьте наконец, В КАКОМ ВИДЕ У ВАС КНИЖКА? В бумажном или в электронном (оригинал)? Что она из себя представляет - чисто текст, как женский роман, или техническая какая книжка - куча графиков, картинок, закарючек-интегралов, листингов и т.п.
Вот, если бумажная техническая - djvu без вопросов. Если бумажная художественная - doc или txt. Если ж в оригинале присутвует (сами, например, писали) - pdf. Все остально - не эффективно, либо затратно.
Отнеситесь к этому вопросу серьезно. PDF-книжки в 50 мегоф ужо достали, и не меня одного. Это ж дело с рапиды потом хрен выкачаешь. По рукам таким бить нужно. Ламерюги слюнявые...
К тому ж у djvu есть ещё кууча приимушеств. Вот, к примеру, если pdf-ку чуток не докачать, т.е. без окончания - хрен прочтешь, усе читалки будут ругаться и все. А djvu-шка - да хоть пару кило, самое начало - и смотри наздоровье заголовок (оценивай качество, да мало ли чего). Можно вообще разбить на страницы и выложить в еноте для прочтения. Про размер уж и не говорю - 7 мегоф на книжку, приятно ж??

Вот здесь:
*9/incoming/book/doc/php/Дмитрий_Котеров
Есть три варианта книжки.
То что хотите Вы - это Д.Котеров РНР4 scan.pdf (43М). Скачайте, посмотрите, что это за убожество. Криво, да?? Прошу, так не надо.
То, о чем Вы мечтаете - Samouchitel.PHP4.pdf (4,3М). Круто конечно, не не реально. Это нужно ПОЛНОСТЬЮ ПРЕВЕРСТАТЬ книгу. Сможите? Сможите?? Я побоялся (я ж трус, так ведь, дорогая?? Или ж просто реально оцениваю ситуацию??).
И оптимальный вариант - PHP4 scan.djvu (5,3М). Смотриться в разы лучше превого, а размер, вообщем считайте сами...

А вот пример оригинала (это ужо другая книжка). Красота. Ммм, хотя может это книжка такая вкусая...

P.S. Решитись на djvu - обязательно сканте в ч/б (к тому ж коретка будет ездить куда резвее. Вшик-вшик, а не вшиииик-вшик.). Оттенки серого - тоже творения криворуких. Почти любая книжка это позволяет (есть исключения, но оочень редко, цветная книга - это ж скока бабла нужно).

Track 16.09.2006 16:14

Цитата:

Сообщение от Pavel L (Сообщение 334615)
Track, ответьте наконец, В КАКОМ ВИДЕ У ВАС КНИЖКА? В бумажном или в электронном (оригинал)? Что она из себя представляет - чисто текст, как женский роман, или техническая какая книжка - куча графиков, картинок, закарючек-интегралов, листингов и т.п...

Бумажная, техническая... :) ftp://ftp2.rastr.net.ru/incoming/Soft/ПО для мультимедиа/По для видеокамеры/Мануал по Премьеру/Глава 1.rar
Будем осваивать djvu!

Paul 16.09.2006 18:33

Ну, тогды я ужо все писал. Про ч/б - хз, посмотрите как получаеться. Иногда у сканера нелода - придеться конвертить в проге. Я про серые картинки.


*9/incoming/Soft/Графика/DJVU
Там есть две статейки - они были моей отправной точкой. Все верно, вроде, кроме обрезки - я её делал в FineReader 8. СканКромсатор чет пробовал - хз. Ещё там куча софта. Нужен он, или нет - хз. Просто про него можно встретить упоминание.
Карочь, самое главное и самое сложное - это отсканить.
Кодю исключилельно Djvu Solo 3.1 - самый маленький размер именно с ним. Но тифы сразу от FineReader он не переваривает. Их нужно пересохранить в IrfanView, там есть пакетная обработка.
Кароче, мыслей на дисертацию хватит.

Paul 16.09.2006 18:56

Цитата:

Сообщение от Track (Сообщение 334651)
*Мануал по Премьеру/Глава 1.rar

В смысле? Ужо отсканено?? Думаю смотреть нужно стр. 19. В таких книжках пади много картинок. Может пирдеться 8бит оставлять. Шас попробую в ч/б перевести.

Там же, в той же папке, лежит это первая глава в djvu. Размер - 1,3М вместо 250М. Но есть и минусы - картинки размазаны, слегка. Посмотрите. Вообщем то терпимо.
По идеи я сначало хотел порекомендовать выбрать страницы без картинок и перегнать их в ч/б. Но это поспешно, это не книга, а журнал какой то. Мда, не ожидал. Что ж, оставляйте в 8 бит.
Задачи такие - отсканить, обрезать. К тому ж у Вас ещё и странички перепутаны (стр. 17). Мда-с, а так ничего. Очень порадовало, что в tiff. Молодец. А тож бывают индивиды-любители jpeg. Затем следует обрезать. Дело это можно провернуть в FineReader 8. Но тогда пракричски ручной труд. Да нет, там лишь рамку наводить, и все. Есть автоматические тулзы, правда я ими пользовался мало, хоть и пытался. Книжка достаточно чистая, должно прокатить. Попробуйте BookRestorator. Там головняк будет с полями. Есть ещё ScanCromsator. Тык его я лишь раз запускал - руки не доходят. Я бы посоветовал FineReader, не так уж это долго выходит (меньше, чем сканить, определенно).
Обрезать - значит сделать поля справа и слева равными, пару милиметров. Как это выглядит - смотрите Угрюмова, это воистину произведение исскуства.
Вот, и затем останеться лишь закодить. Фичи - OCR или там закладки - позже, да и то вряд ли надо.

Track 18.09.2006 22:28

Подведем итоги...
Мануал по оцифровке "бумажных" книг выложенный на 9-ке - это для общего развития...
Прядок действий такой:
В FineReader 8 создаем пакетный файл и сканируем книжку полностью. Если просто текст - формат черно-белый, если есть много иллюстраций, то "серый". разрешение 300. Затем Файл - Сохранить результаты - Сохранить изображения. В настройках выбираем формат tiff сжатие ZIP, ставим галочки в полях "все страницы" и "Сохранить в один файл".
Далее делаем обрезку: Изображение - обрезать изображение. Появившееся окно растягиваем на весь экран, в раскрывающемся списке выбираем "по высоте", корректируем рамку, ставим галочку в поле "перейти к следующей странице" и жмем "обрезать". На последующих страницах делаем только перемещение рамки (не изменяя её размеры).
Затем в отдельной папке сохраняем результаты отдельными файлами в tiff «серый» сжатие ZIP, ставим галочку в поле "все страницы". Можно сделать резервную копию на болванке.
Цитата:

Сообщение от Pavel L
Следующий этап – пересохранение в IrfanFiew (*9/incoming/Soft/Графика/IrfanFiew 3.98.rar).
В ней File - Batch Convers... Тут нужо добавить в очередь все тифы. Очередь - это колонка с боку. Внизу выбрать TIFF, нажать OPTIONS, появиться выбор – выбираем сжатие LZW.
Остальное лучше не трогать.
Жмем СТАРТ.
P.S. LZW - ибо другого djvu solo не хочеть понимать.
Последняя нужная прога здесь: *9/incoming/Soft/Графика/DJVU/DjVu Solo 3.1.rar
Открываешь первый тифф, а затем:
Edit-Insert Page's After
В окошке выделяешь последний файл, а затем с зажатым шивтом второй (певый уже у тебя есть).
Затем "сейв аз", булдерен, тут
300 дпи
сканнед
ОК »

И получаем файл с расширением djvu.
Спасибо Pavel L ! Надеюсь, что твой опыт пригодится не только мне...

Paul 29.09.2006 23:01

заключение
 
Да, согласен, картинки плоховатенько смотряться. Но как я ужо упомянал - от книжки технической много не нужно - просмотреть и начинать набивать опыт. А тут вполне смысл понять можно. Так что качайте и вникайте.
*9/incoming/Soft/ПО для мультимедиа/По для видеокамеры/Мануал по Премьеру/Premiere 6.5.djvu

И ещё, забыли о чем договаривались - книжки должны быть доступны. Проще всего закинуть на рапиду (а вот скачать с нее - кхе кхе):
http://rapidshare.de/files/34873576/...anovs.rar.html

Далее разместить на knizhek.net и natahaus.ru. Только что сделано - ждем их проверки - ссылки будут чуть позже.

P.S. Сам премьер мне не сильно интересен. Хотя есть одно дельцо - презинтацию сваять. PowerPoint - путь пройденый. Можно будет совместить приятное с неприятным - редактировать видео ещё не доводилось.

Paul 05.10.2006 09:19

ссылки
 
http://www.knizhek.net/2006/10/02/sa...emiere_65.html
http://www.natahaus.ru/2006/10/03/sa...emiere_65.html
Общий рейтинг - отлично (17 голосов!)

На natahaus народ уже выкладывает зеркала. А это значит, что убить её уже сложно. Она распространилась через миллионы серверов по всей планете - в обычные компьютеры офисов, гостиниц - всюду. Это книга в киберпространстве. И единого центра нет. Удалять нечего…


Текущее время: 23:02. Часовой пояс GMT +7.

Powered by vBulletin® Version 3.8.4 Patch Level 5
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd. Перевод: zCarot

Форум открыт в июле 2004 г.