Страница 1 от 1

Как да се обработи налично издание в PDF преснимано с фотоапарат

Пуснато: 28 ноември 2014, 13:14
от p_stoychev
Здравейте
Въпроса донякъде е в заглавието Попаднах на преснимано копие на "Емил и детективите" на Ерих Кестнер но самото преснимане е калпаво - снимано е с фото апарат и страниците са огънати. Поради това не може да се разчете от Fine reader. Дава много грешки и като ли по-лесно е да се препише. Като капак всичко е обединено в един PDF файл.
Стойчев

Re: Как да се обработи налично издание в PDF преснимано с фотоапарат

Пуснато: 18 март 2016, 23:11
от maket
Обработката на книга, снимана с фотоапарат (а не сканирана) е голяма играчка. Може би от колегите тук, аз съм този с най-голям опит, затова мога да споделя:


Накратко за операциите по разчитането:
1. Всяка снимка в PDF-а съдържа по две страници, т.е. първо трябва да се извадят всички двойни страници от файла.
2. Всяка двойна страница се "нарязва" на две истински страници - лява и дясна, които ще се обработват по различен начин.
3. Лявата страница в общия случай има "кривини" от издуването на отворената страница и се налага те да се "свият", за да се получат що-годе прави редове. Отделно се налага и коригиране на перспективата, получена от снимането под ъгъл, различен от 90 градуса.
4. Дясната страница обикновено подлежи само на корекция на перспективата.
5. Често се налага и "изравняване" на контраста на изображенията, за да станат по-четими.

Останалото е както при обработката на сканирана книга: подреждаш страниците една след друга във Fine Reader и разпознаваш (OCR).


С оглед да допълня картинката, ще се опитам да опиша по-сериозните проблеми:
1. Дори да следваш описания метод и да си много добър с Photoshop-а, разчитането пак остава трудно и като цяло се налага ръчна проверка "дума по дума".
2. Голям проблем е липсата на добър фокус при снимането - на мен ми се е налагало да "набирам" на ръка цели страници!
3. Често са случва при снимането да се е изрязала някоя дума или цял ред от текста. Случвало ми се е да взимам изречения от руски превод (по-достъпни са) и да ги нагласям в книгата.
4. Закриване на част от началните думи на дясната страница от изкривяването на лявата страница.


Като цяло мога да посъветвам следното:
1. Ако имате достъп до скенер и компютър, никога не снимайте книга с фотоапарат.
2. Ако сте попаднали на вече снимана книга, преди да започнете по описания метод, първо проверете дали всички страници са налице, всички редове и думи ли се виждат, дали не се закриват някъде части от думите и т.н.
3. Ако не сте наясно как се работи с Photoshop или няма кой да ви научи: не се захващайте.
4. Страниците могат да бъдат "изгладени", но не и фокусирани наново: решете дали ви се занимава с набиране на текст от клавиатурата.
5. При обработката на книги, печатани отпреди ерата на компютърните издателски системи, имайте пред вид, че шрифтовете се разчитат по-трудно, а има и страници с по-блед печат, както и такива с размазан, поради прекалено намастиляване, печат.
6. Описания метод си заслужава труда ако книгата е малка (или е част от книга) или пък ако книгата е ценна за вас.

В никакъв случай не искам да ви обезкуражавам, но споделих опита си най-вече с идеята да се гледа с по-сериозно отношение към работата на хората, които разчитат книгите.

Re: Как да се обработи налично издание в PDF преснимано с фотоапарат

Пуснато: 19 март 2016, 00:13
от pechkov
maket написа:... и да си много добър с Photoshop-а, ...
Photoshop макар и много мощен инструмент за растерни изображения - изобщо не е най-подходящия за по-простички обработки, които не изискват работа със слоеве, бленди и прочие.

Разгледай как работи Scan Tailor, и напиши нови указания.

С поздрав,
pechkov

Re: Как да се обработи налично издание в PDF преснимано с фотоапарат

Пуснато: 19 март 2016, 11:32
от NomaD
За съжаление, постингът на maket може да послужи за указание как НЕ ТРЯБВА да се снима книга и как НЕ ТРЯБВА да се процедира с некачествени сканове.
Ако все пак някой има желание да снима с цифрова фотокамера и да обработва скановете, много по-полезни ще са му някои по-стари теми.

Съвети за "сканиране" с цифров фотоапарат

Обработка на сканирани изображения чрез Scan Tailor

Автоматизирано оконтрастяване на сканирани изображения

Качественото сканиране/снимане на страниците на книга е от изключително важно значение за безпроблемната по-нататъшна обработка. Сканове с фатално засягаща текста черна ивица при сгъвката, с пропуснати редове в началото или края на страницата, или с дефокусирано изображение практически не са използваеми за обработка, ако не се разполага под ръка с реалното книжно тяло за справка. Ако качеството на скановете е преобладаващо лошо, най-добре е изобщо да не се обработват и да се пристъпи към наистина качествено сканиране на книгата. Другото (особено попълване с лош превод от друг език) е слабо казано несериозно.