Как да се обработи налично издание в PDF преснимано с фотоапарат

За коригирането на текстове след сканиране

Как да се обработи налично издание в PDF преснимано с фотоапарат

Мнениеот p_stoychev » 28 ноември 2014, 13:14

Здравейте
Въпроса донякъде е в заглавието Попаднах на преснимано копие на "Емил и детективите" на Ерих Кестнер но самото преснимане е калпаво - снимано е с фото апарат и страниците са огънати. Поради това не може да се разчете от Fine reader. Дава много грешки и като ли по-лесно е да се препише. Като капак всичко е обединено в един PDF файл.
Стойчев
p_stoychev
 
Мнения: 3
Регистрация: 01 април 2010, 16:04

Re: Как да се обработи налично издание в PDF преснимано с фотоапарат

Мнениеот maket » 18 март 2016, 23:11

Обработката на книга, снимана с фотоапарат (а не сканирана) е голяма играчка. Може би от колегите тук, аз съм този с най-голям опит, затова мога да споделя:

Накратко за операциите по разчитането:
1. Всяка снимка в PDF-а съдържа по две страници, т.е. първо трябва да се извадят всички двойни страници от файла.
2. Всяка двойна страница се "нарязва" на две истински страници - лява и дясна, които ще се обработват по различен начин.
3. Лявата страница в общия случай има "кривини" от издуването на отворената страница и се налага те да се "свият", за да се получат що-годе прави редове. Отделно се налага и коригиране на перспективата, получена от снимането под ъгъл, различен от 90 градуса.
4. Дясната страница обикновено подлежи само на корекция на перспективата.
5. Често се налага и "изравняване" на контраста на изображенията, за да станат по-четими.

Останалото е както при обработката на сканирана книга: подреждаш страниците една след друга във Fine Reader и разпознаваш (OCR).

С оглед да допълня картинката, ще се опитам да опиша по-сериозните проблеми:
1. Дори да следваш описания метод и да си много добър с Photoshop-а, разчитането пак остава трудно и като цяло се налага ръчна проверка "дума по дума".
2. Голям проблем е липсата на добър фокус при снимането - на мен ми се е налагало да "набирам" на ръка цели страници!
3. Често са случва при снимането да се е изрязала някоя дума или цял ред от текста. Случвало ми се е да взимам изречения от руски превод (по-достъпни са) и да ги нагласям в книгата.
4. Закриване на част от началните думи на дясната страница от изкривяването на лявата страница.

Като цяло мога да посъветвам следното:
1. Ако имате достъп до скенер и компютър, никога не снимайте книга с фотоапарат.
2. Ако сте попаднали на вече снимана книга, преди да започнете по описания метод, първо проверете дали всички страници са налице, всички редове и думи ли се виждат, дали не се закриват някъде части от думите и т.н.
3. Ако не сте наясно как се работи с Photoshop или няма кой да ви научи: не се захващайте.
4. Страниците могат да бъдат "изгладени", но не и фокусирани наново: решете дали ви се занимава с набиране на текст от клавиатурата.
5. При обработката на книги, печатани отпреди ерата на компютърните издателски системи, имайте пред вид, че шрифтовете се разчитат по-трудно, а има и страници с по-блед печат, както и такива с размазан, поради прекалено намастиляване, печат.
6. Описания метод си заслужава труда ако книгата е малка (или е част от книга) или пък ако книгата е ценна за вас.

В никакъв случай не искам да ви обезкуражавам, но споделих опита си най-вече с идеята да се гледа с по-сериозно отношение към работата на хората, които разчитат книгите.
maket
 
Мнения: 10
Регистрация: 26 май 2011, 21:24

Re: Как да се обработи налично издание в PDF преснимано с фотоапарат

Мнениеот pechkov » 19 март 2016, 00:13

maket написа:... и да си много добър с Photoshop-а, ...


Photoshop макар и много мощен инструмент за растерни изображения - изобщо не е най-подходящия за по-простички обработки, които не изискват работа със слоеве, бленди и прочие.

Разгледай как работи Scan Tailor, и напиши нови указания.

С поздрав,
pechkov
Когато паднеш с мотора......... се изтупваш от прахта, и се качваш пак!
pechkov
 
Мнения: 423
Регистрация: 06 април 2009, 21:39
Местонахождение: Монтана

Re: Как да се обработи налично издание в PDF преснимано с фотоапарат

Мнениеот NomaD » 19 март 2016, 11:32

За съжаление, постингът на maket може да послужи за указание как НЕ ТРЯБВА да се снима книга и как НЕ ТРЯБВА да се процедира с некачествени сканове.
Ако все пак някой има желание да снима с цифрова фотокамера и да обработва скановете, много по-полезни ще са му някои по-стари теми.
Съвети за "сканиране" с цифров фотоапарат
Обработка на сканирани изображения чрез Scan Tailor
Автоматизирано оконтрастяване на сканирани изображения

Качественото сканиране/снимане на страниците на книга е от изключително важно значение за безпроблемната по-нататъшна обработка. Сканове с фатално засягаща текста черна ивица при сгъвката, с пропуснати редове в началото или края на страницата, или с дефокусирано изображение практически не са използваеми за обработка, ако не се разполага под ръка с реалното книжно тяло за справка. Ако качеството на скановете е преобладаващо лошо, най-добре е изобщо да не се обработват и да се пристъпи към наистина качествено сканиране на книгата. Другото (особено попълване с лош превод от друг език) е слабо казано несериозно.
Изображение
Аватар
NomaD
 
Мнения: 173
Регистрация: 10 март 2007, 19:39


Обратно към Корекция

Кой е на линия

Потребители, разглеждащи форума: Николко регистрирани потребители и 0 гости