Photoshop
Системата за автоматизация на Photoshop се нарича Actions. Принципът на действие е, че по време на работа над индивидуален файл системата записва стъпките, които потребителят извършва, след което този Action може да бъде приложен на цяла директория с изображения.
1. Отваряме сканираното (заснето с камера) изображение във Photoshop
2. От панелът actions избираме new set и го именуваме примерно OCR
3. Кликайки на малкия триъгълник горе вдясно избираме New Action...

именуваме го и натискаме RECORD

Червената лампа за запис светва и от този момент нататък системата записва нашите действия. Изисква се известна практика и познание, ако искаме да редактираме Action-a си или да го запишем на части. В този случай ще процедираме направо и внимателно, за да не допуснем грешки и да трябва да повтаряме всичко отначало.
4. Първото нещо, което ще направим е да конвертираме изображението в Greyscale image, т.е. образ, който има само стойности на сивото. Това се прави от менюто IMAGE > MODE > GRAYSCALE

При така получения файл няма вече защо да се опасяваме от цветни разсейки, а и файловия размер намалява 3 пъти.
5. След това ротираме, за да 'изправим' образа: IMAGE > ROTATE CANVAS > 90CW
6. Следващата стъпка е може би най-съществената - настройване на нивата на черно, бяло и сиво. Levels, на английски. Тази функция дава по-добър контрол от предпочитаната от широките народни маси и напомняща настройките на телевизор Brightnes / Contrast.
В отворилата се диалогова кутия внимателно настройваме плъзгачите, така че да запазим максимално от буквите, а да загубим максимално фона. След което кликаме ОК.
При тази стъпка оконтрастихме изображението до голяма степен, но то все още съдържа както чисто бели и чисто черни пиксели, така и стойности на сивото. В следващата стъпка ще премахнем и тях.
7. Командата Threshold (праг на черно/бялото) определя къде е границата от която един сив пиксел да бъде третиран като черен, а друг като бял.
Избираме IMAGE > ADJUST > THRESHOLD...
В отворилата се диалогова кутия внимателно настройваме плъзгача така че буквите да бъдат максимално плътни и четливи, без да се зацапват, но също и без да се разкъсват. Винаги при неравно осветен текст част от страницата е по-бледа, така че търсим средно разумно положение.
Остават ни само още две малки настройки.
8. Първо да оправим резолюцията на заснетия от фотоапарат файл. Камерите работят с екранна резолюция, докато ОЦР програмите искат да им се подават изображения с 300dpi.
(Обяснение, което може да бъде прескочено в червено) Важно е да разбираме какви са взаимовръзките между размера на едно изображение в пиксели и печатарската резолюция. Предполагам, че в мрежата има достатъчно писано по въпроса. Аз ще опитам да го обясня най-просто така: Печатарската резолюция е информацията колко големи (колко раздалечени един от друг) да бъдат отпечатани съществуващите в нашето изображение пиксели.
Примерно, ако имаме файл с размери 100х100 пиксела и резолюция 100dpi - този файл ще бъде отпечатан с размер 1 х 1 инча. Ако печатарската резолюция на същия файл бъде променена на 200dpi, той ще бъде отпечатан с размери 0,5 x 0,5 инча. Намаляването на размера ще доведе до по-фино зърно и по-качествен на вид макар и по-дребен, т.нар. по-високорезолюционен отпечатък. Filesize остава непроменен, защото пикселите са същите на брой, само информацията как да бъдат отпечатани е променена...
Отвараме диалогова кутия от менюто IMAGE > IMAGE SIZE... и правим следните настройки

Важно е опцията
resample image да бъде изключена, т.е. да не променяме по същество изображението на пикселно ниво. Въвеждаме стойност 300dpi и даваме ОК.
9. Последна стъпка. Конвертираме още веднъж изображението в още по-нисък bit per pixel режим.
10. Записваме файлът SAVE AS... като TIF без компресия или PNG със същото име.
11. Стопираме записа на Action от черното квадратче на палетата actions.

Така записаните от нас стъпки се виждат изброени по-горе.
12. Можем да изпробваме така записаният Action върху друг файл, който да отворим във Photoshop и да му приложим поредицата от команди. Бутонът > play ще проиграе бързо това, което ние досега така дълго и внимателно обяснявахме.
Ако сме доволни от резултата, можем да запазим action-a като файл от същото триъгълно бутонче горе вдясно на палетата.
13. Обработка на папка с изображения използвайки току-що записания action.
От менюто FILE > AUTOMATE > BATCH... извикваме тази диалогова кутия

В по-новите версии на Photoshop тя е значително усложнена и предлага много по-богата функционалност, но така или иначе това което нас ни интересува е source и target директориите. След като посочим къде са нашите оригинални файлове и къде искаме да бъдат записани модифицираните, даваме ОК и компютърът започва работа над изображенията едно по едно.
Може да се наложи да се справите с документацията на версията на Photoshop, която ползвате за настройките на тази точно диалогова кутия.
Ето така записаният action за всеки, който желае да го ползва на готово или да експериментира с редактирането му
http://www.uploading.com/files/JFGSHFAX/OCR.zip.html
Заключение: Така подготвените TIFF файлове не изискват почти никаква обработка от Fine Reader-a и биват импортирани от програмата мълниеносно. Освен това разчитаемостта ще се увеличи значително.
Action-ите могат лесно да бъдат дублирани и редактирани. Това, което ще различава една книга от друга е контраста на букви/хартия, т.е. единствено настройките в т. 6 и може би т. 7 може да се наложи да бъдат променени.