Автоматизирано оконтрастяване на сканирани изображения
Пуснато: 11 март 2008, 05:13
Автоматизирано оконтрастяване на сканирани (заснети с цифрова камера) изображения.
В текста по-долу ще се опитам систематично да покажа типичните проблеми и начините за разрешаването им при работа със сканиран текст.
В постингът ще има доста 'картинки', но без тях изложението, мисля, ще бъде много по-неясно.
За начало и получаване на мотивация нека сравним четивността и контраста на изображението преди и след манипулацията в графичен редактор.
След обработката буквите са контрастни и лесни за разбиране за ОЦР програмата. Макар да ни изглеждат назъбени, точно това е, което ОЦР програмите искат да 'видят'. Давайки им готова сдъвкана храна спестяваме време за импортиране и си осигуряваме значително по-предсказуеми резултати при разчитането.
Нека обработим изображението с три различни графични редактора с цел по-добро разбиране на това какво правим, а също така и откриване на аналогичните функции при подобни други програми.
Изборът ми падна върху:
1. платеният, но много популярен Photoshop (в моя случай музейната версия 5.0)
2. безплатният GIMP
3. и прекрасната безплатна програма XnView (v. 1.92.1) http://www.xnview.com/
И в трите случая целта ни е както да получим контрастен образ, така и да се подготвим и приложим след това манипулациите върху множество изображения автоматизирано.
Моля, дори да не се интересувате от варианта с Photoshop прочетете този постинг, защото там има важни обяснения, които в останалите липсват.
В текста по-долу ще се опитам систематично да покажа типичните проблеми и начините за разрешаването им при работа със сканиран текст.
В постингът ще има доста 'картинки', но без тях изложението, мисля, ще бъде много по-неясно.
За начало и получаване на мотивация нека сравним четивността и контраста на изображението преди и след манипулацията в графичен редактор.
След обработката буквите са контрастни и лесни за разбиране за ОЦР програмата. Макар да ни изглеждат назъбени, точно това е, което ОЦР програмите искат да 'видят'. Давайки им готова сдъвкана храна спестяваме време за импортиране и си осигуряваме значително по-предсказуеми резултати при разчитането.
Нека обработим изображението с три различни графични редактора с цел по-добро разбиране на това какво правим, а също така и откриване на аналогичните функции при подобни други програми.
Изборът ми падна върху:
1. платеният, но много популярен Photoshop (в моя случай музейната версия 5.0)
2. безплатният GIMP
3. и прекрасната безплатна програма XnView (v. 1.92.1) http://www.xnview.com/
И в трите случая целта ни е както да получим контрастен образ, така и да се подготвим и приложим след това манипулациите върху множество изображения автоматизирано.
Моля, дори да не се интересувате от варианта с Photoshop прочетете този постинг, защото там има важни обяснения, които в останалите липсват.