Съвети за "сканиране" с цифров фотоапарат
Пуснато: 18 август 2006, 17:45
Искам изрично да подчертая, че темата включва само съвети. Някои от тях може да са неприложими, в зависимост от оборудването, с което разполагате. Все пак се надявам, че повечето ще са ви полезни и ще елиминират нуждата от налучкване на правилната за вас схема. Експериментите, на чийто резултати ще се позовавам нататък, са направени с фотоапарат Canon A410, 3.2 MPX.
Програма за разпознаване - излишно уточнение (като се има предвид темата), но нека внесем яснота. Ще говорим само за ABBYY FineReader, версии 7 или 8. Версия 8 се отличава с някои подобрения, сред които изправяне изкривяването на редовете близо до сгъвката на книгата, допълнителни функции за обработка на изображението (като напр. изрязване) и т.н. Нека някой по-запознат от мен с тънкостите на програмата да пусне отделна тема със съвети за самото разпознаване след сканиране.
Според препоръките на ABBYY фотоапаратът трябва да е с разделителна способност поне 4 MPX, за да се получат добри резултати. Според много други статии в интернет (а и според собствения ми опит) е напълно достатъчна и 3 MPX.
Добре е апаратът да има режим на ръчно фокусиране. Автоматичният фокус може да предизвика проблеми (при определени условия; по-долу ще ги посоча) със страници, в които текста заема по-малко от половин страница, например в края на някоя глава от книгата. Освен това автоматичното фокусиране забавя процеса на снимане и изтощава допълнително батерията. Тази настройка изобщо не е от такова значение за качеството на снимките, просто може да ви улесни живота.
Режим на снимане: Ако фотоапаратът ви има такава възможност, конфигурирайте го за работа с максималната разделителна способност в черно-бял режим. Всъщност това е режим "grayscale" - нива на сивото, но във фотоапаратите често го пишат черно-бял, а това може да доведе до объркване със скенерите, където има отделно черно-бял режим, нива на сивото и цветен режим. Това ще ви помогне да спестите малко място на картата без да правите компромис с качеството.
За ориентиране - една карта от 256 МБ побира около 170 снимки в тази разделителна способност (за моят фотоапарат, разбира се).
Разстояние за снимане: Някои препоръчват да се използва "макро"-режима на фотоапарата, а книгата да се приближи дотолкова, че страницата да заеме целия кадър. За съжаление не успях да постигна добри резултати с този режим. При книги от по-голям формат (малко под А4) фокусирането в макро-режим е невъзможно, ако искаш да обхванеш цялата страница. Освен това в този режим се получава ефекта "рибешко око" - редовете в ъгъла на кадъра се изкривяват навън. Това, разбира се, не е проблем с новата функция на FineReader 8, но значително забавя обработката на снимките преди разпознаване.
Най-добри резултати постигнах при сканиране от около 50 см - всъщност това е почти минималното разстояние, на което фотоапаратът ми можеше да фокусира страницата. За друг модел това разстояние може да се различава - установете го опитно. "Запълването" на кадъра със сканираната страница се постига чрез оптичното увеличение на фотопарата (zoom). Между другото, точно този метод се препоръчва от ABBYY. Ако използвате статив за фотоапарата, оставете си малко "бяло поле" около книгата, за да компенсирате евентуалното изместване на статива по време на снимане.
Добавено: Става въпрос само за оптичното увеличаване, при което фокусното разстояние се настройва чрез движение на обектива, а не цифровото увеличение, където се правят интерполации на изображението.
Също така е добре да снимате страница по страница, а не наведнъж две съседни. Малко са книгите, които ще ви позволят добро позициониране на страниците, за да ги снимате по двойки. Освен това, така се избягва начупването на гърбовете на книгите с меки корици, защото отпада нуждата от пълно разгръщане - достатъчно е книгата да е отворена под прав ъгъл.
Закрепване на сканираната книга: Най-лесно става с помощник. Някой, който да фиксира книгата докато снимате и да прелиства страниците. Вариантите са безброй, ще опиша само някои от тях. За много от тях е добре да се използва статив. Не се заблуждавайте от цените на стативите по фото-магазините, в търговските вериги ("Техно"-нещо-си) може да се намери много добър статив за под 20 лв.
Ако използвате статив, добре е да включите режим на закъснение при снимането - 1 или 2 сек. Това позволява да се избегнат вибрациите, предизвикани от натискането на "спусъка" на фотоапарата, които водят до размазване на снимката. Натискате бутона, веднага отдръпвате ръката си и изчаквате снимката. Така броя на размазаните снимки се намалява драстично. За съжаление никой от познатите ми модели (любителски) цифрови фотоапарати няма възможност за прикачане на автоматичен спусък - това също би помогнало за премахване на вибрациите.
Най-елементарният вариант - книгата е на пода, помощникът фиксира ъглите на страницата, която снимате и следи стърчащата част на книгата да не попадне в кадъра. Наличието на статив много ускорява и подобрява качеството на процеса - фотоапаратът се фиксира надолу, а книгата се разполага между краката на статива. Недостатък на този метод е, че е невъзможно да се фиксират страниците в хоризонталната плоскост (както при скенер), което налага допълнителна обработка на снимките преди разпознаване.
Един от вариантите за избягване на този проблем е да използвате парче стъкло (или прозрачен плексиглас, но той лесно се надрасква и бързо губи прозрачност), като с него затиснете страницата, която снимате. Точно както при скенера, само че тук избягвате необходимостта да "разчеквате" книгата на 180 градуса. За съжаление това много забавя процеса на снимане.
Вторият вариант е да използвате стъклена витрина - тогава снимането се извършва хоризонтално, а не вертикално. Отворете витрината на около 30-40 см, пъхнете книгата вътре и притиснете страницата отзад на стъклото. С другата ръка придържайте "хвърчащите" страници така, че да не попадат в кадър. При книги малък формат това може да се извърши и с една ръка. При наличие на статив и задаване на закъснение от над 2 сек. е възможно дори да снимате сам, без помощник - натискате бутона и докато тече закъснението, отгръщате "хвърчащите" страници, за да не попаднат в кадъра. Най-големият недостатък, който открих в този метод е, че ако страницата е запълнена с текст по-малко от половината, автоматичната фокусировка на фотоапарата се побърква и фокусира стъклото пред страницата, вместо самата страница. Тук може да ви помогне функцията за ръчна настройка на фокуса.
Добавено: Друг вариант за справяне с този проблем е да използвате парче хартия с нещо напечатано върху него (аз използвам джобно календарче), което да поставите в празната част на страницата. Трети вариант: Ако апаратът ви поддържа функция "заключване на фокуса" (AF Lock), направете една снимка на пълна страница с тази функция, след което настройките на фокусното разстояние ще се запазят до следващите промени в параметрите (в зависимост от модела).
Друг метод, който прочетох в един български форум, предлагаше използване на пластмасово столче или табуретка, в които има технологични отвори в средата - около 5 см дупка. Не съм изпробвал този метод; нямам представа как може да се фиксира апарата при това положение, но не твърдя, че е невъзможно. Естествено, ще имате нужда от допълнително осветление поради сянката, която ще хвърля табуретката.
Добавено: Независимо от избрания начин за снимане, фотоапаратът винаги трябва да е насочен перпендикулярно към страницата, а центърът на обектива да сочи центъра на страницата. В противен случай ще получите снимка с такива изкривявания на редовете, каквито много трудно ще се коригират, дори и със специализираните програми.
Осветление: Рядко ще получите добри резултати при снимане със светкавица. Книгата трябва да е закрепена равно, да не е на отражателна (гланцирана или ламинирана) хартия, да не се снима през стъкло. Най-добре е да използвате естествено осветление - ярка слънчева светлина. Тъй като това често е невъзможно, може да използвате по-мощна настолна лампа, която да осветява страниците.
При снимане през стъкло е добре осветлението да е насочено под ъгъл, за да не се получат "бликове" по снимките - много ярки бели петна, причинени от отразеното осветление (поради тази причина използването на светкавица е абсолютно невъзможно). Добра стойност е около 45 градуса; ако е повече, се увеличава риска за появяване на бликове, ако е по-малко, по-далечните краища на страницата не се осветяват добре.
Ако фотоапаратът ви има такава функция, добре е преди снимането да настроите баланса на бялото - най-лесно става с празен лист хартия. Автоматичното определяне на баланса (дори в черно-бял режим) често прави по-тъмни снимки, отколкото се харесва на FineReader-а.
Предимства на сканирането с цифров фотоапарат:
Много по-бързо от скенер. Ама много по-бързо. Книга от около 500 стр. я преснимах за около час със статив и помощник (на витрина). Със скенер тази операция би ми отнела поне 5 часа.
Достъпност. Не всички имат скенер (а и за какво ли им е), но много хора имат цифров фотоапарат или поне биха могли да си позволят такъв, при положение, че може да се използва както за нормални снимки, така и за сканиране на текст.
Недостатъци на сканирането с цифров фотоапарат:
Може да е поради хардерната ми конфигурация, но JPEG-файловете, които генерира моят фотоапарат, се отварят много бавно във FineReader-а. Доколкото разбрах, при това отваряне се правят много от предварителните обработки на изображението (определяне общото ниво на осветеност, конверсия към вътрешния TIFF-формат), но това изобщо не ме успокоява. Предварителната конверсия към TIFF изобщо не подобри нещата - ABBYY отказа да отвори "цветен" TIFF, а конверсията към черно-бял (fax-режим) TIFF само влоши качеството на разпознаване. Засега не съм намерил разрешение на този проблем.
Програма за разпознаване - излишно уточнение (като се има предвид темата), но нека внесем яснота. Ще говорим само за ABBYY FineReader, версии 7 или 8. Версия 8 се отличава с някои подобрения, сред които изправяне изкривяването на редовете близо до сгъвката на книгата, допълнителни функции за обработка на изображението (като напр. изрязване) и т.н. Нека някой по-запознат от мен с тънкостите на програмата да пусне отделна тема със съвети за самото разпознаване след сканиране.
Според препоръките на ABBYY фотоапаратът трябва да е с разделителна способност поне 4 MPX, за да се получат добри резултати. Според много други статии в интернет (а и според собствения ми опит) е напълно достатъчна и 3 MPX.
Добре е апаратът да има режим на ръчно фокусиране. Автоматичният фокус може да предизвика проблеми (при определени условия; по-долу ще ги посоча) със страници, в които текста заема по-малко от половин страница, например в края на някоя глава от книгата. Освен това автоматичното фокусиране забавя процеса на снимане и изтощава допълнително батерията. Тази настройка изобщо не е от такова значение за качеството на снимките, просто може да ви улесни живота.
Режим на снимане: Ако фотоапаратът ви има такава възможност, конфигурирайте го за работа с максималната разделителна способност в черно-бял режим. Всъщност това е режим "grayscale" - нива на сивото, но във фотоапаратите често го пишат черно-бял, а това може да доведе до объркване със скенерите, където има отделно черно-бял режим, нива на сивото и цветен режим. Това ще ви помогне да спестите малко място на картата без да правите компромис с качеството.
За ориентиране - една карта от 256 МБ побира около 170 снимки в тази разделителна способност (за моят фотоапарат, разбира се).
Разстояние за снимане: Някои препоръчват да се използва "макро"-режима на фотоапарата, а книгата да се приближи дотолкова, че страницата да заеме целия кадър. За съжаление не успях да постигна добри резултати с този режим. При книги от по-голям формат (малко под А4) фокусирането в макро-режим е невъзможно, ако искаш да обхванеш цялата страница. Освен това в този режим се получава ефекта "рибешко око" - редовете в ъгъла на кадъра се изкривяват навън. Това, разбира се, не е проблем с новата функция на FineReader 8, но значително забавя обработката на снимките преди разпознаване.
Най-добри резултати постигнах при сканиране от около 50 см - всъщност това е почти минималното разстояние, на което фотоапаратът ми можеше да фокусира страницата. За друг модел това разстояние може да се различава - установете го опитно. "Запълването" на кадъра със сканираната страница се постига чрез оптичното увеличение на фотопарата (zoom). Между другото, точно този метод се препоръчва от ABBYY. Ако използвате статив за фотоапарата, оставете си малко "бяло поле" около книгата, за да компенсирате евентуалното изместване на статива по време на снимане.
Добавено: Става въпрос само за оптичното увеличаване, при което фокусното разстояние се настройва чрез движение на обектива, а не цифровото увеличение, където се правят интерполации на изображението.
Също така е добре да снимате страница по страница, а не наведнъж две съседни. Малко са книгите, които ще ви позволят добро позициониране на страниците, за да ги снимате по двойки. Освен това, така се избягва начупването на гърбовете на книгите с меки корици, защото отпада нуждата от пълно разгръщане - достатъчно е книгата да е отворена под прав ъгъл.
Закрепване на сканираната книга: Най-лесно става с помощник. Някой, който да фиксира книгата докато снимате и да прелиства страниците. Вариантите са безброй, ще опиша само някои от тях. За много от тях е добре да се използва статив. Не се заблуждавайте от цените на стативите по фото-магазините, в търговските вериги ("Техно"-нещо-си) може да се намери много добър статив за под 20 лв.
Ако използвате статив, добре е да включите режим на закъснение при снимането - 1 или 2 сек. Това позволява да се избегнат вибрациите, предизвикани от натискането на "спусъка" на фотоапарата, които водят до размазване на снимката. Натискате бутона, веднага отдръпвате ръката си и изчаквате снимката. Така броя на размазаните снимки се намалява драстично. За съжаление никой от познатите ми модели (любителски) цифрови фотоапарати няма възможност за прикачане на автоматичен спусък - това също би помогнало за премахване на вибрациите.
Най-елементарният вариант - книгата е на пода, помощникът фиксира ъглите на страницата, която снимате и следи стърчащата част на книгата да не попадне в кадъра. Наличието на статив много ускорява и подобрява качеството на процеса - фотоапаратът се фиксира надолу, а книгата се разполага между краката на статива. Недостатък на този метод е, че е невъзможно да се фиксират страниците в хоризонталната плоскост (както при скенер), което налага допълнителна обработка на снимките преди разпознаване.
Един от вариантите за избягване на този проблем е да използвате парче стъкло (или прозрачен плексиглас, но той лесно се надрасква и бързо губи прозрачност), като с него затиснете страницата, която снимате. Точно както при скенера, само че тук избягвате необходимостта да "разчеквате" книгата на 180 градуса. За съжаление това много забавя процеса на снимане.
Вторият вариант е да използвате стъклена витрина - тогава снимането се извършва хоризонтално, а не вертикално. Отворете витрината на около 30-40 см, пъхнете книгата вътре и притиснете страницата отзад на стъклото. С другата ръка придържайте "хвърчащите" страници така, че да не попадат в кадър. При книги малък формат това може да се извърши и с една ръка. При наличие на статив и задаване на закъснение от над 2 сек. е възможно дори да снимате сам, без помощник - натискате бутона и докато тече закъснението, отгръщате "хвърчащите" страници, за да не попаднат в кадъра. Най-големият недостатък, който открих в този метод е, че ако страницата е запълнена с текст по-малко от половината, автоматичната фокусировка на фотоапарата се побърква и фокусира стъклото пред страницата, вместо самата страница. Тук може да ви помогне функцията за ръчна настройка на фокуса.
Добавено: Друг вариант за справяне с този проблем е да използвате парче хартия с нещо напечатано върху него (аз използвам джобно календарче), което да поставите в празната част на страницата. Трети вариант: Ако апаратът ви поддържа функция "заключване на фокуса" (AF Lock), направете една снимка на пълна страница с тази функция, след което настройките на фокусното разстояние ще се запазят до следващите промени в параметрите (в зависимост от модела).
Друг метод, който прочетох в един български форум, предлагаше използване на пластмасово столче или табуретка, в които има технологични отвори в средата - около 5 см дупка. Не съм изпробвал този метод; нямам представа как може да се фиксира апарата при това положение, но не твърдя, че е невъзможно. Естествено, ще имате нужда от допълнително осветление поради сянката, която ще хвърля табуретката.
Добавено: Независимо от избрания начин за снимане, фотоапаратът винаги трябва да е насочен перпендикулярно към страницата, а центърът на обектива да сочи центъра на страницата. В противен случай ще получите снимка с такива изкривявания на редовете, каквито много трудно ще се коригират, дори и със специализираните програми.
Осветление: Рядко ще получите добри резултати при снимане със светкавица. Книгата трябва да е закрепена равно, да не е на отражателна (гланцирана или ламинирана) хартия, да не се снима през стъкло. Най-добре е да използвате естествено осветление - ярка слънчева светлина. Тъй като това често е невъзможно, може да използвате по-мощна настолна лампа, която да осветява страниците.
При снимане през стъкло е добре осветлението да е насочено под ъгъл, за да не се получат "бликове" по снимките - много ярки бели петна, причинени от отразеното осветление (поради тази причина използването на светкавица е абсолютно невъзможно). Добра стойност е около 45 градуса; ако е повече, се увеличава риска за появяване на бликове, ако е по-малко, по-далечните краища на страницата не се осветяват добре.
Ако фотоапаратът ви има такава функция, добре е преди снимането да настроите баланса на бялото - най-лесно става с празен лист хартия. Автоматичното определяне на баланса (дори в черно-бял режим) често прави по-тъмни снимки, отколкото се харесва на FineReader-а.
Предимства на сканирането с цифров фотоапарат:
Много по-бързо от скенер. Ама много по-бързо. Книга от около 500 стр. я преснимах за около час със статив и помощник (на витрина). Със скенер тази операция би ми отнела поне 5 часа.
Достъпност. Не всички имат скенер (а и за какво ли им е), но много хора имат цифров фотоапарат или поне биха могли да си позволят такъв, при положение, че може да се използва както за нормални снимки, така и за сканиране на текст.
Недостатъци на сканирането с цифров фотоапарат:
Може да е поради хардерната ми конфигурация, но JPEG-файловете, които генерира моят фотоапарат, се отварят много бавно във FineReader-а. Доколкото разбрах, при това отваряне се правят много от предварителните обработки на изображението (определяне общото ниво на осветеност, конверсия към вътрешния TIFF-формат), но това изобщо не ме успокоява. Предварителната конверсия към TIFF изобщо не подобри нещата - ABBYY отказа да отвори "цветен" TIFF, а конверсията към черно-бял (fax-режим) TIFF само влоши качеството на разпознаване. Засега не съм намерил разрешение на този проблем.