Съвети за "сканиране" с цифров фотоапарат

Търсене и предлагане на помощ при сканиране. Теми за началната работа при цифровизацията.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Съвети за "сканиране" с цифров фотоапарат

Мнение от Mandor »

Искам изрично да подчертая, че темата включва само съвети. Някои от тях може да са неприложими, в зависимост от оборудването, с което разполагате. Все пак се надявам, че повечето ще са ви полезни и ще елиминират нуждата от налучкване на правилната за вас схема. Експериментите, на чийто резултати ще се позовавам нататък, са направени с фотоапарат Canon A410, 3.2 MPX.

Програма за разпознаване - излишно уточнение (като се има предвид темата), но нека внесем яснота. Ще говорим само за ABBYY FineReader, версии 7 или 8. Версия 8 се отличава с някои подобрения, сред които изправяне изкривяването на редовете близо до сгъвката на книгата, допълнителни функции за обработка на изображението (като напр. изрязване) и т.н. Нека някой по-запознат от мен с тънкостите на програмата да пусне отделна тема със съвети за самото разпознаване след сканиране.

Според препоръките на ABBYY фотоапаратът трябва да е с разделителна способност поне 4 MPX, за да се получат добри резултати. Според много други статии в интернет (а и според собствения ми опит) е напълно достатъчна и 3 MPX.

Добре е апаратът да има режим на ръчно фокусиране. Автоматичният фокус може да предизвика проблеми (при определени условия; по-долу ще ги посоча) със страници, в които текста заема по-малко от половин страница, например в края на някоя глава от книгата. Освен това автоматичното фокусиране забавя процеса на снимане и изтощава допълнително батерията. Тази настройка изобщо не е от такова значение за качеството на снимките, просто може да ви улесни живота.

Режим на снимане: Ако фотоапаратът ви има такава възможност, конфигурирайте го за работа с максималната разделителна способност в черно-бял режим. Всъщност това е режим "grayscale" - нива на сивото, но във фотоапаратите често го пишат черно-бял, а това може да доведе до объркване със скенерите, където има отделно черно-бял режим, нива на сивото и цветен режим. Това ще ви помогне да спестите малко място на картата без да правите компромис с качеството.
За ориентиране - една карта от 256 МБ побира около 170 снимки в тази разделителна способност (за моят фотоапарат, разбира се).

Разстояние за снимане: Някои препоръчват да се използва "макро"-режима на фотоапарата, а книгата да се приближи дотолкова, че страницата да заеме целия кадър. За съжаление не успях да постигна добри резултати с този режим. При книги от по-голям формат (малко под А4) фокусирането в макро-режим е невъзможно, ако искаш да обхванеш цялата страница. Освен това в този режим се получава ефекта "рибешко око" - редовете в ъгъла на кадъра се изкривяват навън. Това, разбира се, не е проблем с новата функция на FineReader 8, но значително забавя обработката на снимките преди разпознаване.
Най-добри резултати постигнах при сканиране от около 50 см - всъщност това е почти минималното разстояние, на което фотоапаратът ми можеше да фокусира страницата. За друг модел това разстояние може да се различава - установете го опитно. "Запълването" на кадъра със сканираната страница се постига чрез оптичното увеличение на фотопарата (zoom). Между другото, точно този метод се препоръчва от ABBYY. Ако използвате статив за фотоапарата, оставете си малко "бяло поле" около книгата, за да компенсирате евентуалното изместване на статива по време на снимане.
Добавено: Става въпрос само за оптичното увеличаване, при което фокусното разстояние се настройва чрез движение на обектива, а не цифровото увеличение, където се правят интерполации на изображението.

Също така е добре да снимате страница по страница, а не наведнъж две съседни. Малко са книгите, които ще ви позволят добро позициониране на страниците, за да ги снимате по двойки. Освен това, така се избягва начупването на гърбовете на книгите с меки корици, защото отпада нуждата от пълно разгръщане - достатъчно е книгата да е отворена под прав ъгъл.

Закрепване на сканираната книга: Най-лесно става с помощник. Някой, който да фиксира книгата докато снимате и да прелиства страниците. Вариантите са безброй, ще опиша само някои от тях. За много от тях е добре да се използва статив. Не се заблуждавайте от цените на стативите по фото-магазините, в търговските вериги ("Техно"-нещо-си) може да се намери много добър статив за под 20 лв.
Ако използвате статив, добре е да включите режим на закъснение при снимането - 1 или 2 сек. Това позволява да се избегнат вибрациите, предизвикани от натискането на "спусъка" на фотоапарата, които водят до размазване на снимката. Натискате бутона, веднага отдръпвате ръката си и изчаквате снимката. Така броя на размазаните снимки се намалява драстично. За съжаление никой от познатите ми модели (любителски) цифрови фотоапарати няма възможност за прикачане на автоматичен спусък - това също би помогнало за премахване на вибрациите.

Най-елементарният вариант - книгата е на пода, помощникът фиксира ъглите на страницата, която снимате и следи стърчащата част на книгата да не попадне в кадъра. Наличието на статив много ускорява и подобрява качеството на процеса - фотоапаратът се фиксира надолу, а книгата се разполага между краката на статива. Недостатък на този метод е, че е невъзможно да се фиксират страниците в хоризонталната плоскост (както при скенер), което налага допълнителна обработка на снимките преди разпознаване.
Един от вариантите за избягване на този проблем е да използвате парче стъкло (или прозрачен плексиглас, но той лесно се надрасква и бързо губи прозрачност), като с него затиснете страницата, която снимате. Точно както при скенера, само че тук избягвате необходимостта да "разчеквате" книгата на 180 градуса. За съжаление това много забавя процеса на снимане.
Вторият вариант е да използвате стъклена витрина - тогава снимането се извършва хоризонтално, а не вертикално. Отворете витрината на около 30-40 см, пъхнете книгата вътре и притиснете страницата отзад на стъклото. С другата ръка придържайте "хвърчащите" страници така, че да не попадат в кадър. При книги малък формат това може да се извърши и с една ръка. При наличие на статив и задаване на закъснение от над 2 сек. е възможно дори да снимате сам, без помощник - натискате бутона и докато тече закъснението, отгръщате "хвърчащите" страници, за да не попаднат в кадъра. Най-големият недостатък, който открих в този метод е, че ако страницата е запълнена с текст по-малко от половината, автоматичната фокусировка на фотоапарата се побърква и фокусира стъклото пред страницата, вместо самата страница. Тук може да ви помогне функцията за ръчна настройка на фокуса.
Добавено: Друг вариант за справяне с този проблем е да използвате парче хартия с нещо напечатано върху него (аз използвам джобно календарче), което да поставите в празната част на страницата. Трети вариант: Ако апаратът ви поддържа функция "заключване на фокуса" (AF Lock), направете една снимка на пълна страница с тази функция, след което настройките на фокусното разстояние ще се запазят до следващите промени в параметрите (в зависимост от модела).

Друг метод, който прочетох в един български форум, предлагаше използване на пластмасово столче или табуретка, в които има технологични отвори в средата - около 5 см дупка. Не съм изпробвал този метод; нямам представа как може да се фиксира апарата при това положение, но не твърдя, че е невъзможно. Естествено, ще имате нужда от допълнително осветление поради сянката, която ще хвърля табуретката.

Добавено: Независимо от избрания начин за снимане, фотоапаратът винаги трябва да е насочен перпендикулярно към страницата, а центърът на обектива да сочи центъра на страницата. В противен случай ще получите снимка с такива изкривявания на редовете, каквито много трудно ще се коригират, дори и със специализираните програми.

Осветление: Рядко ще получите добри резултати при снимане със светкавица. Книгата трябва да е закрепена равно, да не е на отражателна (гланцирана или ламинирана) хартия, да не се снима през стъкло. Най-добре е да използвате естествено осветление - ярка слънчева светлина. Тъй като това често е невъзможно, може да използвате по-мощна настолна лампа, която да осветява страниците.

При снимане през стъкло е добре осветлението да е насочено под ъгъл, за да не се получат "бликове" по снимките - много ярки бели петна, причинени от отразеното осветление (поради тази причина използването на светкавица е абсолютно невъзможно). Добра стойност е около 45 градуса; ако е повече, се увеличава риска за появяване на бликове, ако е по-малко, по-далечните краища на страницата не се осветяват добре.

Ако фотоапаратът ви има такава функция, добре е преди снимането да настроите баланса на бялото - най-лесно става с празен лист хартия. Автоматичното определяне на баланса (дори в черно-бял режим) често прави по-тъмни снимки, отколкото се харесва на FineReader-а.


Предимства на сканирането с цифров фотоапарат:
Много по-бързо от скенер. Ама много по-бързо. Книга от около 500 стр. я преснимах за около час със статив и помощник (на витрина). Със скенер тази операция би ми отнела поне 5 часа.
Достъпност. Не всички имат скенер (а и за какво ли им е), но много хора имат цифров фотоапарат или поне биха могли да си позволят такъв, при положение, че може да се използва както за нормални снимки, така и за сканиране на текст.

Недостатъци на сканирането с цифров фотоапарат:
Може да е поради хардерната ми конфигурация, но JPEG-файловете, които генерира моят фотоапарат, се отварят много бавно във FineReader-а. Доколкото разбрах, при това отваряне се правят много от предварителните обработки на изображението (определяне общото ниво на осветеност, конверсия към вътрешния TIFF-формат), но това изобщо не ме успокоява. Предварителната конверсия към TIFF изобщо не подобри нещата - ABBYY отказа да отвори "цветен" TIFF, а конверсията към черно-бял (fax-режим) TIFF само влоши качеството на разпознаване. Засега не съм намерил разрешение на този проблем.
Последната и единствена промяна е направена от Mandor на 02 февруари 2009, 11:50.
Слави
Мнения: 37
Регистрация: 13 юли 2006, 20:35

Мнение от Слави »

Проблемът с бавното отваряне и разпознаването на файловете от FineReader-а се дължи както и сам отбелязваш на мощността на компютъра. 500 снимки се качват и разпознават от FR-8 за около 1 час при семпрон 2200+ и 256 Мгб оперативна памет и за 15-тина минути при P-4 3 Гх и 512 Мб ОП.
Слави
Мнения: 37
Регистрация: 13 юли 2006, 20:35

Мнение от Слави »

Аз обикновено преди на вкарвам картинки във файн рийдър-а ги минавам преACDSee за да изреща излишните полета и да дам автованични цветове и контраст - отнема време но разпознаването е много по-бързо и по-правилно.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Мнение от Mandor »

slavy написа:Проблемът с бавното отваряне и разпознаването на файловете от FineReader-а се дължи както и сам отбелязваш на мощността на компютъра. 500 снимки се качват и разпознават от FR-8 за около 1 час при семпрон 2200+ и 256 Мгб оперативна памет и за 15-тина минути при P-4 3 Гх и 512 Мб ОП.
Не, нямах предвид и разпознаването, а само отварянето на файловете - когато зареждаш сканираните картинки. На P-4 2,4 GHz и 512 RAM един JPEG се зарежда за около десет секунди (ако не и по-дълго). Със самото разпознаване нямам никакви проблеми със скоростта - тя е без промяна. За сравнение - един TIFF се зарежда за по-малко от секунда.

Може би е добре да отвориш нова тема със съвети за предварителната обработка на изображенията преди разпознаване. Дори и да са за конкретна програма.
Аватар
goblin
Мнения: 54
Регистрация: 20 август 2006, 17:18

Мнение от goblin »

Mandor написа: Недостатъци на сканирането с цифров фотоапарат:
Може да е поради хардерната ми конфигурация, но JPEG-файловете, които генерира моят фотоапарат, се отварят много бавно във FineReader-а.
Основната причина за това е, че снимките от цифровия фотоапарат са с резолюция, по-малка от 300 точки/инч, колко то е необходима за FineReader. За всеки фотоапарат резолюцията е различна, но най-често е 180 точки/инч и FineReader губи много време за конвертирането до 300. Точно затова сканираните страници се отварят по-бързо - сканирането обикновено се прави с резолюция най-малко 300 точки/инч. :)
Този проблем може да се реши с Photoshop, като едновременно с това (само с една операция :) ) се изрязват и нещата от снимката, които пречат на разпознаването (номерацията на страниците, колонтитули и др.)
В настройките на инструмента "Crop" зададайте в прозорчето "Resolution" стойност 300 pixels/inch.

Изображение

Прозорчетата Width и Height може да ги оставите празни.

Между другото - аз съм този, дето в другия форум дадох акъла за табуретката :P . Разбира се, там ставаше дума за импровизиран статив - човекът искаше да си снима само една книга. Иначе ползвам стойката от стария ми фотоувеличител - много е удобно, защото може да се регулира височината. Необходима е само малко сръчност, за да закрепите фотоапарата :idea: .
Mike
Мнения: 34
Регистрация: 29 юли 2006, 10:34

Мнение от Mike »

супер е че пуснахте такава тема
моя първи опит беше без помощник-по точно помощника ми беше една саксия и не стана кой знае колко зле :roll:
Не върви пред мен,
не мога да те следвам;
не върви зад мен,
не мога да те водя;
върви до мен
и ми бъди приятел;
The Engineer

Програма

Мнение от The Engineer »

Откъде мога да намеря програма. Желателно безплатно, а ако е платено в сайта да пише кое къде на руски или испански, не разбирам английски. Апаратче 4 Mp имам, настолния компютър е с 2 GB RAM и P4 3,2 трябва да стане. Искам първите 4 от Тери Брукс (за Шанара) да кача засега. От ИНФОДАР с преводач, Боряна Даракчиева. Както на всяка книга пише, че не можело да се разпространява, възпроизвежда, копира или предава без тяхно писмено разрешение. Може или не, ако не по какво да позная коя да сложа, на всички в нас пише подобни неща?
Гост

Re: Програма

Мнение от Гост »

The Engineer написа:Откъде мога да намеря програма. Желателно безплатно, а ако е платено в сайта да пише кое къде на руски или испански, не разбирам английски. Апаратче 4 Mp имам, настолния компютър е с 2 GB RAM и P4 3,2 трябва да стане. Искам първите 4 от Тери Брукс (за Шанара) да кача засега. От ИНФОДАР с преводач, Боряна Даракчиева. Както на всяка книга пише, че не можело да се разпространява, възпроизвежда, копира или предава без тяхно писмено разрешение. Може или не, ако не по какво да позная коя да сложа, на всички в нас пише подобни неща?

Процесора е от значение при подобна дейност само ако е под 300 мх....

Разбира се, всичко това е изцябо незаконно. Всички тези книги са защитени от авторски права...
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: Програма

Мнение от Mandor »

The Engineer написа:Откъде мога да намеря програма.
Програма за какво? За разпознаване на сканирания (снимания) текст ли? В този случай безспорният фаворит (ако не и единствената възможност за разпознаване на български език) е FineReader, но цената му е доста солена.
Другият вариант е да направите сканирането (снимането), да качите картинките на някой сървър и да дадете препратката в секция "Сканиране" на библиотеката; така някой друг може да извърши OCR-а, след което да редактирате резултата спрямо хартиените книги.
Гост написа: Разбира се, всичко това е изцяло незаконно. Всички тези книги са защитени от авторски права...
Не е точно така. Да, (почти) всички книги са защитени с авторски права, но (не)законността на нашите действия е под въпрос. Но този въпрос вече е предъвкван многократно, а и не е по текущата тема.
Аватар
piligrim
Мнения: 55
Регистрация: 18 април 2007, 22:32
Местонахождение: Русе

Мнение от piligrim »

Много фотоапарати имат възможност за увеличаване резкостта на изображението - sharpen - НЕ ГО ПРАВЕТЕ!!!. Точно обратното снимката трябва да бъде леко не на фокус... (не не съм се чалнал). При ръчен режим на фокусиране е най добре да измерите фокусното разстояние след което да го настроите във фотоапарата с ±2cm. Другия вариант е да ползвате функцията <despeckle image> на Fine Reader но това отнема повече време и ефекта не е толкова добър, както при разфокусирането. Този трик важи най-вече за книги отпечатани на лоша офсетова хартия със зацапани форми (т.е. по страницата освен писмени символи има и множество артефакти)

Някои фотоапарати имат възможност да работят в режим на пряка връзка с компютъра. Ако Вашият го може - възползвайте се. Много по-лесно се "гласи" страницата на монитора от колкото през LCD дисплея на фотоапарата.
slacker
Мнения: 62
Регистрация: 15 октомври 2009, 03:24

Мнение от slacker »

Резултата от експериментиране с фотоапарат BenQ DC C1020 (10 мегапиксела) и парче стъкло, поставено върху книга:

Изображение

Не е ползван статив. Светлината е директна слънчева. Фотоапаратът е настроен на автоматичен режим без "optical zoom".

Още снимки: Сканиране на книги с фотоапарат (за да се видят в мащаб 1:1 трябва да се изтеглят - увеличението с лупичката в сайта на Picasa не работи както се очаква).
vatash
Мнения: 2
Регистрация: 28 септември 2011, 18:58

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от vatash »

Здравейте, аз съм на 12 години и ползвам профила на баща ми и много ми харесва сайта ви. Искам и аз да помогна, но няма скенер, ами фотоапарат http://www.canon.bg/For_Home/Product_Fi ... EOS_1000D/ дали ще се получи и ще може ли да ми обясните с по-прости термини :)
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от gioganotti »

Здравей, vatash.
Ще се опитам да ти дам някои напътствия, без да претендирам, че съм професионалист. Най-напред потърси си статив за фотоапарата, че ми изглежда тежичък. След това направи няколко пробни снимки при различни режими на осветление и в различни краища на стаята. Така ще добиеш представа кога се получават по-добри снимки. След това вече идва обработката със съответната програма и евентуалното записване в ателието. И най-важното: не трябва да се отчайваш, ако не се получи веднага. Просто тренирай здраво и то ще си дойде от самосебе си.
Надявам се, че ти помогнах поне малко.
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
vatash
Мнения: 2
Регистрация: 28 септември 2011, 18:58

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от vatash »

Благодаря :))
PYMEH

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от PYMEH »

,страхотен материал, колега, обаче нещо не се оправям с настройките на моя samsung l210 10.2mpx. Някой снимал ли е с нещо подобно, да даде насоки. Като е кофти снимката после и ОЦР-а не помага. Със скенера става перфектно, но времето е ужасяващо много около 80-90стр на час.
Аватар
Бам Бам
Мнения: 417
Регистрация: 29 октомври 2010, 17:36
Местонахождение: Папуа Нова Гвинея
Връзка:

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Бам Бам »

Дай една примерна "кофти" снимка да видим какъв точно е проблемът.
PYMEH

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от PYMEH »

прилагам 3 варианта на една и съща страница - със светкавица, без светкавица на стайна свелина и на последната с допълнителна близка светлина. На грейскейл са всичките, снимани от около 30-40 см. Необработени с Фотошопа. Между другото ако някой може да даде линк за готов рекорд за обработване на фотошопа за оконтрастяване, ще е плюс, макар големия проблем май ми е снимането.
http://www.4shared.com/photo/uIjIyenX/SDC16109.html
http://www.4shared.com/photo/tfK-MoKu/SDC16108.html
http://www.4shared.com/photo/ckkcTdvM/SDC16107.html
Аватар
Бам Бам
Мнения: 417
Регистрация: 29 октомври 2010, 17:36
Местонахождение: Папуа Нова Гвинея
Връзка:

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Бам Бам »

Първите две картинки са достатъчно добри за OCR, като изключим размазването. То може да се дължи на две причини. Или много са ти треперели ръцете, или просто нямаш фокус. Когато се снима книга с фотоапарат е силно препоръчително да се ползва някакъв статив. Дори най-евтините модели вършат работа. Също така трябва да включиш опцията за макро снимки на твоя фотоапарат. Samsung L210 поддържа макро от 10 до 80 см. Ако обективът е по-близо от 10 см. няма да си на фокус. По отношение на контраста, мисля че във Fine Reader има опция да ти го оправя автоматично, но не съм сигурен. Ако държиш да го правиш с Photoshop си направи сам екшън според изискванията. Елементарно е. Просто ти трябва малко увеличение на контраста и може би яркостта. За секунди се прави.
ckitnik
Мнения: 43
Регистрация: 03 ноември 2008, 09:54

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от ckitnik »

Аз съм с евтин фотоапарат (Panasonic Lumix DMC-FS3), най-евтиното стативче и карам както е показано тук. Със светкавица много бързо ще свърши батерията, а с лампата има силна постоянна светлина. Така съм снимал до около 700-800 страници на едно зареждане на батерия в рамките на час-час и нещо. Снимам първо четни след това нечетни страници, накрая преименувам с Bulk Rename. Фотошоп ми е излишен, зареждам изображенията направо в Scan Tailor.
„Добрият пътешественик няма твърди планове и не държи да пристигне на всяка цена.“ Лао Дзъ
PYMEH

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от PYMEH »

извинявайте, че пак нахалствам, но наистина не я докарах до никъде. Бам Бам, моля те, щом първите две снимки са горе долу, би ли опитал да ги оконтрастираш с твоите настройки и дали ще излезе опознаваем текст., при мен нищо не разпознава Просто се опитвам да разбере в коя от двете части греша фатално - снимане или оконтрастиране.
PYMEH

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от PYMEH »

Проблема е решен, благодаря за помощта, колеги. С проба-грешка мисля налучках настройките и сега дори не ми се налага да минавам през фотошопа.
ivo79
Мнения: 4
Регистрация: 31 август 2013, 20:00

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от ivo79 »

Кога употребявам scantailor преди или след finereader ?
И кога няма нужда от scantailor?
До колкото разбирам последните версии на файнрйдерът имат функции (до някъде) като скантейлър
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Mandor »

ivo79 написа:Кога употребявам scantailor преди или след finereader ?
И кога няма нужда от scantailor?
Щом ще изполваш FineReader, няма никакъв смисъл да използваш ScanTailor.
Marina_Petrova

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Marina_Petrova »

Как успявате да ги правите тези снимки с 3.2 пикселов фотоапарат?Аз имам Фотоапарат Sony DSC W710B, 16 пиксела и би трябвало като снимам да е като сканиране, но не е това което искам.Последният път в читалнята на библиотеката направих доста снимки, но сега трябва да зумирам всяка снимка, за да я разчета.Чудя се дали проблемът не е в настройките или в това че съм снимала в ъгъла на читалнята, където нямаше толкова светлина.Бих качила една снимка, за да видите как изглежда.
Гост

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Гост »

Marina_Petrova написа:Как успявате да ги правите тези снимки с 3.2 пикселов фотоапарат?Аз имам Фотоапарат Sony DSC W710B, 16 пиксела и би трябвало като снимам да е като сканиране, но не е това което искам.Последният път в читалнята на библиотеката направих доста снимки, но сега трябва да зумирам всяка снимка, за да я разчета.Чудя се дали проблемът не е в настройките или в това че съм снимала в ъгъла на читалнята, където нямаше толкова светлина.Бих качила една снимка, за да видите как изглежда.
Най-вероятно, колегите ги снимат в домашни условия със статив и лампа, насочена към страниците.
Иван М.

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Иван М. »

Въпросите ми към някой запознат е "Колко пиксела на фотоапарата е оптималната разделителна способност за преснимането на една книга" и "От колко пиксела нагоре вече е безсмислено или пък затормозяващо при работата на OCR програмата"
pechkov
Мнения: 715
Регистрация: 06 април 2009, 21:39
Местонахождение: Монтана

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от pechkov »

Иван М. написа:... "Колко пиксела на фотоапарата е оптималната разделителна способност за преснимането на една книга" и "От колко пиксела нагоре вече е безсмислено или пък затормозяващо при работата на OCR програмата"
Лично мнение:

Здравословния минимум е 6 Mpix при заснемане на страница формат "А5". Ще стане и за "А4", но е компромис. Безмислен максимум все още не е постигнат при фотоапаратите. За нормален OCR е нужно изображението да е поне 300 точки на инч. Но мегапикселите на фотоапаратите са представени като произведение на пикселите по вертикал и хоризонтал.

Една кратка сметка: фотоапарат с 6 мегапиксела дава размер на изображението да кажем 2816х2112 пиксела (Sony DHC-H2). Страница формат "А5" е с размер 210х149 мм, което ще рече 8.26х5.86 инча. Или с 6 Mpix заснемайки такава страница ще получим разделителна способност 340 пиксела на инч (в случай, че при заснемането се прави запълване на целия кадър).

Ако фотоапарата е 13 мегапиксела, тогава изображението ще е с например 4128х3096 пиксела (Samsung Galaxy S4), и при същия размер на страницата получената разделителна способност ще е 510 пиксела на инч. Т.е. броя на пикселите е увеличен повече от два пъти, но разделителната способност се е увеличила само с 66%. И при още по-голямо увеличаване на мегапикселите - тази разлика в съотношението ще става още по-голяма.

При фотоапаратите има обаче други условности, които могат да съсипят снимките - първата е качеството на обектива. Колкото и хубава матрица да сложат зад калпав обектив - винаги ще се получава и скапана снимка. Скъпите обективи би могло да са направени калпаво, но евтините обективи няма как да бъдат качествени. А за качествен обектив си трябва оптично стъкло и да е изчислен добре. Производителите на фотоапарати се стремят да направят обективите да могат да работят с голям диапазон на фокусното разстояние, което създава компромиси. Особено при цветни снимки лошо изчисления обектив може да даде голяма хроматична аберация в периферията на снимката, а ако приближиш много фотоапарата до обекта, който снимаш - се получава и изкривяване тип "рибешко око". Постановката за снимане е от жизнено важно значение за качеството. На фотоапаратите им трябва светлина. Много светлина и колкото може по-равномерна, като при все това - трябва да се избягват отблясъците. При слаба светлина апарата ще увеличи времето за експониране и/или чувствителността (ISO-то), и се появява цветен шум и/или размазване на кадъра. Нормалната дистанция за снимане на страници е около 60-70 см, и за да няма загуба на мегапиксели - е нужно обектива на фотоапарата да има оптично увеличение (zoom) до запълване на кадъра, но цифровото приближаване не трябва да се ползва. Цифровия zoom е интерполация на изображението от центъра на кадъра, т.е. оригинала е по-малко мегапиксели, и е увеличен по софтуерен път, което можем да го правим и в компютъра ако потрябва, и то с по-хубав софтуер.

На практика - с много фотоапарати може да се прави заснемане с цел OCR, но си трябва "чалъм" за да става хубаво. Иначе просто ще има повече работа по корекцията на текста след OCR-ването, и при много лош резултат - просто се обезсмисля труда.
Когато инженерите конструират нещо дуракоустойчиво - тогава дураците стават по-изобретателни.
Иван М.

Re: Съвети за "сканиране" с цифров фотоапарат

Мнение от Иван М. »

Благодаря за изчерпателният отговор
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: 0 гости