Може ли да някой да тества OCR сканиране от снимка с телефон

Търсене и предлагане на помощ при сканиране. Теми за началната работа при цифровизацията.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
dijon
Мнения: 18
Регистрация: 11 януари 2017, 11:10

Може ли да някой да тества OCR сканиране от снимка с телефон

Мнение от dijon »

Имам желание да въведа някоя книга, да се запозная с целия процес, но най-напред искам да разбера дали подлежи за OCR текста от снимка направена с моя телефон. Да знам въобще да не се спъна още на първа стъпка. : )

https://drive.google.com/file/d/0B3-uux ... sp=sharing

Опитах с разни онлайн OCR-и, но резултата беше плачевен. Бих искал някой с инсталиран Abbyy какво ще получи.

Благодаря предварително!
~HT

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Мнение от ~HT »

След минимална обработка - аз ползвам много стар фотошоп (5), но това може да бъде автоматизирано и направено във всеки друг редактор на изображения - ето входната страница

Изображение

ABBYY се справи без всякакво затруднение, допускайки само няколко грешки долу при огъването в средата на книгата. Вероятно това може да бъде избегнато с притискане.
- А ти какъв си?
- Нали вече ти казах: богат благородник Не отговорих нищо и станах.
- Какво правиш? Отиваш ли си? - запита ме той разтревожен.
- Да, отивам си - отвърнах аз, - знаеш, че не обичам лъжите. Довиждане и приятно развлечение!
- Ама почакай, ти ме съсипваш.
- Бъди спокоен, не те съсипвам.
- Почакай, тия момичета искат да се запознаят с теб.
- А пък аз не искам.
Накратко казано, препирахме се доста, аз изправен, а той седнал. В края на краищата, понеже съм добър приятел, се съгласих да остана. Ала го предупредих:
- Не ти гарантирам, че ще поддържам лъжата ти до края.
Но той вече не ми обръщаше внимание.
- Ето ги! — възкликна зарадван.
Отначало видях само косите им. Главите и на двете приличаха на две топки, направени от къдрави, бухнали и гъсти коси. После под тия две огромни маси с мъка съзрях лицата - тънки и мършави, подобни на две птички, които се подават от гнездото. И двете бяха със стройни и кръшни тела, само бедра и гърди, с тънки кръстчета, които биха могли да се проврат през салфетник. Помислих, че са близначки, понеже бяха облечени по един и същи начин: с шотландска пола, черна плетена блуза и червени обувки; чантите им бяха също червени. Серафино стана тържествено и ни представи:
- Приятелят ми Марио, филмов продуцент, госпожица Ирис, госпожица Мимоза.
След като седнаха, ги разгледах по-добре. От особеното внимание, което Серафино проявяваше към Ирис, Разбрах, че нея е запазил за себе си, а на мен е оставил Мимоза. Не бяха близначки. Мимоза, която изглеждаме на повече от трийсет години, имаше по-мършаво я^е, по-дълъг нос, по-голяма уста и по-малко изпъкна-Ла брадичка от Ирис, и изобщо беше почти грозна. А
Трябва да се оправят тиретата и т.н., но това е директно резултата в ABBYY 8.0.0 - което също е много стара версия.

Някъде из сайта трябва да има ръководства как да си обработите изображенията, за да се минимизира потенциала за грешно разчитане. Дори и аз преди десетина години бях писал някакви неща...

Успех!
Ф р а к с с

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Мнение от Ф р а к с с »

С ABBY FineReader 12 директно от файла, без никаква предварителна обработка и без корекции след това:
тревожен.
- Да, отивам си - отвърнах аз, - знаеш, че не обичам лъжите. Довиждане и приятно развлечение!
- Ама почакай, ти ме съсипваш.
- Бъди спокоен, не те съсипвам.
- Почакай, тия момичета искат да се запознаят с теб.
- А пък аз не искам.
Накратко казано, препирахме се доста, аз изправен, а той седнал. В края на краищата, понеже съм добър приятел, се съгласих да остана. Ала го предупредих:
- Не ти гарантирам, че ще поддържам лъжата ти до края.
Но той вече не ми обръщаше внимание.
- Ето ги! — възкликна зарадван.
Отначало видях само косите им. Главите и на двете приличаха на две топки, направени от къдрави, бухнали и гъсти коси. После под тия две огромни маси с мъка съзрях лицата—тънки и мършави, подобни на две птички, които се подават от гнездото. И двете бяха със стройни и кръшни тела, само бедра и гърди, с тънки кръстчета, които биха могли да се проврат през салфетник. Помислих, че са близначки, понеже бяха облечени по един и същи начин: с шотландска пола, черна плетена блуза и червени обувки; чантите им бяха също червени. Серафино стана тържествено и ни представи:
- Приятелят ми Марио, филмов продуцент, госпожица Ирис, госпожица Мимоза.
След като седнаха, ги разгледах по-добре. От особеното внимание, което Серафино проявяваше към Ирис, разбрах, че нея е запазил за себе си, а на мен е оставил Мимоза. Не бяха близначки. Мимоза, която изглеждаше на повече от трийсет години, имаше по-мършаво лице, по-дълъг нос, по-голяма уста и по-малко изпъкнала брадичка от Ирис, и изобщо беше почти грозна. А
dijon
Мнения: 18
Регистрация: 11 януари 2017, 11:10

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Мнение от dijon »

Благодаря ви много за съдействието.

Свалих един портъбъл на 12-та версия. Кропнах снимката набързо с Paint и пуснах директно в Abbyy-то, 4-5 неразпознати символа имаше, параграфите са изместени с табулация, не с празни места, което ще спести корекция после.
А ти какъв си?
Нали вече ти казах: богат благородник.
Не отговорих нищо и станах.
Какво правиш? Отиваш ли си? - запита ме той разтревожен.
Да, отивам си - отвърнах аз, - знаеш, че не обичам лъжите. Довиждане и приятно развлечение!
Ама почакай, ти ме съсипваш.
Бъди спокоен, не те съсипвам.
Почакай, тия момичета искат да се запознаят с теб.
А пък аз не искам.
Накратко казано, препирахме се доста, аз изправен, а той седнал. В края на краищата, понеже съм добър приятел, се съгласих да остана. Ала го предупредих:
Не ти гарантирам, че ще поддържам лъжата ти до края.
Но той вече не ми обръщаше внимание.
Ето ги! - възкликна зарадван.
Отначало видях само косите им. Главите и на двете приличаха на две топки, направени от къдрави, бухнали и гъсти коси. После под тия две огромни маси с мъка съзрях лицата - тънки и мършави, подобни на две птички, които се подават от гнездото. И двете бяха със стройни и кръшни тела, само бедра и гърди, с тънки кръстчета, които биха могли да се проврат през салфетник. Помислих, че са близначки, понеже бяха облечени по един и същи начин: с шотландска пола, черна плетена блуза и червени обувки; чантите им бяха също червени. Серафино стана тържествено и ни представи:
Приятелят ми Марио, филмов продуцент, госпожица Ирис, госпожица Мимоза.
След като седнаха, ги разгледах по-добре. От особеното внимание, което Серафино проявяваше към Ирис, разбрах, че нея е запазил за себе си, а на мен е оставил Мимоза. Не бяха близначки. Мимоза, която изглеждаше на повече от трийсет години, имаше по-мършаво лице, по-дълъг нос, по-голяма уста и по-малко изпъкнала брадичка от Ирис, и изобщо беше почти грозна. А
Странно обаче, като го копирах от OpenOffice текста тук - ми изяде празните места и тиретата отпред редовете.
pechkov
Мнения: 715
Регистрация: 06 април 2009, 21:39
Местонахождение: Монтана

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Мнение от pechkov »

dijon написа:Странно обаче, като го копирах от OpenOffice текста тук - ми изяде празните места и тиретата отпред редовете.
Изобщо не е странно. Тиретата за пряка реч са били "списъчни" тирета, и затова не са се копирали. Първо трябва да ги превърнеш в текст.
Когато инженерите конструират нещо дуракоустойчиво - тогава дураците стават по-изобретателни.
dijon
Мнения: 18
Регистрация: 11 януари 2017, 11:10

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Мнение от dijon »

Да, след известно разцъкване и аз стигнах до този извод. : )

Четох малко и темите за SFB форматиране, по този начин ли ще се означат главите и съдържанието на книгата? И поясненията на думи в текста с цифрички 1-2-3 и т.н. за страниците?

И до колкото разбрах, всичко, което е готово накрая с форматиране се пуска в сайта като TXT с енкодинг UTF-8?
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: 0 гости