Страница 1 от 1

Може ли да някой да тества OCR сканиране от снимка с телефон

Пуснато: 24 август 2017, 17:55
от dijon
Имам желание да въведа някоя книга, да се запозная с целия процес, но най-напред искам да разбера дали подлежи за OCR текста от снимка направена с моя телефон. Да знам въобще да не се спъна още на първа стъпка. : )

https://drive.google.com/file/d/0B3-uux ... sp=sharing

Опитах с разни онлайн OCR-и, но резултата беше плачевен. Бих искал някой с инсталиран Abbyy какво ще получи.

Благодаря предварително!

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Пуснато: 25 август 2017, 03:21
от ~HT
След минимална обработка - аз ползвам много стар фотошоп (5), но това може да бъде автоматизирано и направено във всеки друг редактор на изображения - ето входната страница

Изображение

ABBYY се справи без всякакво затруднение, допускайки само няколко грешки долу при огъването в средата на книгата. Вероятно това може да бъде избегнато с притискане.
- А ти какъв си?
- Нали вече ти казах: богат благородник Не отговорих нищо и станах.
- Какво правиш? Отиваш ли си? - запита ме той разтревожен.
- Да, отивам си - отвърнах аз, - знаеш, че не обичам лъжите. Довиждане и приятно развлечение!
- Ама почакай, ти ме съсипваш.
- Бъди спокоен, не те съсипвам.
- Почакай, тия момичета искат да се запознаят с теб.
- А пък аз не искам.
Накратко казано, препирахме се доста, аз изправен, а той седнал. В края на краищата, понеже съм добър приятел, се съгласих да остана. Ала го предупредих:
- Не ти гарантирам, че ще поддържам лъжата ти до края.
Но той вече не ми обръщаше внимание.
- Ето ги! — възкликна зарадван.
Отначало видях само косите им. Главите и на двете приличаха на две топки, направени от къдрави, бухнали и гъсти коси. После под тия две огромни маси с мъка съзрях лицата - тънки и мършави, подобни на две птички, които се подават от гнездото. И двете бяха със стройни и кръшни тела, само бедра и гърди, с тънки кръстчета, които биха могли да се проврат през салфетник. Помислих, че са близначки, понеже бяха облечени по един и същи начин: с шотландска пола, черна плетена блуза и червени обувки; чантите им бяха също червени. Серафино стана тържествено и ни представи:
- Приятелят ми Марио, филмов продуцент, госпожица Ирис, госпожица Мимоза.
След като седнаха, ги разгледах по-добре. От особеното внимание, което Серафино проявяваше към Ирис, Разбрах, че нея е запазил за себе си, а на мен е оставил Мимоза. Не бяха близначки. Мимоза, която изглеждаме на повече от трийсет години, имаше по-мършаво я^е, по-дълъг нос, по-голяма уста и по-малко изпъкна-Ла брадичка от Ирис, и изобщо беше почти грозна. А
Трябва да се оправят тиретата и т.н., но това е директно резултата в ABBYY 8.0.0 - което също е много стара версия.

Някъде из сайта трябва да има ръководства как да си обработите изображенията, за да се минимизира потенциала за грешно разчитане. Дори и аз преди десетина години бях писал някакви неща...

Успех!

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Пуснато: 25 август 2017, 05:20
от Ф р а к с с
С ABBY FineReader 12 директно от файла, без никаква предварителна обработка и без корекции след това:
тревожен.
- Да, отивам си - отвърнах аз, - знаеш, че не обичам лъжите. Довиждане и приятно развлечение!
- Ама почакай, ти ме съсипваш.
- Бъди спокоен, не те съсипвам.
- Почакай, тия момичета искат да се запознаят с теб.
- А пък аз не искам.
Накратко казано, препирахме се доста, аз изправен, а той седнал. В края на краищата, понеже съм добър приятел, се съгласих да остана. Ала го предупредих:
- Не ти гарантирам, че ще поддържам лъжата ти до края.
Но той вече не ми обръщаше внимание.
- Ето ги! — възкликна зарадван.
Отначало видях само косите им. Главите и на двете приличаха на две топки, направени от къдрави, бухнали и гъсти коси. После под тия две огромни маси с мъка съзрях лицата—тънки и мършави, подобни на две птички, които се подават от гнездото. И двете бяха със стройни и кръшни тела, само бедра и гърди, с тънки кръстчета, които биха могли да се проврат през салфетник. Помислих, че са близначки, понеже бяха облечени по един и същи начин: с шотландска пола, черна плетена блуза и червени обувки; чантите им бяха също червени. Серафино стана тържествено и ни представи:
- Приятелят ми Марио, филмов продуцент, госпожица Ирис, госпожица Мимоза.
След като седнаха, ги разгледах по-добре. От особеното внимание, което Серафино проявяваше към Ирис, разбрах, че нея е запазил за себе си, а на мен е оставил Мимоза. Не бяха близначки. Мимоза, която изглеждаше на повече от трийсет години, имаше по-мършаво лице, по-дълъг нос, по-голяма уста и по-малко изпъкнала брадичка от Ирис, и изобщо беше почти грозна. А

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Пуснато: 25 август 2017, 10:34
от dijon
Благодаря ви много за съдействието.

Свалих един портъбъл на 12-та версия. Кропнах снимката набързо с Paint и пуснах директно в Abbyy-то, 4-5 неразпознати символа имаше, параграфите са изместени с табулация, не с празни места, което ще спести корекция после.
А ти какъв си?
Нали вече ти казах: богат благородник.
Не отговорих нищо и станах.
Какво правиш? Отиваш ли си? - запита ме той разтревожен.
Да, отивам си - отвърнах аз, - знаеш, че не обичам лъжите. Довиждане и приятно развлечение!
Ама почакай, ти ме съсипваш.
Бъди спокоен, не те съсипвам.
Почакай, тия момичета искат да се запознаят с теб.
А пък аз не искам.
Накратко казано, препирахме се доста, аз изправен, а той седнал. В края на краищата, понеже съм добър приятел, се съгласих да остана. Ала го предупредих:
Не ти гарантирам, че ще поддържам лъжата ти до края.
Но той вече не ми обръщаше внимание.
Ето ги! - възкликна зарадван.
Отначало видях само косите им. Главите и на двете приличаха на две топки, направени от къдрави, бухнали и гъсти коси. После под тия две огромни маси с мъка съзрях лицата - тънки и мършави, подобни на две птички, които се подават от гнездото. И двете бяха със стройни и кръшни тела, само бедра и гърди, с тънки кръстчета, които биха могли да се проврат през салфетник. Помислих, че са близначки, понеже бяха облечени по един и същи начин: с шотландска пола, черна плетена блуза и червени обувки; чантите им бяха също червени. Серафино стана тържествено и ни представи:
Приятелят ми Марио, филмов продуцент, госпожица Ирис, госпожица Мимоза.
След като седнаха, ги разгледах по-добре. От особеното внимание, което Серафино проявяваше към Ирис, разбрах, че нея е запазил за себе си, а на мен е оставил Мимоза. Не бяха близначки. Мимоза, която изглеждаше на повече от трийсет години, имаше по-мършаво лице, по-дълъг нос, по-голяма уста и по-малко изпъкнала брадичка от Ирис, и изобщо беше почти грозна. А
Странно обаче, като го копирах от OpenOffice текста тук - ми изяде празните места и тиретата отпред редовете.

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Пуснато: 25 август 2017, 11:22
от pechkov
dijon написа:Странно обаче, като го копирах от OpenOffice текста тук - ми изяде празните места и тиретата отпред редовете.
Изобщо не е странно. Тиретата за пряка реч са били "списъчни" тирета, и затова не са се копирали. Първо трябва да ги превърнеш в текст.

Re: Може ли да някой да тества OCR сканиране от снимка с телефон

Пуснато: 25 август 2017, 11:52
от dijon
Да, след известно разцъкване и аз стигнах до този извод. : )

Четох малко и темите за SFB форматиране, по този начин ли ще се означат главите и съдържанието на книгата? И поясненията на думи в текста с цифрички 1-2-3 и т.н. за страниците?

И до колкото разбрах, всичко, което е готово накрая с форматиране се пуска в сайта като TXT с енкодинг UTF-8?