Страница 1 от 2

Технически въпроси

Пуснато: 08 август 2006, 10:02
от Гост
Зрдавейте,

това което според мене липсва е раздела 'направи си сам' или 'полезни съвети', т.е. информация отностно въпроса "как". Идеята ми е, че някой хора имат голям опит в сканирането и ОСР и би било полезно да го споделят с другите, които 'искат, но не могат' ;-) аз например срещнах доста затруднения в тази област и още се чудя каква техника (и какви настройки) правите за успешното сканиране от книжен носител?? По-напред с матеряла съм в 'обратната' област, т.е. преминаването от електронен в хартиен вид на книгата. Обаче знанията в тази област трупах бавно и трудно - не намерих в нета подходящо ръководство (но затова пък намерих 2 книги на руски език по въпроса). С удоволствие ще споделя знанията си за текниката за изработване на книга в домашни условия, стига да ви интересува.

Та това са двете теми, които смятам че липсват и с радост бих обменял опит и знания.

Пуснато: 15 октомври 2006, 21:24
от kuyvliev
Да и аз смятам че малко помощ няма да е излишна на начинаещите.

Ето какъв проблем имам аз.
Сканирам , разпознавам и накрая като дам съхраняване ми излизат или квадрати или въпросителни (в зависимост дали съхранявам в Word или Notepad) вместо текст.
Използвам ABBYY Fine Reader 8.0
Въпроса ми е какво е необходимо да направя за да изчезне този проблем.

Пуснато: 16 октомври 2006, 09:22
от Mandor
Първите версии на Fine Reader 8 имаха проблем с експорта на кирилица, затова в мрежата обикаляха patch-ове за тях. По-новите (отпреди няколко месеца) вече са коригирани. Вероятно си попаднал на някоя от по-старите версии.

Пуснато: 16 октомври 2006, 14:10
от нт
Привет!

Аз ползвам версия 8.0 build 8.0.0.706 и се справя отлично.
Възможно е проблема да идва и от кирилизацията на системата ти. Ползването на кирилизатори от типа на FlexType е опасно! Виж сайта на ИнжИнера по случая http://injinera.bgplus.com/dloadmnu.htm

От FineReadera експортвам в txt - windows 1251 или UTF-8
След това конвертирам в каквото си искам кодиране с EditPad Lite http://www.editpadpro.com/editpadlite.html Също там замествам излишните интервали с единичен и преглеждам с бърз search за изостанали от сканирането пренесени думи. Финално пускам още един spellcheck в Word с ItaEst http://www.bacl.org/itaestbg.html

Успех!
НТ

Пуснато: 18 октомври 2006, 00:32
от Гост
Версията която се опитвам :lol: да ползвам е 8.0.0.731

Следвайки съветите ви реших да разкарам флекстайпа. За по сигурно преинсталирах уина и сега не мога да активирам ABBYY. Проблема е че не мога да видя инсталационното ID. Имам чуство че програмата "знае" че се регистрира за втори път на компютъра и иска направо активиращия код.

Пуснато: 18 октомври 2006, 11:36
от нт
Съжалявам за усложненията :(

Моята версия, изтеглена от е-муле има сериен номер и пач, но на пача пише изрично, че е за този билд, така че не смея да го предлагам, а и мина вече доста време откак съм я инсталирал, та не мога да си спомня точната процедура по излекуването...

Windows-ът на чисто ли го качи? Ако е на чисто, значи в registry не може да е изостанало нещо.
Може да е останала обаче папката с предишната инсталация в Program Files. Може там да има някакво инфо за предна инсталация. Трябва и нея да я махнеш най-вероятно преди да инсталираш наново. Също, виждам го че пише и в C:\Documents and Settings\xxxxxx\Application Data\ABBYY\FineReader\8.00 (xxxxxx е юзер акаунта)

Евентуално може да пуснеш някой Regitry Cleaner, макар често да вършат поразии.
Аз обикновено след чиста инсталация на Уин-а + драйверите правя имидж на С: с Norton Ghost-a, че да не губя после време, ако нещо тръгне накриво. После още един имидж след като накачуля основните програми и ги наглася... Възстановяването до кое да е състояние после отнема около 5 минути само.

нт

Пуснато: 18 октомври 2006, 14:53
от goblin
Гост написа:... преинсталирах уина и сега не мога да активирам ABBYY...
Не се притеснявай, това е нормално. При нов Windows и дори при промяна на хардуера FineReader губи регистрацията и трябва да се преинсталира :(.
За другото - дай един имейл на ЛС. :twisted: (Май за целта ще трябва да се регистрираш във форума).

Пуснато: 18 октомври 2006, 16:28
от hammster
Аз имам и друга идея. Ако ползваш торенти, ще ти кача моя ABBYY (версия 8.0.0.779) като торент на някой български тракер, който е без регистрация. Аз се оправих с инсталацията, защото в архива имаше изключително подробен текстови файл на чист български коя стъпка след коя следва. Така че, ако я искаш драсни тук един коментар, а аз ще ти пратя на ЛС-то URL-а от къде да я изтеглиш. Но за да ползваш ЛС трябва да се регистрираш във форума, както споменава goblin.

Пуснато: 18 октомври 2006, 19:05
от kuyvliev
Благодаря за помощта. Всъщност съм регистриран просто не съм се логнал при предното мнение. Мейла ми е kuvliev при mail.bg

Програмата е страшна не само че преинсталирах уина но и свалих абито отново като дадох друго име и мейл за да ми пратят линк (свалях го от сайта на абби) даже си смених айпито :lol: и пак не ми мина номера да го подкарам повторно. Може би трябваше да сменя и името на компютъра. :lol:

И все пак да попитам отново за да не се окаже че всички проблеми са ми от собствено недоглеждане. Къде пише как е инсталационното ID? При първата инсталация на програмата го намерих бързо и лесно но не запомних къде, затова сега имам чуство че просто нещо липсва защото програмата разпознава машината.

За торентите също не бих отказал така че давай линк. Аз търсих първо в линкос ама нямаше нищо затова се насочих към сайта на абби.

Пуснато: 18 октомври 2006, 19:28
от hammster
Пратих ти адреса на тракера където съм го качил, като ЛС. Дано инсталацията протече гладко. Успех.

Пуснато: 18 октомври 2006, 21:41
от kuyvliev
Благодаря на всички които помогнаха.
Инсталацията беше успешна.
Почвам да разучавам опциите.

Пуснато: 18 октомври 2006, 21:54
от hammster
Надявам се да видя и твоето име в раздел "Сканиране" :D.

Пуснато: 19 октомври 2006, 13:59
от kuyvliev
Има ли значение резолюцията с която сканираме 300 или 600? С по голяма резолюция по малко грешки ли има при разпознаването?
аз лично не намирам разлика. Даже пробвах с 1200 но е безсмислено бавно.

Пуснато: 19 октомври 2006, 15:01
от нт
300! нито точка повече или по-малко.

ако имаш опит с фотошоп - превърти картинките с екшън image> adjust> threshold и после image> mode > bitmap. тогава импорта в рийдъра става мълниеносно. но и инак е ок.

аз установих, че ако скенерът е бърз, много по-добре става да се сканира по една страница, така че сгъвката на книгата да е перпендикулярно на движението на лампата. тогава шейната не хвърля сянка в сгъвката и разпознаването е без почти каквито и да е грешки. когато сканираш разгъвка от две страници в средата се получава сянка, която после може да доведе до проблеми при разчитането.

нт

Пуснато: 19 октомври 2006, 16:52
от kuyvliev
С фотошоп никога не съм работил но явно ще почна. Скенера не е от най бързите и досега сканирах по две страници на 600 но ще пробвам както казваш. Засега всичко върви отчайващо бавно но това явно е защото и тук както във всяко нещо си има трикове а аз не съм запознат.

Пуснато: 20 октомври 2006, 00:20
от нт
сетих се още нещо, което съм пропуснал да ти кажа.

сканирай черно-бяло - по-бързо става, а от цветно няма смисъл. в настройките на скенера това обикновено се нарича b/w photo или greyscale 8-bit.
опитай също така и с b/w document и различни настройки при сканирането - това може да направи още по-лесен импорта в рийдъра. зависи дали ще бъде достатъчно четимо.

винаги на 300 dpi, без каквито и да е филтри от скенера (като anti-moire, descreen, sharpen, etc.), които също бавят. 30 - 50 секунди на страница трябва да е нормално за сканирането. нека и други да кажат.

аз извършвам различни манипулации по сканираните страници във фотошоп, особено за стари и пожълтели книги, с цел да ги направя максимално контрастни, но на мен професията ми е да се занимавам с изображения, така че тази част ми е известна от много години и ми беше най-лесната...

извинявай, че така на час по лъжичка. много се изморявам от работа през седмицата и се сещам на парче за нещата...

Пуснато: 21 октомври 2006, 16:21
от kuyvliev
Благодаря за напътствията. Дори и на час по лъжичка пак са полезни. :)

Пуснато: 08 януари 2007, 19:29
от eeka
едно много полезно и същевременно елементарно нещо, което спомага много за намаляване на грешките при разпознаване е brightness - с увеличаване на brightnessa на картинката още при сканирането много от дребните дефекти по страницата и също прозиращия текст от обратната страна на листа се изличават, но естествено трябва да се намери баланс със самия текст, защото не всички страници са отпечатани с еднаква яркост - има някои много бледи страници, които няма да се разчитат ако яркостта е увеличена много.
това е комай единствената настройка, която барам аз освен стандартните 300дпи и черно/бяло изображение.
ако някой знае други "трикове", които да спомогнат за по-доброто разпознаване моля да споделят...

Пуснато: 25 февруари 2007, 06:33
от MikoBG
Да се закача и аз в тази тема.
Повече от една година влизам тук, но сега реших да се включа. Като помощник де.:oops: Имам добра камера и статив. Прочетох повечето теми тук. Намерих FineReader 8 и го инсталирах. Тествах го с документи на латиница и всичко бе чудесно. И когато реших да започна с една кримка на български - проблем ! :evil:
След разчитането и корекциите, в готовите файлове само питанки "?" или квадратчета!!! :evil:. Но на екрана в програмата всичко си е ок!
Никога не съм качвал Флекс. FineReader-а съм лекувал по правилата - с латински документи работи без грешка.
Пуснах да излиза в PDF - изплака, че нещо в шрифтовете липсвало и може да има символи, които няма да се покажат.
Пуснах го в ТХТ и отворих с шестнайсетичен редактор - вътре си е са мо питанки :roll:.
Нямам опит с шрифтове. Погледнах на Windows папка fonts и не намерих там кирилски букви. Може и да си ги има, но нали ви казвам, нямам опит. Пък другите програми от къде ги теглят тия букви?
Потърсих в нета, но за сега не намерих нищичко.
Така както е казал шопа "седя и си мисля ..., и изведнъж само си седя без да мисля"
Та ако може ударете едно рамо. :? :oops:

Пуснато: 25 февруари 2007, 12:23
от nlr
Имаш ЛС.

Пуснато: 25 февруари 2007, 13:29
от MikoBG
nlr написа:Имаш ЛС.
Благодаря за съдействието и отзивчивоста! :D :D :D

Време е да запретваме ръкави! :)

Пуснато: 20 март 2007, 16:48
от nqgolova
Отказа ми Fine Skan Manager.Не мога да сканирам.Някой да има представа как може да се оправи проблема?

Въпрос

Пуснато: 16 декември 2009, 23:24
от Michelle
Добре де, аз искам да попитам как сканирате книга, която е дебела да речем 300 страници. Като се стигне до средата скенера не сканира добре текста който е към средата на книгата. И също така от дебелата книга капакът на скенера не се затваря! Как се справяте с това. Според мен единствения вариант е да се разпърца книгата и така да се сканира лист по лист :)

Пуснато: 16 декември 2009, 23:41
от MBB
Много лесно - натискаш с ръчичка като внимаваш да не повредиш скенера(както стана при мен) и не затваряш капака.
После това дето не се е сканирало и разпознало го редактираш на ръка.
Теб кой те е излъгал че OCR-а е лесно и бързо?

Пуснато: 29 декември 2009, 21:35
от mIRCata
Каква е обичайната практика при сканирането - страниците една по една или две наведнъж?
Че смятам да сканирам Малазанската книга, а ще го правя за първи път. Кое е по-лесно за обработване после?

Пуснато: 30 декември 2009, 00:03
от piki
2-те наведнъж... Finereader си има опция за автоматично разделяне на страниците.

Пуснато: 30 декември 2009, 23:15
от Endymion
Ако ползваш фотоапарат е по-лесно да снимаш по една страница. А и така не е нужно да разпъваш много книгата.

Пуснато: 31 декември 2009, 11:06
от mIRCata
Имам. Ама сам не мога да се справя. Трябва някой да придърпва едната страна, за да седи изпъната книгата.
Ще взема да хвана жената на работа да помага - малко ли книги изчете и тя от тук. Да помогне за общото благо :)
Ама тогава ще станат пак големи файловете и ще ме бият админите.

Пуснато: 01 януари 2010, 14:02
от piki
Така... можеш да ползваш някое стъкло от витрина. Аз си намерих такова, слагам книгата, отгоре стъклото и тежестта му изправя книгата като вестник... и така снимам. За около 3ч. преснимам 300 страници книга... сам. Само малко кръста ме заболява после, но това си зависи от поставката, върху която е книгата (в моят случай е стол).
А колкото за големината на файловете... качваш всичко като архив в някой Upload сайт (Megaupload, rapidshare etc) и слагаш линка. Примерно аз предпочитам да изтегля сканираните файлове, отколкото разпознат файл с текст... защото ми е по-лесно да редактирам докато разпознавам, а и след доста разпознаване.. Finereader-a ми се е нагодил към мен :) или аз към него и процесът става доста по-бърз.

Пуснато: 03 януари 2010, 13:42
от Mandor
piki, така е по-бавно. Щом имаш стъклена витрина, само я открехваш на 20-30 см. и пъхаш книгата зад нея (вертикално). Адски бързо е и не се занимаваш с вдигане на стъклото, прелистване, поставяне на стъклото и т.н.
За сравнене – с пълна оптимизация (статив, дистанционно управление на фотоапарата) преснимам книга от 300 стр. за около половин час.