Технически въпроси

Търсене и предлагане на помощ при сканиране. Теми за началната работа при цифровизацията.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Гост

Технически въпроси

Мнение от Гост »

Зрдавейте,

това което според мене липсва е раздела 'направи си сам' или 'полезни съвети', т.е. информация отностно въпроса "как". Идеята ми е, че някой хора имат голям опит в сканирането и ОСР и би било полезно да го споделят с другите, които 'искат, но не могат' ;-) аз например срещнах доста затруднения в тази област и още се чудя каква техника (и какви настройки) правите за успешното сканиране от книжен носител?? По-напред с матеряла съм в 'обратната' област, т.е. преминаването от електронен в хартиен вид на книгата. Обаче знанията в тази област трупах бавно и трудно - не намерих в нета подходящо ръководство (но затова пък намерих 2 книги на руски език по въпроса). С удоволствие ще споделя знанията си за текниката за изработване на книга в домашни условия, стига да ви интересува.

Та това са двете теми, които смятам че липсват и с радост бих обменял опит и знания.
kuyvliev
Мнения: 23
Регистрация: 22 юли 2006, 01:30
Местонахождение: София
Връзка:

Мнение от kuyvliev »

Да и аз смятам че малко помощ няма да е излишна на начинаещите.

Ето какъв проблем имам аз.
Сканирам , разпознавам и накрая като дам съхраняване ми излизат или квадрати или въпросителни (в зависимост дали съхранявам в Word или Notepad) вместо текст.
Използвам ABBYY Fine Reader 8.0
Въпроса ми е какво е необходимо да направя за да изчезне този проблем.
[url=http://www.save-darina.org][img]http://www.gozba.org/baner/save-darina/468_60_banner02.gif[/img][/url]

[url=http://www.erepublik.com/bg/referrer/kuyvliev][img]http://erepublik.com/images/badges/erepublik-badge-80x15.gif[/img][/url]
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Мнение от Mandor »

Първите версии на Fine Reader 8 имаха проблем с експорта на кирилица, затова в мрежата обикаляха patch-ове за тях. По-новите (отпреди няколко месеца) вече са коригирани. Вероятно си попаднал на някоя от по-старите версии.
Аватар
нт
Мнения: 176
Регистрация: 04 февруари 2007, 01:53

Мнение от нт »

Привет!

Аз ползвам версия 8.0 build 8.0.0.706 и се справя отлично.
Възможно е проблема да идва и от кирилизацията на системата ти. Ползването на кирилизатори от типа на FlexType е опасно! Виж сайта на ИнжИнера по случая http://injinera.bgplus.com/dloadmnu.htm

От FineReadera експортвам в txt - windows 1251 или UTF-8
След това конвертирам в каквото си искам кодиране с EditPad Lite http://www.editpadpro.com/editpadlite.html Също там замествам излишните интервали с единичен и преглеждам с бърз search за изостанали от сканирането пренесени думи. Финално пускам още един spellcheck в Word с ItaEst http://www.bacl.org/itaestbg.html

Успех!
НТ
Гост

Мнение от Гост »

Версията която се опитвам :lol: да ползвам е 8.0.0.731

Следвайки съветите ви реших да разкарам флекстайпа. За по сигурно преинсталирах уина и сега не мога да активирам ABBYY. Проблема е че не мога да видя инсталационното ID. Имам чуство че програмата "знае" че се регистрира за втори път на компютъра и иска направо активиращия код.
Аватар
нт
Мнения: 176
Регистрация: 04 февруари 2007, 01:53

Мнение от нт »

Съжалявам за усложненията :(

Моята версия, изтеглена от е-муле има сериен номер и пач, но на пача пише изрично, че е за този билд, така че не смея да го предлагам, а и мина вече доста време откак съм я инсталирал, та не мога да си спомня точната процедура по излекуването...

Windows-ът на чисто ли го качи? Ако е на чисто, значи в registry не може да е изостанало нещо.
Може да е останала обаче папката с предишната инсталация в Program Files. Може там да има някакво инфо за предна инсталация. Трябва и нея да я махнеш най-вероятно преди да инсталираш наново. Също, виждам го че пише и в C:\Documents and Settings\xxxxxx\Application Data\ABBYY\FineReader\8.00 (xxxxxx е юзер акаунта)

Евентуално може да пуснеш някой Regitry Cleaner, макар често да вършат поразии.
Аз обикновено след чиста инсталация на Уин-а + драйверите правя имидж на С: с Norton Ghost-a, че да не губя после време, ако нещо тръгне накриво. После още един имидж след като накачуля основните програми и ги наглася... Възстановяването до кое да е състояние после отнема около 5 минути само.

нт
Аватар
goblin
Мнения: 54
Регистрация: 20 август 2006, 17:18

Мнение от goblin »

Гост написа:... преинсталирах уина и сега не мога да активирам ABBYY...
Не се притеснявай, това е нормално. При нов Windows и дори при промяна на хардуера FineReader губи регистрацията и трябва да се преинсталира :(.
За другото - дай един имейл на ЛС. :twisted: (Май за целта ще трябва да се регистрираш във форума).
Аватар
hammster
Мнения: 79
Регистрация: 08 юли 2006, 20:24
Местонахождение: София
Връзка:

Мнение от hammster »

Аз имам и друга идея. Ако ползваш торенти, ще ти кача моя ABBYY (версия 8.0.0.779) като торент на някой български тракер, който е без регистрация. Аз се оправих с инсталацията, защото в архива имаше изключително подробен текстови файл на чист български коя стъпка след коя следва. Така че, ако я искаш драсни тук един коментар, а аз ще ти пратя на ЛС-то URL-а от къде да я изтеглиш. Но за да ползваш ЛС трябва да се регистрираш във форума, както споменава goblin.
kuyvliev
Мнения: 23
Регистрация: 22 юли 2006, 01:30
Местонахождение: София
Връзка:

Мнение от kuyvliev »

Благодаря за помощта. Всъщност съм регистриран просто не съм се логнал при предното мнение. Мейла ми е kuvliev при mail.bg

Програмата е страшна не само че преинсталирах уина но и свалих абито отново като дадох друго име и мейл за да ми пратят линк (свалях го от сайта на абби) даже си смених айпито :lol: и пак не ми мина номера да го подкарам повторно. Може би трябваше да сменя и името на компютъра. :lol:

И все пак да попитам отново за да не се окаже че всички проблеми са ми от собствено недоглеждане. Къде пише как е инсталационното ID? При първата инсталация на програмата го намерих бързо и лесно но не запомних къде, затова сега имам чуство че просто нещо липсва защото програмата разпознава машината.

За торентите също не бих отказал така че давай линк. Аз търсих първо в линкос ама нямаше нищо затова се насочих към сайта на абби.
[url=http://www.save-darina.org][img]http://www.gozba.org/baner/save-darina/468_60_banner02.gif[/img][/url]

[url=http://www.erepublik.com/bg/referrer/kuyvliev][img]http://erepublik.com/images/badges/erepublik-badge-80x15.gif[/img][/url]
Аватар
hammster
Мнения: 79
Регистрация: 08 юли 2006, 20:24
Местонахождение: София
Връзка:

Мнение от hammster »

Пратих ти адреса на тракера където съм го качил, като ЛС. Дано инсталацията протече гладко. Успех.
kuyvliev
Мнения: 23
Регистрация: 22 юли 2006, 01:30
Местонахождение: София
Връзка:

Мнение от kuyvliev »

Благодаря на всички които помогнаха.
Инсталацията беше успешна.
Почвам да разучавам опциите.
[url=http://www.save-darina.org][img]http://www.gozba.org/baner/save-darina/468_60_banner02.gif[/img][/url]

[url=http://www.erepublik.com/bg/referrer/kuyvliev][img]http://erepublik.com/images/badges/erepublik-badge-80x15.gif[/img][/url]
Аватар
hammster
Мнения: 79
Регистрация: 08 юли 2006, 20:24
Местонахождение: София
Връзка:

Мнение от hammster »

Надявам се да видя и твоето име в раздел "Сканиране" :D.
kuyvliev
Мнения: 23
Регистрация: 22 юли 2006, 01:30
Местонахождение: София
Връзка:

Мнение от kuyvliev »

Има ли значение резолюцията с която сканираме 300 или 600? С по голяма резолюция по малко грешки ли има при разпознаването?
аз лично не намирам разлика. Даже пробвах с 1200 но е безсмислено бавно.
[url=http://www.save-darina.org][img]http://www.gozba.org/baner/save-darina/468_60_banner02.gif[/img][/url]

[url=http://www.erepublik.com/bg/referrer/kuyvliev][img]http://erepublik.com/images/badges/erepublik-badge-80x15.gif[/img][/url]
Аватар
нт
Мнения: 176
Регистрация: 04 февруари 2007, 01:53

Мнение от нт »

300! нито точка повече или по-малко.

ако имаш опит с фотошоп - превърти картинките с екшън image> adjust> threshold и после image> mode > bitmap. тогава импорта в рийдъра става мълниеносно. но и инак е ок.

аз установих, че ако скенерът е бърз, много по-добре става да се сканира по една страница, така че сгъвката на книгата да е перпендикулярно на движението на лампата. тогава шейната не хвърля сянка в сгъвката и разпознаването е без почти каквито и да е грешки. когато сканираш разгъвка от две страници в средата се получава сянка, която после може да доведе до проблеми при разчитането.

нт
kuyvliev
Мнения: 23
Регистрация: 22 юли 2006, 01:30
Местонахождение: София
Връзка:

Мнение от kuyvliev »

С фотошоп никога не съм работил но явно ще почна. Скенера не е от най бързите и досега сканирах по две страници на 600 но ще пробвам както казваш. Засега всичко върви отчайващо бавно но това явно е защото и тук както във всяко нещо си има трикове а аз не съм запознат.
[url=http://www.save-darina.org][img]http://www.gozba.org/baner/save-darina/468_60_banner02.gif[/img][/url]

[url=http://www.erepublik.com/bg/referrer/kuyvliev][img]http://erepublik.com/images/badges/erepublik-badge-80x15.gif[/img][/url]
Аватар
нт
Мнения: 176
Регистрация: 04 февруари 2007, 01:53

Мнение от нт »

сетих се още нещо, което съм пропуснал да ти кажа.

сканирай черно-бяло - по-бързо става, а от цветно няма смисъл. в настройките на скенера това обикновено се нарича b/w photo или greyscale 8-bit.
опитай също така и с b/w document и различни настройки при сканирането - това може да направи още по-лесен импорта в рийдъра. зависи дали ще бъде достатъчно четимо.

винаги на 300 dpi, без каквито и да е филтри от скенера (като anti-moire, descreen, sharpen, etc.), които също бавят. 30 - 50 секунди на страница трябва да е нормално за сканирането. нека и други да кажат.

аз извършвам различни манипулации по сканираните страници във фотошоп, особено за стари и пожълтели книги, с цел да ги направя максимално контрастни, но на мен професията ми е да се занимавам с изображения, така че тази част ми е известна от много години и ми беше най-лесната...

извинявай, че така на час по лъжичка. много се изморявам от работа през седмицата и се сещам на парче за нещата...
kuyvliev
Мнения: 23
Регистрация: 22 юли 2006, 01:30
Местонахождение: София
Връзка:

Мнение от kuyvliev »

Благодаря за напътствията. Дори и на час по лъжичка пак са полезни. :)
[url=http://www.save-darina.org][img]http://www.gozba.org/baner/save-darina/468_60_banner02.gif[/img][/url]

[url=http://www.erepublik.com/bg/referrer/kuyvliev][img]http://erepublik.com/images/badges/erepublik-badge-80x15.gif[/img][/url]
eeka

Мнение от eeka »

едно много полезно и същевременно елементарно нещо, което спомага много за намаляване на грешките при разпознаване е brightness - с увеличаване на brightnessa на картинката още при сканирането много от дребните дефекти по страницата и също прозиращия текст от обратната страна на листа се изличават, но естествено трябва да се намери баланс със самия текст, защото не всички страници са отпечатани с еднаква яркост - има някои много бледи страници, които няма да се разчитат ако яркостта е увеличена много.
това е комай единствената настройка, която барам аз освен стандартните 300дпи и черно/бяло изображение.
ако някой знае други "трикове", които да спомогнат за по-доброто разпознаване моля да споделят...
Аватар
MikoBG
Мнения: 64
Регистрация: 13 февруари 2007, 02:30

Мнение от MikoBG »

Да се закача и аз в тази тема.
Повече от една година влизам тук, но сега реших да се включа. Като помощник де.:oops: Имам добра камера и статив. Прочетох повечето теми тук. Намерих FineReader 8 и го инсталирах. Тествах го с документи на латиница и всичко бе чудесно. И когато реших да започна с една кримка на български - проблем ! :evil:
След разчитането и корекциите, в готовите файлове само питанки "?" или квадратчета!!! :evil:. Но на екрана в програмата всичко си е ок!
Никога не съм качвал Флекс. FineReader-а съм лекувал по правилата - с латински документи работи без грешка.
Пуснах да излиза в PDF - изплака, че нещо в шрифтовете липсвало и може да има символи, които няма да се покажат.
Пуснах го в ТХТ и отворих с шестнайсетичен редактор - вътре си е са мо питанки :roll:.
Нямам опит с шрифтове. Погледнах на Windows папка fonts и не намерих там кирилски букви. Може и да си ги има, но нали ви казвам, нямам опит. Пък другите програми от къде ги теглят тия букви?
Потърсих в нета, но за сега не намерих нищичко.
Така както е казал шопа "седя и си мисля ..., и изведнъж само си седя без да мисля"
Та ако може ударете едно рамо. :? :oops:
nlr
Мнения: 63
Регистрация: 29 декември 2006, 15:06
Местонахождение: Варна

Мнение от nlr »

Имаш ЛС.
Аватар
MikoBG
Мнения: 64
Регистрация: 13 февруари 2007, 02:30

Мнение от MikoBG »

nlr написа:Имаш ЛС.
Благодаря за съдействието и отзивчивоста! :D :D :D

Време е да запретваме ръкави! :)
Аватар
nqgolova
Мнения: 63
Регистрация: 15 август 2006, 17:47
Връзка:

Мнение от nqgolova »

Отказа ми Fine Skan Manager.Не мога да сканирам.Някой да има представа как може да се оправи проблема?
Michelle

Въпрос

Мнение от Michelle »

Добре де, аз искам да попитам как сканирате книга, която е дебела да речем 300 страници. Като се стигне до средата скенера не сканира добре текста който е към средата на книгата. И също така от дебелата книга капакът на скенера не се затваря! Как се справяте с това. Според мен единствения вариант е да се разпърца книгата и така да се сканира лист по лист :)
MBB

Мнение от MBB »

Много лесно - натискаш с ръчичка като внимаваш да не повредиш скенера(както стана при мен) и не затваряш капака.
После това дето не се е сканирало и разпознало го редактираш на ръка.
Теб кой те е излъгал че OCR-а е лесно и бързо?
mIRCata
Мнения: 58
Регистрация: 19 ноември 2009, 22:59

Мнение от mIRCata »

Каква е обичайната практика при сканирането - страниците една по една или две наведнъж?
Че смятам да сканирам Малазанската книга, а ще го правя за първи път. Кое е по-лесно за обработване после?
piki
Мнения: 65
Регистрация: 08 септември 2007, 11:35

Мнение от piki »

2-те наведнъж... Finereader си има опция за автоматично разделяне на страниците.
Endymion
Мнения: 101
Регистрация: 05 септември 2008, 12:39

Мнение от Endymion »

Ако ползваш фотоапарат е по-лесно да снимаш по една страница. А и така не е нужно да разпъваш много книгата.
mIRCata
Мнения: 58
Регистрация: 19 ноември 2009, 22:59

Мнение от mIRCata »

Имам. Ама сам не мога да се справя. Трябва някой да придърпва едната страна, за да седи изпъната книгата.
Ще взема да хвана жената на работа да помага - малко ли книги изчете и тя от тук. Да помогне за общото благо :)
Ама тогава ще станат пак големи файловете и ще ме бият админите.
piki
Мнения: 65
Регистрация: 08 септември 2007, 11:35

Мнение от piki »

Така... можеш да ползваш някое стъкло от витрина. Аз си намерих такова, слагам книгата, отгоре стъклото и тежестта му изправя книгата като вестник... и така снимам. За около 3ч. преснимам 300 страници книга... сам. Само малко кръста ме заболява после, но това си зависи от поставката, върху която е книгата (в моят случай е стол).
А колкото за големината на файловете... качваш всичко като архив в някой Upload сайт (Megaupload, rapidshare etc) и слагаш линка. Примерно аз предпочитам да изтегля сканираните файлове, отколкото разпознат файл с текст... защото ми е по-лесно да редактирам докато разпознавам, а и след доста разпознаване.. Finereader-a ми се е нагодил към мен :) или аз към него и процесът става доста по-бърз.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Мнение от Mandor »

piki, така е по-бавно. Щом имаш стъклена витрина, само я открехваш на 20-30 см. и пъхаш книгата зад нея (вертикално). Адски бързо е и не се занимаваш с вдигане на стъклото, прелистване, поставяне на стъклото и т.н.
За сравнене – с пълна оптимизация (статив, дистанционно управление на фотоапарата) преснимам книга от 300 стр. за около половин час.
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: 0 гости