Технически въпроси

Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!

Отговор на темата


This question is a means of preventing automated form submissions by spambots.
Усмивки
:D :) :( :o :shock: :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen:
BBCode е включен
Кодът [img] е включен
Кодът [flash] е изключен
Кодът [url] е включен
Усмивките са включени
Преглед на темата
   

Разгъване Преглед на темата: Технически въпроси

Освежаване на PDF, DJVU сканове - годни за ел.четец

Мнение от taurus » 31 декември 2013, 21:30

Както знаем има доста качени книги в PDF или djvu - като прост скан, даже не е и подравнен.

Вчера, се пробвах да чета 3 книжки с Киндъл 4 (6") (обикновен формат предполагам А5) - нямам налични оригинали, но ще пробвам да снимам по 1стр на 3 книги среден формат и да направя няколко проби. :roll:

Та, на панорамен изглед се чете лявата страница, на 2 пъти и последните 2-3 реда от третия път (превъртане на долу)
Шрифта е 1-2 пункта по-малък от нормалния с който чета. Дясната страница обаче не я центрира в средата (четеца прескача на големи стъпки - квадрантите, превъртам с 4-пътния бутон), а корекцията на Zoom-a e 150, 200, 300% - стъпките са големи. Чете се що-годе - на 200%.

Идеята ми е - как мога да направя така, че да отделя всяка страница от (двойния скан), да я изправя (ако е необходимо) и да кропна само текста, като след това въпросното наборно поле/страничка се разреже на две, хоризонтално и така от 2 оригинални страници на снимката, ще се получат 4ри. Мисля че като се отнемант от белите полета ще се намърда с подходящ шрифт за четене в 6те инча на четеца. :idea:

Прегледах няколко теми и ми се стори сложно и времеемко същинската дигитализация, а и не видях дали е направено ръководството за начинаещи.
Засега ми хрумна този вариант, за лаици като мен, мисля че ще стане за определени формати книги. Въпроса е дали ще може да се автоматизира със съответния софтуер и намесата на потребителя да е минимална (може би при разделянето на страницата, без да се разцепи ред ще трябва да се пипне), изправянето мисля, че и автоматично може да стане?!
За нагънатия шрифт (близо до гръбчето) мисля че е бял кахър, за него вече ще трябва през файн-ридър да мине, но тук целим груба/задоволителна обработка, която да улесни значително четенето на този род сканирани копия, без да се налага да ставаш коректор (изчитайки цялата книга и да владееш тънкостите на софтуера), но по този начин доста книги ще имат потенциала да се четат през електронен четец. :idea:

Мнение от petrovich » 01 юли 2010, 13:01

Ами, честно казано не знам. Изчакай някой друг да допълни информацията.
Минах го през конвертора на Мандор и не дава грешки, но не знам как ще изглежда в сайта.

Мнение от Вилорп » 01 юли 2010, 12:26

А евентуално да слея останалите клетки и в тях да го вкарам?

T>
# Примерна таблица
| Клетка 1.1 | | | {img:име-файл|алтернативен-текст|#заглавие|:идентификатор} |
| Клетка 1.2 | Клетка 2.1 ||^ |
| Клетка 1.3 | Клетка 2.2 | Клетка 3.1 |^ |
| Клетка 1.4 | Клетка 2.3 | Клетка 3.2 | Клетка 4.1 |
T$

Така?

Мнение от petrovich » 01 юли 2010, 12:05

Вилорп написа:А могат ли тези празни блакчета да станат невидими, защото принципно в тоя ъгъл където са празните блокчета има изображение в оригинала...


Лично аз не знам за такъв вариант. По скоро изображението може да се разположи до таблицата или под нея.

Мнение от Вилорп » 01 юли 2010, 11:43

А могат ли тези празни блакчета да станат невидими, защото принципно в тоя ъгъл където са празните блокчета има изображение в оригинала...

Мнение от petrovich » 01 юли 2010, 11:33

За да излезне правилно е нужно следното:

T>
# Примерна таблица
! | Клетка 1.1 | | | |
| Клетка 1.2 | Клетка 2.1 | | |
| Клетка 1.3 | Клетка 2.2 | Клетка 3.1 | |
| Клетка 1.4 | Клетка 2.3 | Клетка 3.2 | Клетка 4.1 |
T$

Или поне аз така го правя. По този начин ще се запази структурата на таблицата и ще има празни блокчета. :wink:

Мнение от Вилорп » 30 юни 2010, 13:22

Значи в уроците по FBS дето ми подадоха има следното нещо:
T>
# Примерна таблица
! | Колона 1 | Колона 2 |
| Клетка 1.1 | Клетка 1.2 |
| Клетка 2.1 | Клетка 2.2 |
T$

До тук проблеми нямам, но ако таблицата ми е от този тип:
T>
# Примерна таблица
! | Клетка 1.1 |
| Клетка 1.2 | Клетка 2.1 |
| Клетка 1.3 | Клетка 2.2 | Клетка 3.1 |
| Клетка 1.4 | Клетка 2.3 | Клетка 3.2 | Клетка 4.1 |
T$

Това ще излезе ли като таблица с такава подредба? Питам защото сканирам: Ендивал - Здрач над Ендивал и там има доста такива таблици, а ми казаха че е по добре да се дадат като таблици, а не като картинки...

Мнение от Mandor » 03 януари 2010, 13:42

piki, така е по-бавно. Щом имаш стъклена витрина, само я открехваш на 20-30 см. и пъхаш книгата зад нея (вертикално). Адски бързо е и не се занимаваш с вдигане на стъклото, прелистване, поставяне на стъклото и т.н.
За сравнене – с пълна оптимизация (статив, дистанционно управление на фотоапарата) преснимам книга от 300 стр. за около половин час.

Мнение от piki » 01 януари 2010, 14:02

Така... можеш да ползваш някое стъкло от витрина. Аз си намерих такова, слагам книгата, отгоре стъклото и тежестта му изправя книгата като вестник... и така снимам. За около 3ч. преснимам 300 страници книга... сам. Само малко кръста ме заболява после, но това си зависи от поставката, върху която е книгата (в моят случай е стол).
А колкото за големината на файловете... качваш всичко като архив в някой Upload сайт (Megaupload, rapidshare etc) и слагаш линка. Примерно аз предпочитам да изтегля сканираните файлове, отколкото разпознат файл с текст... защото ми е по-лесно да редактирам докато разпознавам, а и след доста разпознаване.. Finereader-a ми се е нагодил към мен :) или аз към него и процесът става доста по-бърз.

Мнение от mIRCata » 31 декември 2009, 11:06

Имам. Ама сам не мога да се справя. Трябва някой да придърпва едната страна, за да седи изпъната книгата.
Ще взема да хвана жената на работа да помага - малко ли книги изчете и тя от тук. Да помогне за общото благо :)
Ама тогава ще станат пак големи файловете и ще ме бият админите.

Мнение от Endymion » 30 декември 2009, 23:15

Ако ползваш фотоапарат е по-лесно да снимаш по една страница. А и така не е нужно да разпъваш много книгата.

Мнение от piki » 30 декември 2009, 00:03

2-те наведнъж... Finereader си има опция за автоматично разделяне на страниците.

Мнение от mIRCata » 29 декември 2009, 21:35

Каква е обичайната практика при сканирането - страниците една по една или две наведнъж?
Че смятам да сканирам Малазанската книга, а ще го правя за първи път. Кое е по-лесно за обработване после?

Мнение от MBB » 16 декември 2009, 23:41

Много лесно - натискаш с ръчичка като внимаваш да не повредиш скенера(както стана при мен) и не затваряш капака.
После това дето не се е сканирало и разпознало го редактираш на ръка.
Теб кой те е излъгал че OCR-а е лесно и бързо?

Въпрос

Мнение от Michelle » 16 декември 2009, 23:24

Добре де, аз искам да попитам как сканирате книга, която е дебела да речем 300 страници. Като се стигне до средата скенера не сканира добре текста който е към средата на книгата. И също така от дебелата книга капакът на скенера не се затваря! Как се справяте с това. Според мен единствения вариант е да се разпърца книгата и така да се сканира лист по лист :)

Мнение от nqgolova » 20 март 2007, 16:48

Отказа ми Fine Skan Manager.Не мога да сканирам.Някой да има представа как може да се оправи проблема?

Мнение от MikoBG » 25 февруари 2007, 13:29

nlr написа:Имаш ЛС.


Благодаря за съдействието и отзивчивоста! :D :D :D

Време е да запретваме ръкави! :)

Мнение от nlr » 25 февруари 2007, 12:23

Имаш ЛС.

Мнение от MikoBG » 25 февруари 2007, 06:33

Да се закача и аз в тази тема.
Повече от една година влизам тук, но сега реших да се включа. Като помощник де.:oops: Имам добра камера и статив. Прочетох повечето теми тук. Намерих FineReader 8 и го инсталирах. Тествах го с документи на латиница и всичко бе чудесно. И когато реших да започна с една кримка на български - проблем ! :evil:
След разчитането и корекциите, в готовите файлове само питанки "?" или квадратчета!!! :evil:. Но на екрана в програмата всичко си е ок!
Никога не съм качвал Флекс. FineReader-а съм лекувал по правилата - с латински документи работи без грешка.
Пуснах да излиза в PDF - изплака, че нещо в шрифтовете липсвало и може да има символи, които няма да се покажат.
Пуснах го в ТХТ и отворих с шестнайсетичен редактор - вътре си е са мо питанки :roll:.
Нямам опит с шрифтове. Погледнах на Windows папка fonts и не намерих там кирилски букви. Може и да си ги има, но нали ви казвам, нямам опит. Пък другите програми от къде ги теглят тия букви?
Потърсих в нета, но за сега не намерих нищичко.
Така както е казал шопа "седя и си мисля ..., и изведнъж само си седя без да мисля"
Та ако може ударете едно рамо. :? :oops:

Мнение от eeka » 08 януари 2007, 19:29

едно много полезно и същевременно елементарно нещо, което спомага много за намаляване на грешките при разпознаване е brightness - с увеличаване на brightnessa на картинката още при сканирането много от дребните дефекти по страницата и също прозиращия текст от обратната страна на листа се изличават, но естествено трябва да се намери баланс със самия текст, защото не всички страници са отпечатани с еднаква яркост - има някои много бледи страници, които няма да се разчитат ако яркостта е увеличена много.
това е комай единствената настройка, която барам аз освен стандартните 300дпи и черно/бяло изображение.
ако някой знае други "трикове", които да спомогнат за по-доброто разпознаване моля да споделят...

Мнение от kuyvliev » 21 октомври 2006, 16:21

Благодаря за напътствията. Дори и на час по лъжичка пак са полезни. :)

Мнение от нт » 20 октомври 2006, 00:20

сетих се още нещо, което съм пропуснал да ти кажа.

сканирай черно-бяло - по-бързо става, а от цветно няма смисъл. в настройките на скенера това обикновено се нарича b/w photo или greyscale 8-bit.
опитай също така и с b/w document и различни настройки при сканирането - това може да направи още по-лесен импорта в рийдъра. зависи дали ще бъде достатъчно четимо.

винаги на 300 dpi, без каквито и да е филтри от скенера (като anti-moire, descreen, sharpen, etc.), които също бавят. 30 - 50 секунди на страница трябва да е нормално за сканирането. нека и други да кажат.

аз извършвам различни манипулации по сканираните страници във фотошоп, особено за стари и пожълтели книги, с цел да ги направя максимално контрастни, но на мен професията ми е да се занимавам с изображения, така че тази част ми е известна от много години и ми беше най-лесната...

извинявай, че така на час по лъжичка. много се изморявам от работа през седмицата и се сещам на парче за нещата...

Мнение от kuyvliev » 19 октомври 2006, 16:52

С фотошоп никога не съм работил но явно ще почна. Скенера не е от най бързите и досега сканирах по две страници на 600 но ще пробвам както казваш. Засега всичко върви отчайващо бавно но това явно е защото и тук както във всяко нещо си има трикове а аз не съм запознат.

Мнение от нт » 19 октомври 2006, 15:01

300! нито точка повече или по-малко.

ако имаш опит с фотошоп - превърти картинките с екшън image> adjust> threshold и после image> mode > bitmap. тогава импорта в рийдъра става мълниеносно. но и инак е ок.

аз установих, че ако скенерът е бърз, много по-добре става да се сканира по една страница, така че сгъвката на книгата да е перпендикулярно на движението на лампата. тогава шейната не хвърля сянка в сгъвката и разпознаването е без почти каквито и да е грешки. когато сканираш разгъвка от две страници в средата се получава сянка, която после може да доведе до проблеми при разчитането.

нт

Мнение от kuyvliev » 19 октомври 2006, 13:59

Има ли значение резолюцията с която сканираме 300 или 600? С по голяма резолюция по малко грешки ли има при разпознаването?
аз лично не намирам разлика. Даже пробвах с 1200 но е безсмислено бавно.

Мнение от hammster » 18 октомври 2006, 21:54

Надявам се да видя и твоето име в раздел "Сканиране" :D.

Мнение от kuyvliev » 18 октомври 2006, 21:41

Благодаря на всички които помогнаха.
Инсталацията беше успешна.
Почвам да разучавам опциите.

Мнение от hammster » 18 октомври 2006, 19:28

Пратих ти адреса на тракера където съм го качил, като ЛС. Дано инсталацията протече гладко. Успех.

Мнение от kuyvliev » 18 октомври 2006, 19:05

Благодаря за помощта. Всъщност съм регистриран просто не съм се логнал при предното мнение. Мейла ми е kuvliev при mail.bg

Програмата е страшна не само че преинсталирах уина но и свалих абито отново като дадох друго име и мейл за да ми пратят линк (свалях го от сайта на абби) даже си смених айпито :lol: и пак не ми мина номера да го подкарам повторно. Може би трябваше да сменя и името на компютъра. :lol:

И все пак да попитам отново за да не се окаже че всички проблеми са ми от собствено недоглеждане. Къде пише как е инсталационното ID? При първата инсталация на програмата го намерих бързо и лесно но не запомних къде, затова сега имам чуство че просто нещо липсва защото програмата разпознава машината.

За торентите също не бих отказал така че давай линк. Аз търсих първо в линкос ама нямаше нищо затова се насочих към сайта на абби.

Мнение от hammster » 18 октомври 2006, 16:28

Аз имам и друга идея. Ако ползваш торенти, ще ти кача моя ABBYY (версия 8.0.0.779) като торент на някой български тракер, който е без регистрация. Аз се оправих с инсталацията, защото в архива имаше изключително подробен текстови файл на чист български коя стъпка след коя следва. Така че, ако я искаш драсни тук един коментар, а аз ще ти пратя на ЛС-то URL-а от къде да я изтеглиш. Но за да ползваш ЛС трябва да се регистрираш във форума, както споменава goblin.

Към началото

cron