Страница 1 от 1

OCR обработка на сканирани книги (PDF)

Пуснато: 18 декември 2012, 14:52
от LexParsy
Здравейте
Благодаря за добрия сайт и за труда на авторите му.

Напоследък ми попада нови книги сканирани в PDF формат.
Аз използвам Говорещи прграми за четене (контролирано по абзаци :shock: :-), затова го обработвам с OCR (Fine Reader). Играчка но си заслужава!
Мислех си, че труда ми не трябва да отива напразно. Имам и гигабайти библиотека на лаптопа.
Библиотеката може да се увеличи тройно ако се направи по-добра организация на сайта (не само дизайн)!, като се изпращат книги и се одобряват от Редактор и Администратор. (незнам как седи въпроса с Правата напоследък?).
Последно обработих "2013" и мога да Ви я изпратя...

Lex Parsy
lexparsy[маймунско а]gmail[ . ]com

Re: OCR обработка на сканирани книги (PDF)

Пуснато: 18 декември 2012, 15:35
от LexParsy
ПОЯСНЕНИЕ!
OCR програмите Fine Reader) разпознават и конвертират сканиран текст и го превръщат в документ за редактиране и четене (например Word Document). След това обикновено се изискква Преформатиране, Редактиране, Проверка за грешки... и в случая може да се публикува в електронна библиотека ...

Някой :-)

P.S. Редактирането е Отговорна работа! Например литературно се пише "Изпращам" а не "Пращам" :-)
И това се научава с четене, а не с гледане на "big Brother" :-)))

Re: OCR обработка на сканирани книги (PDF)

Пуснато: 18 декември 2012, 16:08
от Spellweaver
Здравейте LexParsy. "Моята библиотека" разполага с посочените от вас хора, които правят последната проверка преди произведението да бъде качено във фонда на Библиотеката. За да улесним максимално работата им и така предадените произведения да бъдат качвани бързо и безпроблемно в Библиотеката е необходимо хората, които се занимават със сканиране, разпознаване, корекция и форматиране в специфичния за "Моята библиотека" SFB формат да извършат горепосочените процеси съвестно.

Предполагам искате да се запознаете с основите на процеса на обработка на произведение преди да бъде подадено към последната проверка. Можете да се запознаете с тях тук - Наръчник на коректора.

Обработката на текстове и произведения става като се използва Работното ателие. Там се записва текущото състояние на подготовката на произведението за качване в "Моята библиотека", както и съвместното сътрудничество, ако книгата се обработва от няколко човека.

Инструкции за всеки един от етапите на обработка на произведение може да прочетете тук - Наръчник на Работно
Ателие
.

Доколкото разбрах при вас текстовете са разпознати с FineReader от PDF формат, така че разполагате с чисто текстов файл, който може да бъде свободно променян, така че може да пропуснете секцията за Сканиране.