Здравейте
Благодаря за добрия сайт и за труда на авторите му.
Напоследък ми попада нови книги сканирани в PDF формат.
Аз използвам Говорещи прграми за четене (контролирано по абзаци , затова го обработвам с OCR (Fine Reader). Играчка но си заслужава!
Мислех си, че труда ми не трябва да отива напразно. Имам и гигабайти библиотека на лаптопа.
Библиотеката може да се увеличи тройно ако се направи по-добра организация на сайта (не само дизайн)!, като се изпращат книги и се одобряват от Редактор и Администратор. (незнам как седи въпроса с Правата напоследък?).
Последно обработих "2013" и мога да Ви я изпратя...
Lex Parsy
lexparsy[маймунско а]gmail[ . ]com
OCR обработка на сканирани книги (PDF)
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Re: OCR обработка на сканирани книги (PDF)
ПОЯСНЕНИЕ!
OCR програмите Fine Reader) разпознават и конвертират сканиран текст и го превръщат в документ за редактиране и четене (например Word Document). След това обикновено се изискква Преформатиране, Редактиране, Проверка за грешки... и в случая може да се публикува в електронна библиотека ...
Някой
P.S. Редактирането е Отговорна работа! Например литературно се пише "Изпращам" а не "Пращам"
И това се научава с четене, а не с гледане на "big Brother" ))
OCR програмите Fine Reader) разпознават и конвертират сканиран текст и го превръщат в документ за редактиране и четене (например Word Document). След това обикновено се изискква Преформатиране, Редактиране, Проверка за грешки... и в случая може да се публикува в електронна библиотека ...
Някой
P.S. Редактирането е Отговорна работа! Например литературно се пише "Изпращам" а не "Пращам"
И това се научава с четене, а не с гледане на "big Brother" ))
- Spellweaver
- Мнения: 17
- Регистрация: 05 юли 2011, 02:11
- Местонахождение: Стара Загора
- Връзка:
Re: OCR обработка на сканирани книги (PDF)
Здравейте LexParsy. "Моята библиотека" разполага с посочените от вас хора, които правят последната проверка преди произведението да бъде качено във фонда на Библиотеката. За да улесним максимално работата им и така предадените произведения да бъдат качвани бързо и безпроблемно в Библиотеката е необходимо хората, които се занимават със сканиране, разпознаване, корекция и форматиране в специфичния за "Моята библиотека" SFB формат да извършат горепосочените процеси съвестно.
Предполагам искате да се запознаете с основите на процеса на обработка на произведение преди да бъде подадено към последната проверка. Можете да се запознаете с тях тук - Наръчник на коректора.
Обработката на текстове и произведения става като се използва Работното ателие. Там се записва текущото състояние на подготовката на произведението за качване в "Моята библиотека", както и съвместното сътрудничество, ако книгата се обработва от няколко човека.
Инструкции за всеки един от етапите на обработка на произведение може да прочетете тук - Наръчник на Работно
Ателие.
Доколкото разбрах при вас текстовете са разпознати с FineReader от PDF формат, така че разполагате с чисто текстов файл, който може да бъде свободно променян, така че може да пропуснете секцията за Сканиране.
Предполагам искате да се запознаете с основите на процеса на обработка на произведение преди да бъде подадено към последната проверка. Можете да се запознаете с тях тук - Наръчник на коректора.
Обработката на текстове и произведения става като се използва Работното ателие. Там се записва текущото състояние на подготовката на произведението за качване в "Моята библиотека", както и съвместното сътрудничество, ако книгата се обработва от няколко човека.
Инструкции за всеки един от етапите на обработка на произведение може да прочетете тук - Наръчник на Работно
Ателие.
Доколкото разбрах при вас текстовете са разпознати с FineReader от PDF формат, така че разполагате с чисто текстов файл, който може да бъде свободно променян, така че може да пропуснете секцията за Сканиране.
Кой е на линия
Потребители, разглеждащи форума: 0 гости