За един проект

Един е питал, друг — отговарял…
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
Hagera
Мнения: 2
Регистрация: 05 март 2010, 17:34

За един проект

Мнение от Hagera »

Всъщност по-точното заглавие на темата трябва да е "Молба за помощ". Става дума за изготвянето на един проект - електронна библиотека в училище. Да разясня - имам желанието да направя нещо като "алгоритъм" за това как информация от книги да премине в електронен вариант и така всеки, който поиска, да може бързо и лесно да използва същата информация просто като си седи на компютъра в училище. Звучи прекрасно, но нямам точна представа как ще стане (освен че прцесът на прехвърляне на информацията преминава през три етапа - сканиране, разпознаване и редактиране). От дуга страна, гледам, че тук има много специалисти в тази област... Та, дали някой ще се намери да ми помогне? :D
Не се нуждая от някакви дълги и сложни пояснения (аз няма и да ги разбера :!:), а от някакъв прост модел как би могло да се получи и какви "пособия" трябват ( каква програма, изисквания към компютъра, какъв скенер).
Ако някой се намери да ми помогне, ще ми направи голяма услуга! :)
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Мнение от petrovich »

1. Сканиране:
1.1. Със скенер попринцип става с всеки скенер стига самата книга да влиза в него :). Обикновенно аз използвам резолюция 300dpi, но може 400,600dpi.
1.2. С фотоапарат - желателно е фотоапаратът да е с възможно по-висока резолюция, но не е задължително аз снимам с 10mpx фотоапарат без светкавица на изкуствена бяла светлина от разстояние 20-25см. Това е по-бързият начин, но е много възможно да имаш и много размазани снимки.
2. Разпознаване - първо със Scan Taylor, поправка на ориентация, разделяне на страници, компенсация на наклона, избор на съдържание, оформление на страница и краен резултат.
След това вече обработените снимки може да се вкарат в така наречената OCR програма (Abbyy finereader, iris и др.)тази програма разпознава и превръща текста на снимките е електронен вариант чрез различни алгоритми.
3. Редакция - редакцията може да се извършва в самата OCR програма, но е възможно направо след разпознаването на текста и картинките да се отвори с програми като Notepad++, Writer (Open Office), Word и т.н.В този етап на работа се прочита и преглежда целият разпознат текст като всяка грешка се коригира.
3.1. Следва така нареченото SFB форматиране, то служи да представя текста в електронен вариант по възможно най-удобния начин за читателя.
Това е от мен, сигурно съм пропуснал куп неща, но като за резюме става :)
Hagera
Мнения: 2
Регистрация: 05 март 2010, 17:34

Мнение от Hagera »

Страшен си! Много благодаря! :D
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: един гост