ЛИБИ и ГИБИ

Търсене и предлагане на помощ при сканиране. Теми за началната работа при цифровизацията.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!

ЛИБИ и ГИБИ

Мнениеот ЛИБИ » 13 септември 2020, 12:27

Бих предложил да се започне проект за сканиране или по-точно разпознаване на ЛИБИ и ГИБИ - латински и гръцки източници за Българската история. Който се занимава малко с история знае, че това са най-ценните книги за българската история и много хора ще се зарадват да ги имат в по-удобен формат от сегашния достъпен на интернет - книгите са сканирани, но без OCR и не може нито да се търси, нито да се копира от тях удобно.
Разумно е да се започне с ЛИБИ том 1 издаден 1958г., като сканираната версия може да се изтегли от тук http://macedonia.kroraina.com/libi/1/index.html

Сканирането и разпознаването ще е доста по-трудно от това на малка художествена книга, тъй като имаме две колони, в ляво латинския текст, а в дясно българския текст. Има и доста коментари. Латинският и българският текст може да се преформатират и един над друг, но задължително трябва да се запази и оригиналния номер на страница, защото книгите са цитирани със страници безброй пъти на интернет и в други книги. Ще е необходимо да се постигне и безгрешен текст по възможност, въпреки че може да се постави забележка, хората да проверяват и оригиналите, ако държат на изключителна точност.

Та въпросът е кой тук би желал да посвети малко или повече сили на такъв проект? Chitanka.info би ли помогнала с нещо?
ЛИБИ
 
Мнения: 3
Регистрация: 13 септември 2020, 11:57

Re: ЛИБИ и ГИБИ

Мнениеот Борислав » 13 септември 2020, 22:21

С малко напасване на системата на библиотеката, ще е възможно да се запази оригиналното оформление в две колони. Вижда се, че това е много важно при сравняването на двуезичните текстове.
Аватар
Борислав
 
Мнения: 1019
Регистрация: 15 ноември 2005, 17:25

Re: ЛИБИ и ГИБИ

Мнениеот ЛИБИ » 14 септември 2020, 15:25

Благодаря за отзива.

Направих вече OCR разпознаване на 2-3 страници с две колони и съм доволен да кажа, че разпознаването и на българския и латинския текст е на около 100% при това и на индексите в текста. Ще трябва да се изтрият доста тирета, да се пипнат някои завъртулки, форматиране и малко творческа работа. ЛИБИ 1 е 460 страници. Дано се съберем обаче поне 2-3ма.
ЛИБИ
 
Мнения: 3
Регистрация: 13 септември 2020, 11:57

Re: ЛИБИ и ГИБИ

Мнениеот Борислав » 14 септември 2020, 21:32

Как точно възнамеряваш да форматираш текста?
Аватар
Борислав
 
Мнения: 1019
Регистрация: 15 ноември 2005, 17:25

Re: ЛИБИ и ГИБИ

Мнениеот ЛИБИ » 14 септември 2020, 22:30

Трябва да мисля, тествам и чета доста по това. За момента го слагам в Word 2010.
Там използвам опцията Page Layout - Columns - Two и Column Break, обаче яко засичам с бележките във Footer. Можело да се използва и таблици за по-голяма гъвкавост, но всичко ще трябва да се копира едно по едно, а ще гледам да минимизирам работата естествено.
За момента свалям страници и търся хора да помагат най-вече.
ЛИБИ
 
Мнения: 3
Регистрация: 13 септември 2020, 11:57


Обратно към Сканиране

Кой е на линия

Потребители, разглеждащи форума: Николко регистрирани потребители и 0 гости