Страница 1 от 1

SFB форматиране за начинаещи

Пуснато: 12 февруари 2009, 09:48
от Mandor
SFB-форматиране за начинаещи

Първото и най-важно нещо, което трябва да научите за SFB-форматирането (и което се бърка най-често) е, че той не указва как да се изобрази даден текст, а само задава вида на елементите му. Казано по друг начин, когато форматирате текст за извеждане, вие указвате напр.: «Този фрагмент от текста е с наклонен шрифт», «Този ред е центриран и с удебелен шрифт», «Този текст е с по-голям отстъп отляво» и т.н., докато в SFB указвате само какъв е текстовият фрагмент, без да се интересувате от начина, по който се извежда, напр.: «Този ред е заглавие», «Тези редове са цитат» и т.н. Тези от вас, които използват «стилове» в текстообработващите си програми, могат да разглеждат SFB-форматирането като присвояване на предварително зададени стилове към специфичните фрагменти от текста.

За опростяване на обясненията ще предположим, че сте експортирали разпознатото от FineReader в чист текстов файл. Приготвяте се да го изчетете и да редактирате откритите грешки - а защо едновременно с това не го форматирате?
И така, да започваме:

Подготовка
Забележка: Поради някои особености във форматирането ви съветвам да поставите един празен ред в началото на файла, преди да започнете обработката.
Според SFB-формата всеки ред, на който има текст, трябва да започва с табулатор; затова ще го поставим автоматично чрез просто заместване на комбинацията «нов ред» с «нов ред + табулатор». В Word и UltraEdit това става чрез заместване на ^p с ^p^t.
Тъй като това заместване поставя табулатори и на празните редове, ще ги почистим чрез още една замяна: «табулатор + нов ред» с «нов ред». В Word и UltraEdit това става чрез заместване на ^t^p с ^p.
Забележка: FineReader често разпознава някои интервали като табулатори (най-често - след тирето в пряка реч), затова е желателно преди замяната да претърсите текста за фалшиви табулатори или автоматично да ги замените с интервали.
Подготовката е приключена. Можем да започнем форматирането.

Форматиране на въвеждаща информация
Първо трябва да форматираме автора и заглавието на книгата. За целта поставяме в началото на реда (преди табулатора) маркера «|» (вертикална черта), например:

Код: Избиране на всичко

|       Сергей Лукяненко
|       Звездната сянка
На първия ред стои авторът, на втория - заглавието. Не използвайте само главни букви!

Тук е моментът да вмъкнем и анотацията на произведението, която обикновено се отпечатва на задната корица на книгата. За целта ограждаме текста с маркерите A> и A$ (от англ. «Annotation»). Всички маркери са на латиница, поставят се в началото на реда. Пример («Памет» от Лоис Бюджолд):

Код: Избиране на всичко

|       Лоис Бюджолд
|       Памет

A>
	Да умреш е лесно. Трудно е да оживееш. Поне така си мисли Майлс Воркосиган, защото вече е умирал. Благодарение на неговите подчинени и на специалистката, която го съживява, първата му смърт няма да е последна. След като се завръща на работа се оказва, че всичко си има цена, макар че Майлс не иска да го признае…
A$
Разбира се, всеки параграф в анотацията също трябва да започва с табулатор.
Продължаваме с текста от книгата.

Ако в книгата има посвещение, то се огражда с маркерите D> и D$ (от англ. «Dedication»). Пример (отново «Памет» от Лоис Бюджолд):

Код: Избиране на всичко

…макар че Майлс не иска да го признае…
A$

D>
        На Труди — старшата и младшата.
D$
Ако в началото на книгата има епиграф, ограждаме го с маркерите E> и E$ (от англ. «epigraph»). Ако епиграфът е в стихотворна форма, маркираме това с P> и P$ (от англ. «Poem»). Пример с два епиграфа («Опасно лекарство» от Артър Хейли):

Код: Избиране на всичко

E>
P>
        Отчаяните болести церят се
        с отчаяни лекарства. Или никак.
@       ШЕКСПИР, Хамлет
P$
E$

E>
        Не стига, че сме затрупани от безчет възхвалявани лекарства, ами сега ни сервират ново.
@       ТОМАС ЗИДЕНХАМ,
@       лекар, 1624–1689
E$
Епиграфите могат да се появят и в началото на глава - форматирането им е по същият начин.
«@» се използва за маркиране на автор на епиграф, стихотворение или цитат.

Вече можем да започнем с

Форматиране на заглавия
За да посочим, че даден параграф е заглавие на глава, поставяме маркера «>» в началото му, например («Опасно лекарство» от Артър Хейли):

Код: Избиране на всичко

>       ПРОЛОГ
>       1985

        В първокласния салон на Боинг 747…
Както забелязвате, едно заглавие може да се състои от няколко параграфа. Желателно е да оставяте поне по един празен ред преди и след заглавието, за да може да се разграничава визуално от основния текст.
Ако заглавията са на няколко нива (вложени глави), маркираме ги, като повтаряме знака «>» толкова пъти, колкото е нивото на заглавието, например («Банкери» от Артър Хейли):

Код: Избиране на всичко

>       ПЪРВА ЧАСТ

>>      1

        Тези два дни от първата седмица…
Понякога текстът на произведението е разделен на части, които нямат самостоятелни заглавия (пример: «Дюн» от Франк Хърбърт). В този случай след маркера «>» не се поставя текст.

До момента се запознахме с единичните маркери «|» (заглавие), «@» (автор на цитат) и «>» (глава), както и с блоковите маркери «A» (анотация), «D» (посвещение), «E» (епиграф) и «P» (стихове).
За по-подробно описание на използваните маркери вижте помощната страница «SFB-формат», а пълното формализирано описание можете да прочетете тук.

Re: SFB форматиране за начинаещи

Пуснато: 07 юни 2015, 10:06
от georgiast
Здравейте,
четох и гледах, но... мога ли да помоля за помощ?
1. Сканирах няколко страници, разпознах ги с ОЦР програма, прегледах ги в Word (.docx), изчистих малкото грешки и насетне - всички сканирани и разпознати страници трябва да бъдат един файл и кое е по-добре - да бъдат .docx или .txt?
2. Поиграх си и с Пясъчника, но не мога ... има ли някакъв друг начин семантично да маркирам текста?
3. Ако все пак успех да се справя с Пясъчника, той дава опция за преглед, а така маркирания семантично текст как се съхранява и след това ъплоудва в Читанка?

Благодаря предварително,
приятелски поздрави!

Re: SFB форматиране за начинаещи

Пуснато: 07 юни 2015, 12:32
от pechkov
georgiast написа:... да бъдат .docx или .txt?
TXT с кодиране UTF-8.

SFB маркерите може да ги впишеш още докато работиш в Word, те не са някакви странни неща, а текстови символи, които се пишат от клавиатурата. "Страници" има в Word, но текста трябва да не е прекъснат, т.е. ако има разкъсани параграфи, където в оригинала е имало пренос на нова страница - трябва да ги "слепиш".

Записа в TXT може да го направиш като последна стъпка, и гледай кодировката да е правилната.

Качването става в работно ателие, създаваш нов запис, вписваш данните за произведението, и качваш TXT файла. След това се чака за проверка дали всичко е наред, и ако е добре - произведението продължава по пътя към библиотеката.