Забавяне в одобренията?

Търсене и предлагане на помощ при сканиране. Теми за началната работа при цифровизацията.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!

Забавяне в одобренията?

Мнениеот Hawthorne » 02 ноември 2008, 15:48

Дракони на пролетната зора от Маргарет Вайс и Трейси Хикман. Книгата стои за одобряване от 18ти октомври, вече e 2ри Ноември, просто чакам тази книга да се качи от година, защо се забавя одобряването на нея и доста други толкова?
Приятелите и враговете са богатства, които всеки притежава.
Hawthorne
 
Мнения: 80
Регистрация: 25 ноември 2006, 08:46
Местонахождение: Шумен

Мнениеот MBB » 02 ноември 2008, 19:06

Ха - ново двайсе....
одобрения каиш...
Ми нали уж всичко се качваше без оглед на тематиката - религиозна, идеологическа, порно-сексуална ако щете...
А сега научавам че имало вътрешна цензура ... все пак.
Добре върви..
MBB
 

Мнениеот moosehead » 02 ноември 2008, 19:24

MBB написа:… А сега научавам че имало вътрешна цензура ... все пак.
Добре върви..


Ами някак си… не му е тук мястото да говорите за цензура. Книгата е форматирана… ама по някакъв друг стандарт, а но по изисквания SFB.


А на Hawthorne ще кажа — ако толкова бързаш да я прочетеш таз книга, просто си я дръпни във вида в който е и чети на воля.
http://www.chitanka.info:82/libd/to-do/ ... awning.txt

Успех :D
Аватар
moosehead
 
Мнения: 118
Регистрация: 17 февруари 2007, 18:29
Местонахождение: София

Мнениеот moosehead » 02 ноември 2008, 21:23

MBB написа:Ха - ново двайсе....
одобрения каиш...


Не знам "двайсе" какво означава :) , ама "каиш" е едно кожено приспособление, използвано в цитирам "порно-сексуална"-та тематика :D
Аватар
moosehead
 
Мнения: 118
Регистрация: 17 февруари 2007, 18:29
Местонахождение: София

Мнениеот hammster » 02 ноември 2008, 21:57

Затова ли и някои мои книги не се качват от доста време? Ами ако не съм почитател на SFB форматът, да спра да пращам, така ли? Предлагам тогава да се промени краят на тази страница (и подобните и): http://www.chitanka.info/lib/work/edit/1258/cache=0 и да остане само приемането на файлове в SFB формат, за да си правят сметката потенционалните редактори.
С пари можеш да купиш книга, но не и знание.
Аватар
hammster
 
Мнения: 79
Регистрация: 08 юли 2006, 20:24
Местонахождение: София

Мнениеот moosehead » 02 ноември 2008, 22:30

hammster, нямах това предвид, но няма значение.

Мисълта ми беше, че когато е форматиран коректно в SFB ще бъде публикуван, одобрен или както искаш наречи, по-рано, отколкото ако не е. Повече от ясно е.
Още повече, че има подробно обяснение за формата, помощни макроси и програми за проверка. Малко допълнително усилие и всичко е ОК.

А ако не си привърженик на SFB формата, просто напиши че не е форматиран и някой ще го форматира.

Моля за извинение за объркването.
Аватар
moosehead
 
Мнения: 118
Регистрация: 17 февруари 2007, 18:29
Местонахождение: София

Мнениеот Boman » 03 ноември 2008, 06:11

Малко риторика!
В случая не става въпрос за цензура, а за задържането на книгата, докато не изпълни критериите за качването ѝ. Няма нищо лошо да се цели високо качество на книгите, иначе ще четем боклук. От друга страна, рабирам и тези, които са по-нетърпеливи и са готови да четат и не дотам качествен текст. Всичко се изменя, включително и този сайт. Допреди няколко месеца нямахме този проблем, защото започнатите книги бяха малко, обработваха се от по-малко хора, и беше по-лесно. Сега повече хора, с различни критерии за перфекционизъм, се включват в обработката и понякога дори повече от трима се занимават с едно заглавие. Всичко това е хубаво, но проблемът е, че липсата на информация води до спекулации и до раздразнение. Грешката на Борислав е, че не слага в „Новините за библиотеката“ какво е текущото състояние на сайта, включително и на редактираните книги. Може и да добави в правилата на читанката относно изискванията за SFB стандарта и критериите кога една книга е готова за добавяне, за да знаят и не се разочароват тези, които се захващат с обработка. Само мога да предположа, че единствен Мандор се опитва да валидира книгите и да преценява дали са готови или трябва да се връщат за редакция. Определено това е временно решение.

Сега конкретно!
Оповестяването на книга „Готова за добавяне“ е подвеждащо. Нека да я наречем „Качена“. Бих предложил последната „качена“ версия на книга да може да се чете и сваля, но да се маркира като невалидирана. Ако някой се заеме да я валидира, да я обявява „За валидиране“, за да не се заеме накой друг.
Закон на Мърфи: ако мнението ми във форума може да бъде разбрано погрешно, то това ще стане!
Аватар
Boman
 
Мнения: 89
Регистрация: 03 февруари 2007, 08:24

Мнениеот GeOrg » 03 ноември 2008, 09:23

Boman написа:... Само мога да предположа, че единствен Мандор се опитва да валидира книгите и да преценява дали са готови или трябва да се връщат за редакция...

Предполагам Борислав също, но ако се чувства напрежение то действително е наложителна промяна. Хората така или иначе научиха за сайта и все повече ще се включват защото това което се прави тук наистина е полезно за всички.
Boman написа:...
Оповестяването на книга „Готова за добавяне“ е подвеждащо. Нека да я наречем „Качена“. Бих предложил последната „качена“ версия на книга да може да се чете и сваля, но да се маркира като невалидирана. Ако някой се заеме да я валидира, да я обявява „За валидиране“, за да не се заеме накой друг.

Предложението е добро, но ми се струва прекалено раздробено. Според мене достатъчно ще бъде края на редакцията и качването на текста да води до надпис "Проверка на валидност", с което се премахва недоразумението с думичката "Готова...".
Може и така да е, ...!
Аватар
GeOrg
 
Мнения: 203
Регистрация: 04 август 2006, 15:52
Местонахождение: Пловдив, Ивайловград

Мнениеот Mandor » 03 ноември 2008, 09:37

Boman, това си е доста точно изложение на фактите. Ще дам само някои подробности.
За да се получи крайният текст във вид, подходящ за извеждане в сайта, той трябва да бъде форматиран по някакъв начин. Изобщо не смятам, че напр. директен HTML ще е по-добър вариант за "крайно" форматиране от SFB. Също така не смятам, че трябва да се задължават сканировчиците/редакторите да качват задължително в SFB-формат. Ако сте забелязали, маркировките в SFB много приличат на тези в уики-системите, а доста такива се поддържат и от хора, незапознати с формата - те просто "наливат" суровия текст, след което някой по-запознат го форматира. Тук положението е абсолютно същото.
Допреди месец-два всички операции по форматиране и "валидиране" се извършваха лично от Борислав. После количеството текст за форматиране нарастна, и тъй като малко редактори качват в SFB, обработката започна да се забавя. Поради това Борислав ми прехвърли задълженията по форматиране и "валидация" на качените текстове. Колкото до забавянето, вероятно сте забелязали, че в раздел "Сканиране" има доста "одобрени" от мен текстове, които чакат за качване почти седмица - най-вероятно в момента Борислав няма време дори да ги качи, камо ли да извършва други, по-времеотнемащи действия. hammster, ако имаш предвид забавянето на "Страданията на младия Вертер", не съм го форматирал, защото предположих, че NomaD ще го поеме. Ако се задържи необработено до края на тази седмица, ще го форматирам.
Така че не сте много коректни с тази критика на забавянето. Погледнете например това произведение, което е обявено за готово. Липсва му дори авторът! Да не говорим, че не е ясно къде започват и свършват главите. Изобщо, повечето текстове, които се налага да форматирам, са доста зле - приведени са в привидно приличен вид, но са пълни с грешки; поправям средно по 50-100 грешки в един роман, и то само тези, които улавям автоматично; един Бог знае колко остават скрити...

Добавено: GeOrg, просто не знам каква промяна е нужна, освен хората да качват наистина редактирани текстове, когато ги обявяват за "готови". Нямате представа какви "боклуци" се налага да обработвам! И по колко време се налага да губя само за почистване на най-грубите грешки! Например, не можете да ме убедите, че текст, в който на двайсетина места се среща "фБР" (първата буква е малка; познат проблем за FineReader) е редактиран! Или пък този откъс:
- Тръгваме ли? -Да. Събраха припряно багажа си и потеглиха.
(три залепени параграфа и едно полузалепено тире). Имаше няколко книги, в които дори имаше неразпознати места, пълни с "$%@са*^ при[email protected]#" - какво да направя в такъв случай? Хората сканират (браво!), но после хвърлят някакъв полуфабрикат и го обявяват за "Готов за добавяне". Дори не си правят труда да го пуснат като "Работа в екип" и да оставят на друг да го редактира! Преди години един сканировчик упорито отстояваше тезата, че "правилно сканираният текст няма нужда от никаква редакция".
Изобщо проблемът май идва от различната интерпретация на думата "редакция". За мен това винаги е означавало пълно изчитане и коригиране на текста. Явно за повечето от останалите този термин покрива само началната обработка след сканиране, при която се коригират разкъсванията на текста на границите на страница и най-очевАдните грешки. Нямам идея какво може да се направи по въпроса.
Mandor
 
Мнения: 752
Регистрация: 19 август 2006, 10:56

Мнениеот GeOrg » 03 ноември 2008, 13:34

То е ясно какво трябва да се направи! Първото е да се промени текста "Готово за добавяне" за да няма напразни очаквания и да отговаря на истината. Второ работата по валидация трябва да се поеме от повече хора за да няма напразни очаквания у читателите. Трето произведенията с твърде много грешки да се обявяват повторно за "Нужно е допълнително редактиране", а не да се губи времето на отговорника по валидиране.

Така бързащите да прочетат даден текст могат и да се включат в редакцията му, а ако не желая просто да чакат това да го свърши друг, а не да протестират.
Може и така да е, ...!
Аватар
GeOrg
 
Мнения: 203
Регистрация: 04 август 2006, 15:52
Местонахождение: Пловдив, Ивайловград

Мнениеот Boman » 03 ноември 2008, 18:10

Валидацията не е трудна работа: най-честите проблеми са броят на кавичките и специалните символи за форматиране. Правописните грешки също се оправят сравнително лесно. Слетите абзаци изискват книгата да се ПРОЧЕТЕ. Също, ако книгата не е редактирана както трябва, е трудно да се върнат наклонените и надебелени текстове, сюжетните разделители, поезия, бележки под линия и др.. Най-лесно и бързо става, ако това се свърши още след разпознаването преди експортирането. Друго, което може да се направи е заедно с редактираната донякъде книга да се запазва и качва също и оригиналната сурова версия след разпознаването. Така ще може да се сравнява по страниците.
Пак моля, ако може, официално НЕготовите качени книги да се маркират като такива и официално да могат да се свалят. Кой знае, може пък и някой, който така или иначе чете от екрана, да види каква е бозата и да реши да се включи и да я дооправи.
Закон на Мърфи: ако мнението ми във форума може да бъде разбрано погрешно, то това ще стане!
Аватар
Boman
 
Мнения: 89
Регистрация: 03 февруари 2007, 08:24

Мнениеот Mandor » 03 ноември 2008, 18:27

Тъй като темата започна с "Дракони на пролетната зора", реших да го дам за пример.
Ако произведението беше редактирано и форматирано, валидирането щеше да ми отнеме около 5 мин. За това произведение загубих един час.
В началото трябваше да оправя началата на параграфите, защото имаше всички възможни варианти: с табулатор, с интервал, с два интервала и т.н. до 5 интервала. За да стане тази задачка по-интересна, повечето от отстъпите с интервали всъщност бяха разкъсани редове. Общо некоректни редове - 540 бр. Наложи се да ги поправям един по един, защото (както вече казах) някои бяха от разкъсани параграфи, а други - нормален нов параграф, но с лош отстъп. Паралелно с това почистих и около 330 интервала в края на редовете - отново половината бяха поради разкъсани параграфи, другата половина - остатък от сканиране, плюс странни комбинации като "точка - десет интервала - апостроф". Това отне половин час.
Следващият половин час измина в поправяне на следните проблеми:
Поправка на стихотворенията, в които нямаше отстъп. Форматиране на стихотворението от анотацията, което беше оставено цялото в един параграф (може и така да е в оригинала, но едва ли - имаше твърде много интервали между строфите). Поправка на тиретата - всички "вътрешни" дълги тирета бяха къси, а 40 от тях бяха залепени от едната страна за текста. Преформатиране на всички кавички; бяха използвани нормални отварящи и затварящи кавички, но освен тях имаше и обикновени ("), които се използваха както за отварящи, така и за затварящи.
След това текстът беше прекаран през макросите ми за проверка, където бяха поправени грешки от рода на:
Код: Избиране на всичко
Думи, които Някога бяха описвали
Малките дракони, вкусили в, го нападнаха отново
Танис се 'разхлипа.
Танис скочи па крака.
Тогава няма да им? сила на света
Знам. името му, Учителю
Пътуването беше дълго|и тежко
С треперещи ръце се. зае с механизма
И т и ли ще се предадеш на рицарите?
червената си,роба
кафявите п очи заблестяха от гняв
злото, което видя ~ мъжът имаше вид на човек

и т.н. - 90 броя. По време на тази дейност по случайност бяха открити места със залепени параграфи, както и пряка реч без водещо тире. Освен това в книгата със сигурност има акцентиран текст (героите си говорят по нещо като телепатия), който е изгубен тотално и не може да се различи от основния текст.
В това описание не включих полуавтоматичните корекции като: замяна на три точки с многоточие, корекция на два последователни интервала (или интервал-табулатор вътре в текста) и т.н. Да не говорим, че заглавията от първо ниво бяха съответно: Книга 1, Книга 2, КНИГА 3.
Накрая текстът беше прекаран през конвертора, който откри 7 грешни кавички (3 неотворени и 4 фалшиви), които бяха поправяни една по една.
Принудих се да загубя още минута-две, за да намеря информация за оригиналните имена на авторите и произведението, както и годината на написване. Кой е преводачът - нямам представа, нито коя година е издадено.
Резултат: един час форматиране на текст, за който съм убеден, че повечето стихотворения имат грешки в разделянето на строфите, а доста параграфи са слети неправилно.
Приятно четене!
Mandor
 
Мнения: 752
Регистрация: 19 август 2006, 10:56

Мнениеот piki » 03 ноември 2008, 18:41

Здравейте... и аз бях озадачен от факта, че готови, редактирани книги, в добро състояние и форматирани в SFB, продължават да стоят в раздел "Сканиране". Но си го обясних с факта, че сигурно само Борислав има право да ги качва, а той може да е зает. В такъв случай, може да даде права на 1-2ма проверени и доверени ентусиасти, запалени от цялата идея на този сайт и нещата ще потръгнат. Все пак библиотеката се популяризира постоянно (аз лично изпращам линкове на много мои приятели и контакти), хора проявяват желание и инициатива, но понякога те не са достатъчни за направата на сносно дигитално копие. Мисля, че освен нови валидатори/модератори, трябва едно ръководство/правилник, сложено на видно място в началото на сайта, как долу горе трябва да изглежда един текст, готов за качване в Библиотеката. Да не се чудят после, защо "готовите" текстове не се качват с месеци.

Колкото до сканиране, редактиране и валидиране... винаги съм се чудел как пускат текстове, директно след разпознаването, без дори да погледнат на какво прилича текста, а той е ужасен. И после трябват 2-3ма да го дооправят 1 месец, да търсят книгата, да молят за отделни страници и т.н. Пресен пример ми е Тери Гудкайнд "Вярата на прокудения". Книгата мина множество редакции и единственото, което помогна накрая е - цялостно изчитане в Notepad++ и оправяне на всяка срещната грешка. И понеже не исках да я чета предварително, се наложи да изчета и другите книги преди нея (5) за да се захвана с редакцията. Не съжалявам обаче :)
piki
 
Мнения: 65
Регистрация: 08 септември 2007, 11:35

Мнениеот GeOrg » 03 ноември 2008, 20:16

Аз бих настоял(мисля че съм го правил вече), всички текстове които са качени в сайта и не отговарят на определени критерии, да се свалят в някакъв неофициален огледален раздел на сайта. Наречете го "Валидиране" или там каквото се реши, но задължително новите текстове и текстовете с проблеми да седят там и да се качват в официалната част единствено след тяхното привеждане в изрядно състояние.

Лично аз изпитвам срам пред автори и преводачи, чиито труд тук е качен в отвратително състояние. Да не подхващам темата с издателите, един от основните аргументи против нас е наличието на такива недоразумения в официалния раздел. Според мене вече е наложително да обърнем внимание и на самото качество. При положение, че нещата опират само до брой качени текстове, то аз предпочитам да не съм част от такъв проект! Ако ще си отделяме от личното и свободно време то нека е за нещо от което няма да се срамуваме. Кой колкото може, когато може, но така както трябва. Както се казва "Ако ще е гарга - рошава да е!" :D
Може и така да е, ...!
Аватар
GeOrg
 
Мнения: 203
Регистрация: 04 август 2006, 15:52
Местонахождение: Пловдив, Ивайловград

Мнениеот SecondShoe » 04 ноември 2008, 15:11

Хората, които се грижат за този сайт го правят безплатно и никой не може да има претенции към тях. Хората които сканират също го правят безплатно и към тях няма ясни изисквания. Според мен администраторите на библиотеката биха си спестили часове излишен труд ако поднесат по подходящ начин желанията си относно работата на сканировчиците. Темите във форума не вършат работа. Когато някой тръгне да сканира книга трябва да бъде уведомен по учтив и ясен начин какво е желателно да направи за да улесни последващото добавяне на книгата в библиотеката. Сега се разбира само, че админа не обича платените програми, което не е от помощ за никого. Трябват ясни, приятелски настроени инструкции, които започват с "как да включим компютъра" и свършват с "ако сте изпълнили тези изисквания, значи книгата е готова за качване". Не съм наясно с тънкостите на сканирането и редактирането, иначе сам бих направил такъв помощен модул. Хората, които са наясно са малко и това води до описаните от Мандор проблеми. Явно има неща, които админите могат да оправят за секунди с техни макроси, а на мен биха ми отнели часове. Трябва да се изхожда от презумпцията, че хората, които сканират разбират малко от компютри и от тях да се изисква само най-важното, което би отнело време на всеки. Не намесвайте сканировчиците там където автоматизираните процеси разработени от опитни с компютрите хора вършат работа. Там където няма ясни правила има хаос. Мандор и Борислав вече са нясно с това.
Форума не е решение на проблема. Трябват отделни помощни страници в самия сайт, поднесени така че сканировчика да не може да ги пропусне. В тях трябва да има картинки и обяснения на прост език, които да са разбираеми за човек с минимални познания за компютрите и с максимално желание да помогне.
Аватар
SecondShoe
 
Мнения: 421
Регистрация: 16 август 2006, 04:55

Мнениеот Mandor » 04 ноември 2008, 16:40

SecondShoe, извинявай, но този път изобщо не съм съгласен с теб.
Местоположението на инструкциите няма никакво значение. Който иска, ще ги прочете от форума, и то не само от този, а и от други - стига да има интерес да подобри качеството на работата си. Какво като вече има страница с основното описание на формата? Само четирима души пращат форматиран текст. Какво като на всяка страница "Добавяне на ново произведение" пише да се качват txt, odt или rtf? Все още качват doc-файлове.
Какви инструкции за редакция могат да се напишат, така че да ги изпълняват? Мислиш ли, че някой следва инструкциите за начална редакция след сканиране? Ами! Най-много един на 50 текста не съдържа нито един от проблемите, описани в темата. А и по същество това са инструкции не как да се редактира текстът, а как да се приведе във вид, наподобяващ редактиран текст - да се премахнат най-грубите грешки при разпознаване, подлежащи на автоматизация. Останалото се учи по български език. Едва ли с няколко инструкции ще успееш там, където учителите и за десет години не са се справили.

Още един пример за немарлива работа:
Скоро намерих оригинала на «Нова пролет», който беше представен като изцяло завършен. В около половината нечетни страници горната 1/4 от текста представляваше нещо такова:
Стомахът й се сви от хладен ужас, като
лед Боеше се, че следващия път ще помоли Елай-
натежала оуц Едайда нямаше да спре - сигурна беше в това и
да Да спре.
°Т ТнВязЙареантЛаасле^етретото посещение на Елайда вместо нея ги
« п1 Мириън, в леглото на Сюан, за да им предложи Цяра.

Какви инструкции би могъл да дадеш на човек, който работи по такъв начин?
Mandor
 
Мнения: 752
Регистрация: 19 август 2006, 10:56

Мнениеот Boman » 04 ноември 2008, 17:48

Всичко е просто. Старайте да оправите всички грешки и да запазите оригиналната форматираща информация. Форматирането на SFB не е задължително. Който не желае, да не го прилага.

Качвайте txt файлове, ако сте форматирали текста с SFB. Качвайте rtf, odt или html, ако не сте ползвали SFB, за да не се загуби оригиналното форматиране и друг да го може да го довърши.

Почти всичко необходимо за тези, които се захващат с това, се намира в раздел „Сканиране“ във форума. Всичко останало е в сферата на общата култура. Досега всички въпроси във форума са получили отговор, така че няма извинение да не се пита за нещо, когато не е ясно.

Не може да има универсална рецепта как стават нещата, защото всеки го прави по негов си начин. Могат да се формулират само крайните изисквания, които са ясни — чист от грешки текст, към който е добавена форматираща информация.
Закон на Мърфи: ако мнението ми във форума може да бъде разбрано погрешно, то това ще стане!
Аватар
Boman
 
Мнения: 89
Регистрация: 03 февруари 2007, 08:24

Мнениеот SecondShoe » 04 ноември 2008, 18:37

Какво значи немарлива работа? За работа се получава заплащане. Хората, които сканират са самодейци и не са длъжни на никого за нищо. Сигурен съм обаче, че ако получат инструкции биха ги спазвали. Местоположението на инструкциите има значение както и тяхната форма. Във форума информацията изглежда подредена само за редовните посетители, но някой нов трудно ще разбере нещо. Да не говорим за някой нов, който не е на ти с компютрите.
Библиотеката има много добра функционалност, но все още е настроена неприятелски към потребителите. Това важи в особена степен за раздел Сканиране. Ако искаш нещо от потребителите трябва поне да го... поискаш. Това, че е писано нещо, някъде из форума не значи, че всички са го чели или са длъжни да го прочетат. В раздел Сканиране най-малкото трябва да пише, че трябва да прочетеш определени теми във форума преди да започнеш да сканираш. Хората не притежават телепатични способности или скрити сили, които да ги насочат към информацията. Няма информация какъв е необходимия минимум от действия, които трябва да извършат хората преди да пратят текст.
Например:
1. Пускане през спелчекер.
2. Оправяне на новите редове.
3. Оправяне на чертичките за пренасяне.
4. и т.н.
Големия проблем на програмистите е неспособността им да се поставят от другата страна. Без да си представиш как би изглеждало това, което си направил през погледа на средностатистическия потребител, нищо не става. Само защото за един нещо изглежда очевидно, не значи че за всички останали е така.
Никой не може да се сърди или да се ядосва (поне не открито) на човек, който на добра воля е загубил часове за да сканира книга и поради незнание и неумение не е достигнал някакви неписани стандарти. Има три варианта: 1) Книгата се връща за редактиране и чака някой да я довърши като се обясняват внимателно грешките на този, който я е сканирал, за да не ги допусне пак. 2) Отива в коша и в останалите библиотеки, където се качва всичко без оглед на качеството. 3) Сърдиш се публично на човека и му правиш резки забележки, а той завинаги се отказва от сканирането на книги.
Не разбрах, някой има ли нещо против тезата ми, че ако се сложат подробни систематизирани инструкции и линкове в страницата откъдето започва сканиране на нова книга, ще се намалят случаите подобни на "Нова пролет"? От първостепенна важност ли е, че някои пращат книгите в doc формат?
Аватар
SecondShoe
 
Мнения: 421
Регистрация: 16 август 2006, 04:55

Мнениеот Boman » 04 ноември 2008, 19:54

ПРЕПРАТКИ КЪМ ВЕЧЕ НАПИСАНИ СЪВЕТИ:
„Сканиране“ с цифров фотоапарат Съвети за начална редакция след сканиране Автоматизирано оконтрастяване на сканирани изображения Кратко описание на SFB-формата Още за SFB-формата

МОИТЕ ПРЕДПОЧИТАНИЯ
При разпознаването:

Слагам сюжетните разделители (два празни реда или по един празен ред около (* * *)) веднага и също тогава предпочитам да слагам и по два празни реда преди заглавието на глава и един празен ред след него. Също така, в същото време премествам всички бележки под линия където трябва да бъдат и им слагам квадратните скоби [ ].
2. Проверявам набързо само за лоши нечетливи пасажи с „маймуни“.
Предварителна редакция в Word: (Със забранено всякакво автоматично форматиране на абзаци!)
Важно: Запазвам копие от оригиналния файл с номерата на страниците, за да мога да намеря пасаж за справка в оригиналната книга.

1. Най-напред махам всички опционни знаци за пренос (optional hyphens) наведнъж.
2. Махам всички ненужни интервали (замествам два интервала с един докато не останат такива). Забележка: Махам всички интервали след и преди знак за нов ред ( ^p )
3. Оправям кавичките и многоточията - няма значение в какъв ред. Забележки:
а) Ако качеството на многоточията не е добро, проверявам за всички варианти: (. . . ) (.. .) (. ..)(,..) (.,.)(..,) и т.н.
б) Понякога разпознава грешно кавичките като '' (два апострофа) или ,, (две запетайки)!
4. Махам всички | _ ^ (търся ^^, защото ^ е специален форматиращ символ в Word)) или ги замествам с █ ▀ ■ ● ▄▐, за да се набиват на очи при четенето.
5. Махам всички ; : , . \ / < и > когато са в началото на ред (след ^p).
6. Махам всички | \ / < и > когато са в края на ред (преди ^p).
7. Правя пак точка 2 (интервали); това може да се прави по всяко време.
8. Сега за тиретата — това винаги работи:
8.1. Правя 2 къси тирета (--) на дълго тире (—).
8.2. Ако късо тире има интервал пред него ( -), го правя интервал-дълго_тире-интервал ( — ). Правя същото за късо_тире-интервал (- ) и интервали от двете страни на късо тире ( - ). Късите тирета никога нямат интервали около тях. Частните случаи с тиретата (най-често знаци за пренос) се оправят при четенето.
8.3. Търся всички дълги тирета (—) и им слагам интервали от двете страни ( — ). Сега правя пак точка 2 няколко пъти (махам също водещите интервали в началото на ред). Така съм сигурен, че дългите тирета имат винаги по един интервал от двете страни, освен в началото на ред.
9. Замествам всички край_на_ред (^p) с край_на_ред + табулатор (^p^t). Сега замествам (^p^t^p) с (^p^p) няколко пъти, за да махна табулаторите, които са сами на ред.
10. Проверявам за прекъснати абзаци на грешно място с ^$^p. Забележка: Изцяло слети абзаци се хващат само с четене.
Редакция в Word:

Всички останало се оправя при четенето и използвам безплатния правописния речник (ItaEst).
Внимавам за малко ф вместо голямо Ф. Внимавам за 0 вместо О, напр. О’Райли или О!.
При самото четене веднага слагам форматиращите елементи на SFB с изключение на обикновения наклонен текст, ако е много, и махам номерата на страниците.
След прочитане на цялата книга маркирам целия наклонен текст наведнъж в розово, за да се вижда лесно и го форматирам с _. Накрая записвам файла в txt UTF-8.

Ако се налага, накрая отварям файла в обикновен текстов редактор (но не Notepad) и сменям наведнъж затварящите кавички с .
Закон на Мърфи: ако мнението ми във форума може да бъде разбрано погрешно, то това ще стане!
Аватар
Boman
 
Мнения: 89
Регистрация: 03 февруари 2007, 08:24

Мнениеот tsvetika » 05 ноември 2008, 02:54

Здравейте,
чета книги от библиотеката още от създадаването й. От скоро се включих в редактирането. Когато изчетох първата книга за редакция оправих правописните грешки, които намерих, празни места и тирета и ... изтрих всички "тагове" на SFB-формата. Помислих, че са символи останали от сканирането. После, доволна от положения труд, качих "редактираната" книга. Не мога да се сетя защо се разрових във форума и намерих темата за SFB на Mandor. Оказа се, че съм създала допълнителна работа вместо да помогна. Редактирах отново книгата и пак я изпратих. Може би грешката беше моя, че не потърсих преди това във форума за изисквания при редакция.
Мисля, че е добре в раздел Сканиране да се сложат изискванията на SFB формата, всички написани съвети при сканиране и да се укаже, че е желателно редактираните книги да бъдат така форматирани.
tsvetika
 
Мнения: 1
Регистрация: 05 ноември 2008, 02:23
Местонахождение: Ruse

Мнениеот GeOrg » 05 ноември 2008, 09:39

SecondShoe написа:Какво значи немарлива работа? За работа се получава заплащане. Хората, които сканират са самодейци и не са длъжни на никого за нищо. Сигурен съм обаче, че ако получат инструкции биха ги спазвали. Местоположението на инструкциите има значение както и тяхната форма. Във форума информацията изглежда подредена само за редовните посетители, но някой нов трудно ще разбере нещо. Да не говорим за някой нов, който не е на ти с компютрите.
...
Не разбрах, някой има ли нещо против тезата ми, че ако се сложат подробни систематизирани инструкции и линкове в страницата откъдето започва сканиране на нова книга, ще се намалят случаите подобни на "Нова пролет"? От първостепенна важност ли е, че някои пращат книгите в doc формат?


Съгласен! Предложението е абсолютно адекватно.

Само до преди година оплакванията бяха за малкото качвани нови текстове. Сега когато това се промени е глупаво да очакваме новите хора изведнъж да започнат да работят като ветераните в това начинание. В много сайтове битува тази теза - във форума го има търси и чети. Да има всичко, но е пръснато ако не му е сложена заглавка "Важна тема" и изисква доста време за откриването му. Представете си да сте на мястото на ентусиазиран потребител решил да сканира и качи нещо. Не знаете нищо, започвате да търсите и намирате тук едно, там друго различно от първото на трето място съвсем различно. Объркването ви е в кърпа вързано, а от там ентусиазма започва малко по малко да изчезва. Когато нещо се прави за първи път са необходими ясни инструкции стъпка по стъпка, които гарантират на решилия да даде от времето си човек, че ако го направи по този начин то текста който е сканирал и обработил ще бъде качен в официалната част без проблем. Веднъж минал по пътя и запознал се с технологията сам може да решава по какъв начин да работи, но с ясното съзнание за краен резултат без който няма качване. Да оставим на страна факта, че вече ще знае и за какво става въпрос в темите по въпроса - всичките тези дълги-къси тирета, отварящи-затварящи кавички прекъснати и слети параграфи и ред други ала-бала неща за него.

Честно казано дори аз, докато не започнах да редактирам много тези неща не ми бяха ясни, а и за какво? За мен обикновените кавички си бяха кавички, да правя разлика между тирета... а'е стига бе някаква си чертичка там. Всеки завършил училище тези неща в ръкописен текст ги спазва машинално и въобще не се замисля, и така трябва да бъде, но тук изобщо не става въпрос за домашно писане, а за труда на автори и преводачи. Труд който точно ние събрани тук трябва да уважаваме и да направим всичко което можем по въпроса. Сега вече това което редактирам мога да кажа, че рядко ще се открие някаква грешка, но в началото изобщо не беше така.
Може и така да е, ...!
Аватар
GeOrg
 
Мнения: 203
Регистрация: 04 август 2006, 15:52
Местонахождение: Пловдив, Ивайловград

Скоро

Мнениеот Борислав » 05 ноември 2008, 15:01

Вече няколко дена съм без Мрежа, та затова и дори валидираните от Мандор текстове стоят на опашката. Тази седмица ще добавя някои от тях, а следващата събота и неделя ще се опитам да подобря раздела за сканиране.

Някой ще се наеме ли да напише кратки и ясни правила за този раздел? Евентуално, за някои по-обширни теми ще създадем помощни страници и ще препращаме към тях от правилата.

Ще добавя също и поне две отметки при обработката: 1. Пълна редакция; 2. Валиден формат SFB. Едва когато и двете са избрани, текста ще се показва като готов за добавяне.
Аватар
Борислав
 
Мнения: 987
Регистрация: 15 ноември 2005, 17:25

Мнениеот hammster » 05 ноември 2008, 19:27

Малее, два дни нямах време да пусна РС-то, и днес като го пуснах темата се е "издължила" до петите ми :D.
Искам първо да се извиня за гневно-саркастичния тон в началото, защото ако някой беше споменал във форума (винаги чета новите мнения по дадена тема, макар и рядко да взимам участие), че причината е голямото количество файлове (повечето некачествени)и предимството на SFB форматът, щях да замълча.
Второ искам да уточня, че не съм против SFB файловете. При положение, че имам 1 в най-добрия случай 2 часа свободни (главно вечер), които не ми стигат за нищо, форматирането в SFB би ми губило ценнни минути, през които мога да свърша нещо друго. Четейки форума стигам до заключението, че няма програма която да слага маркерите автоматично, иначе бих я пробвал, но да ги слагам на ръка...
Някои ще кажат "аз за два часа ще сканирам и редактирам 2 книги".
Да, но при мен не така. Аз не разбирам от макроси, дори не съм на ти с английския, и затова нещата при мен стават по-бавно. Надявам се обаче, че компенсирам с търпение, усърдие и рутина, разчитайки на Оpen Оffice за правописна проверка и Atlantis за автокорекция, както и на очите си :D. Надявам се, че пращам доста добри книги. Поради горните причини, (май съм го споменавал и на друго място във форума)принципът ми е да редактирам само файлове на които имам книжното издание (или картинките), за да мога да наместя с отворена книга в ръка слетите абзаци, от които страдат повечето произведения тук.
С пари можеш да купиш книга, но не и знание.
Аватар
hammster
 
Мнения: 79
Регистрация: 08 юли 2006, 20:24
Местонахождение: София

Мнениеот Mandor » 06 ноември 2008, 10:00

hammster
Не, не смесвай нещата. Не е въпросът да си "за" или "против" формата, който се използва в библиотеката. За да се изведе книгата качествено (на сайта), тя трябва да е форматирана по някакъв начин. Дали ще е SFB, дали ще е HTML, дали ще е XML - няма никакво значение; въпрос само на решение на собственика на сайта. Дали ако той беше избрал HTML, щеше да има повече хора, които да пращат форматирани текстове? Едва ли. А и според мен SFB е по-прост от HTML и дава възможност на повече хора да го използват.
Колкото до автоматичното поставяне на маркери - ако беше възможно, щеше да се прилага за произволни типове текстове - .odt, .doc, .rtf и т.н. За съжаление някой трябва да укаже - това е заглавие, това е стихотворение и т.н. Частична автоматизация при конвертиране на форматирани текстове (odt, doc и rtf) в SFB би била възможна, ако текстовете се форматираха както трябва - с използване на стилове. Отново "за съжаление" - не съм виждал някой да ги използва (говоря изобщо, не само за редакторите тук).
Именно затова оставяме хората да правят това, което им е интересно и с което се справят добре. Не задължаваме никого да покрива целия "производствен цикъл"; единственото условие е етапът, на който са спрели, да бъде приключен както трябва.

Две странични забележки:
След като изчиташ и форматираш текста си (правиш заглавията центрирани и удебелени, вмъкваш бележките под линия като истински бележки и т.н.), не виждам голяма разлика в разхода на времето, ако просто поставяш по едно ">" пред заглавията, оградиш забележката под линия с [...] и т.н. Но това е само мое мнение, и освен това съм предубеден по темата. :)
Второ: Ако някой забележи, че по време на работа извършва множество еднотипни действия върху текста (напр. поредица от търсения и замествания), нека да поиска помощ във форума - такива действия направо си плачат за някаква автоматизация.

Хм, както е тръгнало, дали да не обособим отделна секция във форума, "Редакция". Че сега всичко се слага в "Сканиране"... :?
Mandor
 
Мнения: 752
Регистрация: 19 август 2006, 10:56

Мнениеот piligrim » 06 ноември 2008, 13:03

Може би някой трябва да обясни каква е целта на SFB форматирането...

Mandor е написал:
Имайте предвид, че този формат описва структурата на художественото произведение, а не начинът, по който се форматира и извежда.

Тоест по никакъв начин не влияе на начина по който произведението изглежда на монитора или на екрана на електронна книга..? Освен, че из текста се джуркат разни странни символи...

И си е точно така! Аз поне до този момент не съм видял рийдър, който да се съобразява с въпросните форматиращи символи както е например при FB2 форматирането...
Когато например срещна символа „>>” пред текста „Глава 1” трябва да си кажа: „Аха! Това е първа глава от книгата!”..? Рийдъра нито центрира текста, нито пък го показва с удебеляване – просто пред него има „>>”. Нито пък символа "_" поставя курсив и т.н.

Та каква е целта? Пред кого въпросният формат описва въпросната структура? Пред човек или пред софтуер?

Например: Подавам текста в този вид...
Код: Избиране на всичко
      ВЕЩЕРЪТ
      Последното желание
      Анджей Сапковски
     
      Гласът на здравия разум 1
     
      Тя дойде при него на зазоряване...

                                   ***
     
      ВЕЩЕР
     
      I
     
      По-късно говореха, че този човек е дошъл от север, откъм Въжените порти...
 
                                   ***

... след което той приема този вид
Код: Избиране на всичко
|       ВЕЩЕРЪТ
|       Последното желание
|       Анджей Сапковски
     
>       Гласът на здравия разум 1
     
        Тя дойде при него на зазоряване...

                                   ***
     
>>      ВЕЩЕР
     
>>>     I
     
        По-късно говореха, че този човек е дошъл от север, откъм Въжените порти...
 
                                   ***

Аз лично бих предпочел първият вариант, когато чета книгата, но ако за нуждите на библиотеката е нужен вторият – лошо няма. Тези допълнителни символи не ми пречат чак толкова много!

Но!? Та каква е целта все пак???
Аватар
piligrim
 
Мнения: 55
Регистрация: 18 април 2007, 22:32
Местонахождение: Русе

Мнениеот GeOrg » 06 ноември 2008, 14:06

Наистина, защо линковете за сваляне не са към текстове в които липсват тези символи за форматиране в SFB? До колкото разбирам от прочетеното до тук по темата, SFB служи за визуализиране при четене онлайн и няма друго приложение, освен ако не се напише програма четец на текстове съобразена с този формат която да ползваме!
Може и така да е, ...!
Аватар
GeOrg
 
Мнения: 203
Регистрация: 04 август 2006, 15:52
Местонахождение: Пловдив, Ивайловград

Мнениеот Mandor » 06 ноември 2008, 14:54

piligrim написа:Може би някой трябва да обясни каква е целта на SFB форматирането...

Ще се опитам. И въпреки че съм убеден, че всичко това вече го знаеш, може на някой друг да му е интересно.

Както вече споменах, всяка нормална интернет-библиотека трябва да използва единен вътрешен формат за представяне на произведенията в нея. Конкретният формат зависи единствено от автора на сайта. В последствие този текст се преобразува от сайта и се предоставя на потребителя във вид, удобен за четене. Виждал съм библиотеки, които предоставят TXT, RTF, PDB, iSilo и още една-две версии на един и същи текст, като преобразуването се извършва "в движение", т.е. на сайта не се държат по 5-6 версии (формата) на един и същи текст. Докато поддържах сайта си, предлагах три варианта на текстовете - FB2, HTML и TXT. Всички се генерират автоматично от един основен, вътрешен формат. Така мога да обработвам само един "суров" текст, а потребителите могат да си избират подходящия за тях формат за четене.

Смятам, че достатъчно добре обосновах необходимостта от единен формат за коя да е електронна библиотека. И тук започва интересното. Всеки текст, който се качи на сайта, трябва да е в избрания от администратора вариант. Естествено, някой трябва да го преобразува в този формат. И това е един от основните критерии за избор на формата - да може сравнително лесно да се обработва. Например HTML е достатъчно известен, има безброй редактори за него, но допуска твърде голяма свобода при форматирането. На практика няма браузер, който да покрива пълният диапазон от HTML-спецификации, или поне няма такъв, при който всичко работи както е описано. Освен това преносимите четци обикновено реализират доста ограничено подмножество на HTML-а, което води до невъзможност за нормално извеждане на текста.

Примери на различни варианти за форматиране:
Повечето руски библиотеки използват FB2-формат, който всъщност е XML-диалект и текстът от примера ти ще изглежда така:
Код: Избиране на всичко
<FictionBook>
<!-- Тук пропускам раздела, в който се описва автор, заглавие, преводач и т.н. метаданни за произведението --!>
<body>
<section>
  <title>
    <p>Гласът на здравия разум 1</p>
  </title>
  <p>Тя дойде при него на зазоряване...</p>
  ...
  <subtitle>* * *</subtitle>
  ...
</section>
<section>
  <section>
    <title>
      <p>ВЕЩЕР</p>
    </title>
    <section>
      <title>
        <p>I</p>
      </title>
      <p>По-късно говореха, че този човек е дошъл от север, откъм Въжените порти...</p>
      ...
     </section>
   </section>
</section>
</body>
</FictionBook>


Ако за представянето на текстовете се използва HTML например, положението не е много по-различно:
Код: Избиране на всичко
<H1>Гласът на здравия разум 1</H1>
<p>Тя дойде при него на зазоряване...</p>
<p align="center">* * *</p>
...
<H2>ВЕЩЕР</H2>
<H3>I</H3>
<p>По-късно говореха, че този човек е дошъл от север, откъм Въжените порти...</p>


Логично е да се предположи, че никой няма да се заеме с форматиране на текстове в такива формати. Аз лично не бих се заел.
И тъй като този проблем вече е поставян (как да се предостави на потребители възможност за въвъждане на форматиран текст) и е предложено добро разрешение (уики-системите, например wikipedia), необходимостта от преоткриване на колелото отпада - текстовите маркер са напълно подходящ компромис между сложността на работа с тях и изискванията към крайния резултат.
Както неведнъж съм отбелязвал, SFB-форматът е начин за текстово представяне на FB2-файлове. За FB2 има написани много четци (за Windows, Linux, Mac, дори за мобилни платформи, включително телефони), има и конвертори към други формати. Първоначалната идея беше да се предостави възможност за изтегляне и в други формати, но след реализацията на базовите възможности Борислав потъна до гуша в обработка на входящите текстове и подобренията по интерфейса и все още не е намерил време за разширяване на функционалността в тази посока. Поради забавянето на тази функционалност написах и конвертора, който преобразува SFB-текстовете от сайта в FB2.

Колкото до фразата "форматът описва структурата на художественото произведение, а не начинът, по който се форматира и извежда", се има предвид следното. Маркерите посочват типа на текста, а четецът извежда този текст така, както го е настроил потребителя. Например акцентираният текст в сайта се извежда наклонен, но според настройките по подразбиране в HaaliReader (доскоро това беше най-разпространения FB2-четец за Windows и PocketPC) той се извежда със син цвят. Това е аналогично на ситуацията с печатните книги в миналото, когато печатарите нямаха наклонени букви и набираха акцентирания текст с по-голяма разредка между буквите.

piligrim, ти си щастлив притежател на V8 и ако не те мързи да конвертираш, бих ти препоръчал два метода за получаване на форматирани текстове, за да не четеш "плосък" текст, а да се насладиш на всички възможности на формата. И двата метода изискват начално конвертиране на текста във FB2-формат, след което:
1. Можеш да си смениш програмното осигуряване в четеца и да изпробваш неофицалния "Ежик Reader", който поддържа директно FB2. Ако не ти хареса, винаги можеш да върнеш оригиналните програми обратно.
2. Можеш да използваш конвертора, който преобразува FB2 в WOL-файлове. Тогава размерът ще стане доста голям, но затова пък книгите ще се отварят и прелистват по-бързо. Освен това имаш големи възможности за настройки - шрифт, големини и т.н. Между другото, докато бях с V8 (за около година), използвах само този метод. Сега съм с V3 и чета директно FB2.
Ако имаш затруднения с намирането на описаните програми, пиши ми.

GeOrg, ако линковете към текста бяха такива, цялата дейност по форматирането се обезсмисля. А ако имаш предвид защо няма допълнителен линк, който да връща и чист текст, освен другите възможности, мисля, че вече отговорих на това.
И, да - за SFB няма директен четец, но има конвертор към FB2, за който има много четци. Знам, че това е междинно решение, но за момента е единственото налично.
Всъщност на какво четеш електронни текстове?
Mandor
 
Мнения: 752
Регистрация: 19 август 2006, 10:56

Мнениеот piligrim » 06 ноември 2008, 23:50

:lol: Знам! Ама исках и другите да разберат, колко труд полагате с Борислав за нещо, което трябва да се прави от хората подаващи текстовете! Както добре си го написал:
Всеки текст, който се качи на сайта, трябва да е в избрания от администратора вариант.

Мисля, че има две възможности:

1. Налагате ПРАВИЛА! Няма да обяснявам надълго и нашироко какви - такива, че да не губите излишно време! Като искате, направете една наистина сериозна секция "Редактиране" и се включвайте, когато можете... Но! Докато хората разчитат само на вас да им довършите работата... Накрая ще блокирате, а барабар с вас и библиотеката!

2. Зарязвате я "тая работа" и слагате само архиви с каквото сте получили и линкове към тях...
Представям си само, какви чудесни мутации ще претърпят някои произведения, ако изберете втория вариант... Но..! Какво да се прави?

А относно таралежът – партизанин... Определено се интересувам и ще ти бъда много благодарен ако ми изпратиш явка към него... :wink:
Аватар
piligrim
 
Мнения: 55
Регистрация: 18 април 2007, 22:32
Местонахождение: Русе

Мнениеот piligrim » 07 ноември 2008, 00:22

Ннцъ! Не ми пращай нищо. Намерих го (таралежа де). Ма не мисля да си губя времето с него. Ще изчакам на ICE да му мине мързела...
Май наистина "вола" по-добре ще оре...
Аватар
piligrim
 
Мнения: 55
Регистрация: 18 април 2007, 22:32
Местонахождение: Русе

Мнениеот GeOrg » 07 ноември 2008, 10:24

Mandor написа:...
GeOrg, ако линковете към текста бяха такива, цялата дейност по форматирането се обезсмисля. А ако имаш предвид защо няма допълнителен линк, който да връща и чист текст, освен другите възможности, мисля, че вече отговорих на това.
И, да - за SFB няма директен четец, но има конвертор към FB2, за който има много четци. Знам, че това е междинно решение, но за момента е единственото налично.
Всъщност на какво четеш електронни текстове?


Защо да се обезсмисля!? Според мене дори факта, че улеснява визуализирането за онлайн четене си заслужава труда.

Колкото до останалото разбрах спестява двойно мястото на сървъра. Но имам забележка - това нещо трябва да се обясни в сайта на видно място, да се предложи вариант за използването на формата стъпка по стъпка(от свалянето през конвертирането в FB2, предложение за най-масовия безплатен четец който ще подаде така форматирания текст както се очаква, или начин(макрос) който да изчиства тези символи за форматиране до получаване само на чистия текст. И всеки да избира кое му харесва повече.

Колкото до мене аз ползвам твоя конвертор за поправка и търсене на грешки при форматирането в SFB и за конвертиране. С ICEReader отварям получения FB2 архив и зареждам текста. Мога съвсем откровено да кажа че този четец се справя с малък процент от форматирането което е извършено, но поне не излизат "странни символи" :lol: . С него и чета т.к. не съм намерил за сега по-добър за тази цел.
Може и така да е, ...!
Аватар
GeOrg
 
Мнения: 203
Регистрация: 04 август 2006, 15:52
Местонахождение: Пловдив, Ивайловград

Следваща

Обратно към Сканиране

Кой е на линия

Потребители, разглеждащи форума: Николко регистрирани потребители и 0 гости