Конвертиране към SFB?

Един е питал, друг — отговарял…
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
MrDeath
Мнения: 5
Регистрация: 06 януари 2014, 12:16

Конвертиране към SFB?

Мнение от MrDeath »

Здравейте и за много години на всички :)

Прочетох някои заяждания от миналата година на тема добавяне на нови книги към Читанка. Разбрах за прословутия входен формат SFB. Понеже потребител Борислав написа в темата "конвертиране, книги от други сайтове", че лесно може да се конвертира към SFB, аз искам да попитам как е това лесно?

Накратко:
Събирам текстове от разни източници (сканирани .doc, .pdf, сайтове и други), правя оформление, редакция и използвам calibre за да получа EPUB. Този формат го качвам на четеца си и четейки, правя още една корекция на текста. Следва преформатиране на текста и отново получаване на EPUB или FB2. Почти същото правя и със свалени от читанка книги. Например наскоро редактирах трилогията "Синовете на Великата мечка" на Лизелоте Велкопф-Хенрих, която е ~ 2000 печатни страници.

Понеже това е доста труд питам за програмка, която да конвертира някой от популярните формати към SFB, който е входен формат за читанка. Както прочетох във Wiki трябва да направя copy&paste и да започна ръчно форматиране на абзаци, пряка реч, бележки под линия, картинки и т.н.

Наистина имам желанието да споделя моите нови неща, както и корекциите, които съм направил с другите читатели, но НЕ и с цената на повторно прочитане и минаване през ада на форматирането. Моля упътете ме как наистина лесно да мога да допринеса за подобряването на качеството и многообразието на книгите в тази библиотека.

Поздрави!
ckitnik
Мнения: 43
Регистрация: 03 ноември 2008, 09:54

Re: Конвертиране към SFB?

Мнение от ckitnik »

Здравей.

Накратко:
„Прословутият входен формат SFB“ е обикновен txt(UTF-8) с текст и няколко маркера. Най-честно използваните маркери са за глави(секции), бележка под линия, цитат, стихотворение. Главната цел е възможно най-прегледно подреден txt файл, за да бъде лесно на валидатора да го провери.
Събирам текстове от разни източници (сканирани .doc, .pdf, сайтове и други), правя оформление, редакция и използвам calibre за да получа EPUB.
Прекалено широк диапазон формати и начини да се да подходи към всеки един от тях. Калибре не е панацея за ел. книги. Няма как да го използваш, така че да даде резултат, годен за МБ.

Примерен начин за корекция на книги от МБ:
Изтеглям книжка в желан формат, чета и маркирам грешки в съответния четец. Експортирам грешките във файл, за да е по-лесно (аз съм с киндъл и накрая оставам с например greshki.txt). Изтеглям книгата в SFB. Отварям двата файла в текстови редактор по желание — notepad++. Хващам грешка от greshki.txt, ctrl-TAB, търся я в книгата и поправям, ctrl-TAB… до свършване на грешките. Правя запис на поправената книга в Ателието: Синовете на Великата мечка (корекция).
Последната и единствена промяна е направена от ckitnik на 06 януари 2014, 16:16.
„Добрият пътешественик няма твърди планове и не държи да пристигне на всяка цена.“ Лао Дзъ
MrDeath
Мнения: 5
Регистрация: 06 януари 2014, 12:16

Re: Конвертиране към SFB?

Мнение от MrDeath »

Чудесно! Това определено ще работи за евентуални бъдещи поправки. Но какво може да се направи с вече направените поправки?
gogo_mir
Мнения: 101
Регистрация: 01 юни 2010, 00:13

Re: Конвертиране към SFB?

Мнение от gogo_mir »

MrDeath, тук е нужно да се спомене, че не всичко, което се струва грешка на даден потребител, в действителност е грешно...
Интересно ми е, как ще коригираш израза:
„Изведнаж почувствувах, че имам мерак да джворна едно кафе.“ :)
ckitnik
Мнения: 43
Регистрация: 03 ноември 2008, 09:54

Re: Конвертиране към SFB?

Мнение от ckitnik »

Не знам как запазваш корекциите си, но ще пробвам да дам някакъв вариант.
Да кажем, че имаш два почти еднакви txt, в които разликите са само поправените грешки. Такива разлики могат да бъдат намерени с winmerge. Ако успееш да уеднаквиш твоята корекция, както и да си я запазил, с txt или SFB варианта от МБ, издирваш разликите/поправки и ги нанасяш в SFB-книга.

Вярно, че не може да се пишеш редактор и да изменяш както ти е кеф.
Вярно е също, че по текстовете има грешки, за които не се иска висше, че да те дразнят.
„Добрият пътешественик няма твърди планове и не държи да пристигне на всяка цена.“ Лао Дзъ
MrDeath
Мнения: 5
Регистрация: 06 януари 2014, 12:16

Re: Конвертиране към SFB?

Мнение от MrDeath »

@gogo_mir Коригирам основно синтактични грешки. Така че няма "струва ти се - не ти се струва"

@ckitnik Ако имаш txt - ясно :) Познавам някои компаратори вкл. Winmerge. Грешките ги поправям директно в HTML-a. Накрая само Save и готово.
Не те разбрах за грешките и дразненето. Елементарни грешки, но си дразнят. Грешно разпознати символи - също.
gogo_mir
Мнения: 101
Регистрация: 01 юни 2010, 00:13

Re: Конвертиране към SFB?

Мнение от gogo_mir »

MrDeath, това, което само „споменах“, го изкоментира, а това, което ми е „интересно“, го пропусна... :)
MrDeath
Мнения: 5
Регистрация: 06 януари 2014, 12:16

Re: Конвертиране към SFB?

Мнение от MrDeath »

@gogo_mir изкоментирах го, при това грешно. Имах предвид, че коригирам предимно правописни грешки и неразпознати символи. Твоят пример не бих го коригирал, ако текста не е мой. Явно авторът е решил да го състави точно с тези думички. Ако е мой - ще знам какво съм имал предвид под "джворна", бих премахнал "мерак" ако не искам да подчертая нещо за "мислителя"... абе бих променил цялото изречение :)

Относно конвертирането, което е същността на темата, разбирам, че няма такъв лесен вариант. Добре! Тогава коригираните досега хиляди страници остават евентуално за наследниците, а новите - ще видим. Ще пробвам с описаното от ckitnik. Иначе силно бих препоръчал на админи, автори и коректори да се отворят малко към света. Друг вариант е да се затвори изцяло общността и да си правят каквото знаят и както го знаят. За отворена система правилата са много ограничени и строги. В крайна сметка SFB е някакъв вътрешен формат, а останалото са популярни формати, включително и за електронни книги. Не мисля, че е правилно да е задължително изучаването на подобен никому неизвестен формат. Все пак читанка не е от ранга на M$, да "налага" разни шаблони (то и на тях не се отдава прекалено много, защото и те не са без алтернатива). Най-малко пример е текущата тема - ако беше популярен формат, все някой можеше да е седнал и написал конвертор от-към нещо друго. Иначе браво! Мислено, направено, описано, нооо... поддръжката - ами няма такава.

Уф! Твърде дълго и емоционално стана! Както и да е! Ще се постарая да правя ръчно нещата по два пъти... ако ми писне, или ще зарежа, или ще си напиша конвертор.

Темата е приключена за мен. Може да заключите, изтриете или каквото правите в такива случаи.

Поздрави.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: Конвертиране към SFB?

Мнение от Mandor »

MrDeath, съдейки по диапазона използвани от теб програми, не си потребител от категорията „руса секретарка“ („— Браво, дотук само две правописни грешки. Сега пиши втората дума…“), така че се надявам да разбереш какво се опитвам да обясня.

Накратко, както скоро обсъждахме в чата, текстът не е течност, а форматите — различни видове бутилки, в които да се налеят без загуба на обем или съдържание. Избереш ли някакъв краен формат, ти по принуда приемаш и ограниченията му. Няма идеален формат; всеки си има конкретна цел и съответно — ограничения. В този смисъл ePub не е подходящ изходен формат за електронни книги; от него не може да се конвертира еднозначно. Ако са нужни подробности — моля, в друга тема. Само ще подхвърля въпрос за размисъл — как в един ePub ще различиш вътрешна препратка към участък от текста (например като в книгите-игри) от бележка под линия? Виждал ли си ePub-четец, който показва бележките под линия на същата страница, на която се намираш?

Не съм Борислав и не знам какво е имал предвид под „лесно конвертиране“, но в общия случай всеки грамотен потребител може да напише няколко комплекта изрази за „търсене-заместване“, за да си облекчи конвертирането. И като се има предвид, че в около 60% от книгите има само маркери за глави, а в други 30% — по някой епиграф или стих, остават само 10%, които са доста тежки за ръчно форматиране (и напълно невъзможни за автоматично такова).

Разбира се, казаното дотук е само върхът на айсберга. Преди време се опитах да напиша статия по въпроса, но не се получи много добре. Хората все още си мислят, че могат да „прелеят“ текста от DOC или ePub във FB2 и да получат нещо коректно. Но това е друга тема…

Между другото, „прословутият SFB“ е само текстово представяне (по аналогия с уики-системите) на FB2 и покрива функционалността му на около 95%, така че еднозначното конвертиране от FB2 към SFB (и обратно) е напълно реалистично.

П.П. Тъй като двете последни мнения бяха изпратени почти едновременно, нека това съобщение не се счита за отговор на горното.
Аватар
Борислав
Мнения: 1065
Регистрация: 15 ноември 2005, 17:25

Re: Конвертиране към SFB?

Мнение от Борислав »

MrDeath написа:Но какво може да се направи с вече направените поправки?
Качи някъде файловете, за да можем да ги разгледаме.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: Конвертиране към SFB?

Мнение от Mandor »

И отговорът…

MrDeath написа:Относно конвертирането, което е същността на темата, разбирам, че няма такъв лесен вариант.
Ако под „лесен“ разбираш да се натисне един бутон и да се получи желания резултат — да, тогава няма такъв. В повечето случаи ще се наложи да отделиш по около половин-един час на книга (при положение, че е форматирана коректно).
MrDeath написа:Иначе силно бих препоръчал на админи, автори и коректори да се отворят малко към света.
Твърде размита препоръка. Нещо по-конкретно? Да се преобразува библиотеката в склад на всякакви формати, включително и най-езкотичните?
MrDeath написа:Друг вариант е да се затвори изцяло общността и да си правят каквото знаят и както го знаят. За отворена система правилата са много ограничени и строги. В крайна сметка SFB е някакъв вътрешен формат, а останалото са популярни формати, включително и за електронни книги.
За съжаление не сме измислили нищо по-практично, така че ако имаш предложения — ще ги обсъдим. Преди няколко месеца дори се обсъждаше дали да преминем към практиката на „Флибуста“ (потребителите сами качват FB2), включително и вариант с втори, тестов сайт, но след като видяхме какви „недоразумения“ изпращат хората, тази идея беше изоставена.
MrDeath написа:Не мисля, че е правилно да е задължително изучаването на подобен никому неизвестен формат. Все пак читанка не е от ранга на M$, да "налага" разни шаблони (то и на тях не се отдава прекалено много, защото и те не са без алтернатива).
Както вече казах, не сме измислили по-добър начин (за съжаление).
MrDeath написа:Най-малко пример е текущата тема - ако беше популярен формат, все някой можеше да е седнал и написал конвертор от-към нещо друго.
Има конвертор от SFB към FB2, а при наличието на толкова добри програми за преобразуване на FB2 към кажи-речи всичко останало, други специфични конвертори са излишни. Както може да се види по неуспешният опит за конвертор от SFB към PDF. Иначе конвертор към SFB би бил възможен само ако изходният формат е FB2 (макар и не на 100%), но за съжаление през изминалите 8-9 години никой не си е мръднал пръста да направи нещо такова.
MrDeath написа:Иначе браво! Мислено, направено, описано, нооо... поддръжката - ами няма такава.
За съжаление трябва да се съглася с това заключение (е, почти). Опитваме се, но силите не стигат за всичко; явно огромна част от хората предпочитат да вземат, но не и да дават (освен акъл, разбира се).
MrDeath написа:Ще се постарая да правя ръчно нещата по два пъти... ако ми писне, или ще зарежа, или ще си напиша конвертор.
При нужда от помощ за някое от изброените действия — пиши. Както вече казах, всички обичат да дават акъл. :wink:
MrDeath написа:Темата е приключена за мен. Може да заключите, изтриете или каквото правите в такива случаи.
За мен не е приключена. Това е сериозна тема, която за съжаление се заобикаля по най-грозните начини, които позволяват българският бит, нрави и душевност… :(
MrDeath
Мнения: 5
Регистрация: 06 януари 2014, 12:16

Re: Конвертиране към SFB?

Мнение от MrDeath »

Здравей Mandor,

Не съм запознат с форматите за e-book много добре. Всъщност съм ползвал ePub и fb2. Пробвах с един pdf и един .doc, и резултата е голямо разочарование. Вярно е, че и двата бяха сканирани в едни колони, с едни картинки и въртене на страници... и четецът ми се загуби в абзаците. От тогава започнах да ги конвертирам. Понеже бързият резултат обикновено е плачевен, наложи се и да правя някои корекции. После си рекох, че така и така коригирам, поне да е по-пълно. От споменатите два формата fb2 ми допада повече, но fb2.zip е трагедия с моя четец (забравя до къде съм стигнал, маркери, забележки и т.н.). За днес очаквам друг, по-съвремен четец и ще пробвам с него. Според мен ePub е голямо дърво и въобще не може да се говори за входен формат. Точно заради него, бележките под линия ги премествам директно под абзаца в който е препратката. Идеята ми е да се използва някакъв формат, който притежава цялата функционалност на предлаганите от читанка изходни формати. По мое наблюдение ePub и fb2 са базирани на XML. Ако това е така по спецификация, може ли да се ползва този формат като входен?

Редактори за него има колкото искаш (особено в частния случай HTML). Разбира се ще трябва да се направят някои препоръки, ограничения и обяснения. Например MS Word вкарва тяхна си идиотска информация в генерирания HTML и как може да се избегне това. Като препоръка може да се посочи някой малък, свестен и безплатен редактор, а други направо да влизат в черният списък. Разбира се може да се ограничи до версия 4.х, което е отдавна утвърдено. Плюсове могат да бъдат както външната поддръжка и изобилието от средства (tools) за този формат. По-лесно създаване на специфични средства, при наличи на готово API за целта и др.

Мисля, че една малка програмка за редактиране на някои тагове във входящия файл, ще го направи идеален за конвертиране към какъвто и да е друг формат.

Това е от мен и ти благодаря, че подхождаш с разбиране.
Поздрави.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: Конвертиране към SFB?

Мнение от Mandor »

Не, само FB2 е XML-базиран; ePub-ът си е просто HTML (с всички неприятни последици от това), плюс няколко специфични файла за метаданни. Преименувай разширението на някой ePub на .zip и го разгледай.

За съжаление до момента не съм срещал прост редактор за HTML, а и форматът е неподходящ за книги (например — пак проблемът с бележките под линия). За FB2 знам само за два прилични редактора, но и с тях можеш да изготвиш някое недоразумение; освен това си имат други проблеми. Но всичко това съм го написал в статията (включително и за паразитната информация в HTML, изготвян от текстови редактори) — моля те, прочети я. Като допълнение — HTML е крайно неподходящ избор като формат за съхранение, по много причини. И това се разпространява към неговите „деривати“ — ePub, PRC, mobi… На практика единственият смислен формат за съхранение е FB2, но той е ограничен откъм потребителска… „достъпност“, да кажем. Затова и сме стигнали до SFB, колкото и „измислен“ да изглежда за хората, които за първи път се сблъскват с него.

Моят съвет (ако искаш да се занимаваш с тази материя) е да разгледаш малко по-подробно FB2 „отвътре“. Съответно — да подготвяш книгите си само във FB2 и след това да използваш някой от приличните конвертори към ePub (т.е. — не Calibre!), за да ги четеш на четеца си. Освен това FB2 е идеален за автоматично конвертиране към SFB, така че при желание можеш да си напишеш и някой конвертор — много хора тук ще ти се „израдват“ за това.
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: 0 гости