от Mandor » 05 ноември 2010, 10:20
bbbbqwerty написа:Така е. Правена е с DjVuSolo. При други настройки може да се свали до около 54 MB. Но пострадват илюстрациите. Сканираните страници - JPG - са около 2 GB. Ще почакат по-добри времена (програми).

Ако ти се занимава (т.е. — решиш да го направиш както трябва), изхвърли DjVuSolo-то и работи с независими кодировчици. И в момента има добри програми за кодиране, просто форматът е такъв, че по-сложните издания изискват повече ръчна работа при конвертирането в DjVu. За книги с илюстрации най-подходящ е методът на разделените сканове; той се използва няколко години и за момента няма по-добра алтернатива.
Основните проблеми в твоя случай са поне два:
1. DjVuSolo (и наследниците му) не предоставят метод за ръчно сегментиране и се налага да разчиташ изцяло на автоматичния сегментатор, а досега не е написано нищо, което да върши тази работа както трябва. А неправилното сегментиране на страницата води до неадекватно кодиране, и оттам — до непропорционално голям размер. Само за ориентиране — една страница, в която има само текст, се кодира при 600 dpi в около 5-9 KB, в зависимост от гъстотата на буквите.
2. JPEG като изходен материал е гадна работа. Ако го подадеш директно на DjVu-кодировчик, ще получиш огромен файл. Изобщо не е трябвало да записваш скановете в JPG, но какво пък — белята вече е направена. Тъй като едва ли ще сканираш книгата отново, ще се наложи предварителна обработка на скановете преди да се подадат към DjVu-кодировчик.
Отсега предупреждавам, че оптималното кодиране на книга с илюстрации е тежка, но за сметка на това — продължителна и досадна работа.

Ти си реши дали имаш време и нерви да се занимаваш с нея.
[quote="bbbbqwerty"]Така е. Правена е с DjVuSolo. При други настройки може да се свали до около 54 MB. Но пострадват илюстрациите. Сканираните страници - JPG - са около 2 GB. Ще почакат по-добри времена (програми). :)[/quote]Ако ти се занимава (т.е. — решиш да го направиш както трябва), изхвърли DjVuSolo-то и работи с независими кодировчици. И в момента има добри програми за кодиране, просто форматът е такъв, че по-сложните издания изискват повече ръчна работа при конвертирането в DjVu. За книги с илюстрации най-подходящ е методът на разделените сканове; той се използва няколко години и за момента няма по-добра алтернатива.
Основните проблеми в твоя случай са поне два:
1. DjVuSolo (и наследниците му) не предоставят метод за ръчно сегментиране и се налага да разчиташ изцяло на автоматичния сегментатор, а досега не е написано нищо, което да върши тази работа както трябва. А неправилното сегментиране на страницата води до неадекватно кодиране, и оттам — до непропорционално голям размер. Само за ориентиране — една страница, в която има само текст, се кодира при 600 dpi в около 5-9 KB, в зависимост от гъстотата на буквите.
2. JPEG като изходен материал е гадна работа. Ако го подадеш директно на DjVu-кодировчик, ще получиш огромен файл. Изобщо не е трябвало да записваш скановете в JPG, но какво пък — белята вече е направена. Тъй като едва ли ще сканираш книгата отново, ще се наложи предварителна обработка на скановете преди да се подадат към DjVu-кодировчик.
Отсега предупреждавам, че оптималното кодиране на книга с илюстрации е тежка, но за сметка на това — продължителна и досадна работа. :wink: Ти си реши дали имаш време и нерви да се занимаваш с нея.