@GeOrg,
Мерси за забележката, тъкмо ще направя още някои уточнения. Думи като "росонер" и пр. са в основния речник и не им е мястото в потребителски. Всяка дума, която не е грешка, се смята за валидна словоформа и се включва в основния речник и тук не се ръководя от съображения като официалност или политическа коректност. Ако си любопитен, "росонерите" е на 43'698-мо място по разпределение (
натисни тук) от 1,089,474 словоформи в основния речник (за v1.22), което я прави доста честа дума. По бТВ ще я чуеш почти във всяка спортна емисия. Също така е вярно, че тази дума едва ли някога ще се появи в официален речник. Ако оставя само официалните речникови думи ще трябва да изтрия вероятно стотина хиляди словоформи. В речника има стотици културни феномени, като Аеросмит, Скайуокър, хиляди световни градове, села и геогр. обекти, като Брадфорд, Вюрцбург, Стоунхендж, Хийтроу и пр., които повечето хора дори не са чували. Също хиляди чужди собствени имена. Както и около хиляда думи (и се увеличават) с обратна транслитерация от английски, немски, френски, руски и други езици, напр. администрейшън, айлънд, върджин, Берлинер, гезелшафт, нахрихтен, здравствуй, навсегда, крейзи, обсерватьор, парадайс, парадайз и т.н. Добавям подобни думи само ако нямат близка нормална и често използвана българска словоформа, на които е възможно да са грешка. Затова има и доста известни чужди имена, които умишлено липсват в речника (има и стотина рискови форми, които съм добавял преди година, когато съм бил по-малко стриктен и които ще махна в най-скоро време, напр. "Лех" в тип "име" (от Лех Валенса) може да е грешка на "Лек"). Накратко всяко нещо, което съзнателно авторът е искал да напише с български букви, се счита за валидна словоформа. Напр. потърси в Гугъл "крейзи" или "нахрихтен" и т.н. и ми прати линк с поне един пример, където това е правописна грешка и веднага ги махам от основния списък
Ако си любопитен какво означава дадена дума, включена в речника, отвори файла settings.txt и промени петият ред:
LOAD_BG 0
да стане
LOAD_BG 1
Сега като пишеш само една дума в десния панел, например Брадфорд, ще може да видиш какво точно означава (в случая Брадфорд е в тип "place", т.е. име на населено или географско място и в тип "name", тоест има и такова име на човек). Тип "alltowns" e за населени места в България (напр. Джокари). Тип "cult" e за културни феномени (музикални състави, организации, имена на герои, богове и пр.), напр. Грийнпийс, Хизбула, Екогласност, Еминем, Джокондата, Робинзон, Титаник, Флинтстоун, Херкулес, Гонзо) или измислени от авторите думи, които са добили популярност, напр. Дъмбълдор, Хогуортс. Тип "trans" е за обратни транслитерации, напр. крейзи. Тип "propr" - за собственически имена, като имена на фирми, запазени марки (Майкрософт, Мерцедес-Бенц). Тип "abbr" - съкращения (ВМРО-ДПМНЕ, НЦИОМ, х-л). Ще видиш и други типове, чието значение се подразбира.
Например въвеждаш "Хюстън" в десния панел:
След като разгледаш типовете, върни опцията в оригиналния й вид LOAD_BG 0, защото, при включена опция, програмата зарежда един 40Mb файл с типова информация и това всеки път ще ти бави стартирането на програмата с 5-10 секунди. Има и доста други трикове с опциите, но няма да ги обяснявам, че може би ще има повече вреда, отколкото полза за обикновените потребители.
Още нещо. Ако въпреки всичко смяташ, че не искаш дадена дума да е в речника, тоест искаш да се оцветява в червено, просто отвори файла "b_bulgarian_risk.txt" и я добави на нов ред най-отгоре или най-отдолу (или в сортиран порядък по средата на файла, стига да е на нов ред). Така тази дума, въпреки че е в речника, ще се оцветява в червено. Там съм добавил думи като "па" (грешка на "на") и някои други, но списъка с кандидати не е пълен. Например, току що добавих редкия глагол "крея", тъй като често е грешка на "крия" или "края".
Има и доста краен вариант — да генерирам речник само с основните думи, без никой от изброените по-горе допълнителни типове и да го включа в пакета като алтернативен. Така ще отделяш двойно повече време за коригирането на текст, защото текстът изведнъж ще почервенее яко, но пък няма да имаш съмнение, че си пропуснал нещо.
Би ми отнело 2-3 часа да кодирам работа с няколко потребителски речника и може би ще го направя, като намеря време. Точно сега пиша някои други "благинки", които ще са в следващата версия след няколко дни.