IDI Spell Checker 24.09.15

От време на време се появяват идеи за странични проекти. Обсъждайте ги тук.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.03

Мнение от dd »

Версия 2.03 — 80 нови бг форми и 500+ нови английски значения в преводача.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.10

Мнение от dd »

Версия 2.10 - доста допълнения и корекции във всички бази. Сложих на сайта и FB "Like" бутонче, за да се ориентирам доколко си струва усилието.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: IDI спелчекър v2.10

Мнение от Mandor »

Само имай едно наум, че доста хора не използват FB, но използват твоя спелчекър. Аз, например, няма да мога да „гласувам“.
beertobeer
Мнения: 38
Регистрация: 26 декември 2008, 19:07

Re: IDI спелчекър v2.10

Мнение от beertobeer »

@dd
Ще те помоля за малко разяснения като за хора, които не са спецове в тази област - бих искал да знам какво се променя когато се активира опцията "режим роман"
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.10

Мнение от dd »

beertobeer написа:@dd
Ще те помоля за малко разяснения като за хора, които не са спецове в тази област - бих искал да знам какво се променя когато се активира опцията "режим роман"
Трябва да включиш опцията, когато правиш окончателна проверка на текст, предназначен за Читанката. Остави я изключена, както е по подразбиране, при проверка на всички други видове текстове, примерно статии за/от новинарски и прочие сайтове, субтитри и т.н. При активирана опция програмата проверява дали всички абзаци започват с табулатор (задължително за SFB-формата), като се разпознават и прескачат FSB-таговете. В самите абзаци се прави допълнителна проверка за несъответстващ брой отварящи и затварящи двойки символи: „“ «» "" () {} [] _, като несъвпадащ брой означава пропуснат или грешен символ, който трябва ръчно да се оправи. В левия панел се извежда и обобщена статистика за абзаците и се посочва най-дългия абзац. Най-дългият абзац (примерно цяла страница без нов абзац) като нищо може да се окаже случай на два или повече слепени абзаца. При визуално съмнение за подобно нещо, може да се направи справка с оригинала и евентуалното слепване да се коригира.
smarfietka
Мнения: 1
Регистрация: 08 февруари 2011, 14:24

Re: IDI спелчекър v2.12

Мнение от smarfietka »

А има ли версия за линукс
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.12

Мнение от dd »

Версия 2.17

smarfietka написа:А има ли версия за линукс
Не и вероятно скоро няма да има, тъй като предполагам, че малцина биха се възползвали. Но никога нищо не се знае.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.17

Мнение от petrovich »

Аз също съм "за" версията за Линукс. Пробвах преди няколко седмици под Wine, но не винаги работи, както трябва.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.20

Мнение от dd »

Версия 2.20

Оправих един стар проблем, който не позволяваше автоматичното позициониране в десния панел чрез кликване в левия върху грешки, които са на повече от един ред. Това не касае текстовете за Читанката, тъй като абзаците винаги са на един ред, но беше доста досадно за преводачите на субтитри например, които при всеки такъв случай трябваше да търсят грешката в текста с помощта на Find+replace.

На картинката в левия панел буквата "й" в "най богатите" е с малко по-светъл цвят, което ни показва, че след тази буква текстът продължава на нов ред. Не беше задължително да оцветявам различно буквата, тъй като това нищо не променя, но реших да го направя за нагледност.


Изображение
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.17

Мнение от dd »

petrovich написа:Аз също съм "за" версията за Линукс. Пробвах преди няколко седмици под Wine, но не винаги работи, както трябва.
Би било добре, но истината е, че нишата на такъв вид програми е доста "тясна" и едва ли би си струвало труда за потенциално едноцифрен брой потребители. Та то повечето професионални журналисти не правят правописна проверка, съдейки по многобройни тестове върху статии от уж уважавани издания, а какво остава за "обикновените граждани".
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.20

Мнение от dd »

Версия 2.22 — открива случаите на непълен член след или пред форма на глагола "съм". В редки случаи алгоритъмът открива и несъществуващи грешки (например при обратен словоред), тъй че грешките трябва да се оправят, след като се прочете и осмисли контекста. Грешката е доста честа при текстовете домашно производство, като този на картинката, и нетипична при текстовете в Читанката, въпреки че се среща. Не знам дали този вид грешки трябва да се оправят, или да се оставят както са в печатния оригинал.


Изображение
zelenkroki
Мнения: 89
Регистрация: 06 юли 2010, 14:01
Местонахождение: Трявна
Връзка:

Re: IDI спелчекър v2.23

Мнение от zelenkroki »

Здравейте,

Нямам голям опит с предишните версии, затова вероятно въпросът ми е заради общата грамотност при ползването на програмата.

Ето пример за съобщение при проверката:
предлог пред глагол (обикновено е грешка)
от вся -> no suggestions
Това „вся“ е част от думата „всякаква“ в текста.

Имало ли е подобни неясни моменти при досегашните версии за този вид грешка?

Съзнавам, че е малка вероятността да се случва често точно такова недоразумение при обработването на текстове, дано други потребители да го потвърдят.
Примерът е взет от работа с версия IDI Spell checker v2.23.
По-добре късно, отколкото още по-късно!
yoda
Мнения: 7
Регистрация: 27 октомври 2010, 09:14

Re: IDI спелчекър v2.23

Мнение от yoda »

zelenkroki написа: Ето пример за съобщение при проверката:
предлог пред глагол (обикновено е грешка)
от вся -> no suggestions
Това „вся“ е част от думата „всякаква“ в текста.
Така си е и се случва често. При мене е версия 2.19.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.23

Мнение от dd »

zelenkroki написа:Здравейте,
Ето пример за съобщение при проверката:
предлог пред глагол (обикновено е грешка)
от вся -> no suggestions
Това „вся“ е част от думата „всякаква“ в текста.

Имало ли е подобни неясни моменти при досегашните версии за този вид грешка?
Проблемът вече е обясняван по-напред в темата. Просто в текста ти се срещат едновременно и "от всякаква", и "от вся каква", като второто е грешно. Понеже програмата в някои случаи (невинаги) позиционира чрез просто търсене на проблемния текст в десния панел, когато "от всякаква" е преди "от вся каква" в текста, първото кликване в левия панел намира "от всякаква", затова просто кликни още един-два или колкото трябва пъти върху "от вся" в левия панел, докато не стигнеш до истинската грешка в дeсния панел. За тези, които не се сещат, "вся" е глагол, напр. "вся смут в...".
zelenkroki
Мнения: 89
Регистрация: 06 юли 2010, 14:01
Местонахождение: Трявна
Връзка:

Re: IDI спелчекър v2.23

Мнение от zelenkroki »

Благодаря за отговора. Изяснението на причината е точно.
Още търся къде преди това е обяснявано в този форум, рано или късно ще го намеря. :)
Малко неудобничко е да се изчете поред всичко, но пак е от полза да я има хронологията.
Поздрави за постоянството и търпението към питащите. И най-вече - за огромния труд по IDI спелчекър!
По-добре късно, отколкото още по-късно!
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.24

Мнение от dd »

Версия 2.24 / Огледало


1. Допълнения и корекции в базите.

2. Добавих търсене на "не" пред членувано съществително (напр. не масата -> на масата). Комбинацията е валидна, но е рискова. За да минимизирам откриването на несъществуващи грешки, правя някои контекстни проверки, например обикновено не е грешка ако по-назад в изречението или директно пред "не" се среща ", а" (напр. "не масата се оказа счупена, а столът.").
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.24

Мнение от petrovich »

Благодаря ти много за чудесната програма!
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.25

Мнение от dd »

Версия 2.25

1. Добавих около 320 бг форми, предимно липсващите в чекъра професии от НКПД, но не всички, тъй като някои са рискови и биха компрометирали правописната проверка. Пропуснал съм и тези, които според Гугъл се срещат единствено в НКПД, но никъде в жива реч.

2. Нова опция "Честотен списък на всички думи". Включете я при зареден текст, след което натиснете "Refresh" и вместо списък с грешките в левия панел ще се изведе списък на всички думи, подредени по честота на срещане. Опцията няма отношение към правописната проверка, но има други приложения.

3. Имената на домейните вече не се третират като непознати латински думи, така че например "chitanka.info" вече няма да се появява в левия панел като непознат текст. Добавих и файл "b_english_skip.txt", в който може да добавят произволни латински низове, които не трябва да се третират като непознати (нещо като потребителски речник). Засега вътре е само прословутото "Kodirane", но всеки при желание може да си добави например псевдонима, с който се подписва в текстовете.
petrovich написа:Благодаря ти много за чудесната програма!
Моля! :)
mechok
Мнения: 55
Регистрация: 20 декември 2010, 15:48

Re: IDI спелчекър v2.25

Мнение от mechok »

Пич, ти си ужасен.
Такова нещо, дето ни предлагаш, няма никъде.
И аз не знам как да ти благодаря, но което правиш, прави нещата Х1000 - бъди сигурен. :)
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.25

Мнение от dd »

Версия 2.26

1. Доработих начина на извеждане на честотния списък, въведен в предната версия, като добавих опция "Различаване на малки и главни букви". Тази опция, в комбинация с опцията "Показвай непознатите думи (или честотния списък) по азбучен ред", позволява извеждане на честотния списък на думите в целия документ по четири различни начина. Генерирам го, тъй като в бъдеще ще го ползвам за някои нови алгоритми, и просто реших да има възможност за извеждане. По големината на този списък може да съдим за сложността на текста, както вероятно и за речниковия запас и фантазията на автора.


Изображение

2. Около 60 нови бг форми в базата.
Последната и единствена промяна е направена от dd на 05 май 2011, 16:34.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.26

Мнение от petrovich »

Според мен двете опции: „Клипборд“ и „В реално време“ не трябва по подразбиране да са включени, тъй като вероятността, да копираш друг текст на мястото на вече коригиран, в самата програма, е голяма.

В тази връзка искам да попитам къде в settings.txt може да се изключи „Клипборд“, защото единствено откривам за „В реално време“?
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.27

Мнение от dd »

Версия 2.27

petrovich написа:Според мен двете опции: „Клипборд“ и „В реално време“ не трябва по подразбиране да са включени, тъй като вероятността, да копираш друг текст на мястото на вече коригиран, в самата програма, е голяма. В тази връзка искам да попитам къде в settings.txt може да се изключи „Клипборд“, защото единствено откривам за „В реално време“?
Точно за да не си изтриеш без да искаш корекциите, двете опции се изключват автоматично, когато пуснеш файл в десния панел или го отвориш от менюто. Но не се самоизключват, когато просто копираш текст от документ с CTLR+C. Може да направя "Клипборд" да се самоизключва след всяко подобно копиране, но тогава човек ръчно трябва да щраква опцията всеки път, преди да копира нов текст. Изглежда леко досадно и излишно преосигуряване, но е възможно да се направи и така, примерно с добавяне на допълнителна опция за избор на един от двата варианта.

Опцията "Клипборд" отговаря на TRANSLATE_CLIPBOARD в "settings.txt". Просто промени числото до опцията от 1 на 0, за да я изключиш по подразбиране. Ако си го пробвал и не е станало, това е защото имаше бъг в кода и опцията изобщо не се четеше от файла, както и след изключването й не можеше да се активира отново чрез отметката. Грешката е оправена във v2.27. Благодаря, че ме насочи! :)
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.27

Мнение от petrovich »

Благодаря ти, че си оправил проблема.

По принцип исках, по подразбиране, тези две опции да са изключени, защото когато автоматично се взима вече копиран текст от клипборда, то в случая с текстовете от библиотеката трябва да се зададат няколко настройки - „Режим роман“, „Показвай непознатите думи по азбучен ред“, иначе проверката се обезсмисля. Да, знам че всеки път когато се появи нова версия на програмата, мога да пипна в settings.txt, но не всеки ще го направи, а случайно може да се забрави, предвид това че ежеседмично има новости в програмата.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.27

Мнение от petrovich »

Имам още едно предложение, което смятам, че ще бъде полезно за всички. Да се сложи един бутон „Clear“, чрез който да се изтрива целият текст в десния прозорец на програмата.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.27

Мнение от dd »

petrovich написа:Имам още едно предложение, което смятам, че ще бъде полезно за всички. Да се сложи един бутон „Clear“, чрез който да се изтрива целият текст в десния прозорец на програмата.
Бутончето "Clr" изчиства и двата панела. Вероятно това искаш. Няма бутонче само за десния панел, но може да изтриеш съдържанието на всеки панел, в частност на десния, чрез десен бутон на мишката върху панела и после "Clear" от контекстното меню.

......................

Версия 2.29

1. Над 200 нови бг форми спрямо 2.27

2. Нова опция "Показвай предложения за корекция дори на верните думи". Предимно за лична употреба, тоест няма смисъл да се включва, тъй като няма отношение към правописната проверка. При включена опция програмата извежда предложения за корекция на абсолютно всички български думи в текста, не само на непознатите. Предложенията за корекция се генерират така, сякаш съответната дума е изтрита от словоформения списък и програмата я счита за непозната. Целта е да се види списъка с близки думи на най-честите думи и съответно ако има съмнение, че дадена рядка дума от този списък би компрометирала проверката, тази рядка дума да се изтрие от бг базата или да се добави към съответната база с рискови думи.


Изображение

3. Доработки в интерфейса на вградения английско-български речник.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.29

Мнение от dd »

От днес idispell.com е официалният адрес на IDI Spell Checker. Другите адреси също ще продължават да се ъпдейтват.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.29

Мнение от petrovich »

Честит да ни е idispell.com.

Забелязах, че спелчекъра дава грешка за маркера „M“ и в режим „Роман“. Можеш да видиш по-подробна информация тук.

Освен това виждам, че си пуснал видеоурок, но версията, която използваш (Talking) нещо я е хванала липсата. :wink:
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.29

Мнение от dd »

petrovich написа:Честит да ни е idispell.com.

Забелязах, че спелчекъра дава грешка за маркера „M“ и в режим „Роман“. Можеш да видиш по-подробна информация тук.
Освен това виждам, че си пуснал видеоурок, но версията, която използваш (Talking) нещо я е хванала липсата. :wink:
Маркерът "М" или е въведен след като съм писал кода за маркерите, или просто съм го пропуснал. Оправих го във v2.30.
А говореща версия не качвам от известно време, въпреки че именно с нея работя. Може да я дръпнеш тук.
Blacksheep

Re: IDI спелчекър v2.30

Мнение от Blacksheep »

Здравейте,
Idi спелчекър наистина е нещо хубаво. Моят въпрос е обаче как rechnik.chitanka.info определя вида на думите -- примерно съществително, м.р., членувано? Гледайки файловете в idi виждам словоформи и след някои от словоформите има числа, предполагам честота на срещане. На мен обаче ми трябва и вида на думата, как мога да го намеря?
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.30

Мнение от dd »

Версия 2.33

Актуализация на базата и оправяне на дребни грешки. Заради реплика на @petrovich вече има опция "Изключвай опцията "Клипборд" след всяко копиране", която е изключена по подразбиране, но може да се включи във файла settings.txt, чрез промяна на числото до текста "AUTO_CLIPBOARD_DISLABLE" от 0 на 1. Идеята на опцията е да не загубим неволно вече коригиран текст, ако сме го заредили чрез копиране с CTRL+C (примерно от уебстраница) и по средата на корекцията ни хрумне да копираме нещо друго в клипборда, забравяйки, че в момента имаме зареден текст. Такъв риск има само при зареждане на текст чрез копиране, но не и ако отворим файл чрез менюто или го пуснем в десния панел (както се прави с текстовете за Читанката), тъй като пускането изключва опцията "Клипборд" автоматично.

Blacksheep написа: На мен обаче ми трябва и вида на думата, как мога да го намеря?
Цялата типова информация е в некодиран вид във файла "_D2_ungrouped_sorted.txt". Форматът на файла е четири полета, значението на които не е трудно за разгадаване. Също така в меню "Помощ" на чекъра има 2 подменюта, които ще ти покажат описанието на почти всички типовете в табличен вид, макар че има няколко типа, които все още не са описани в таблиците.

Ако искаш да видиш типовата информацията за произволна словоформа в прегледен вид, просто зареди текст в левия панел, кликни бутончето "инфо" и избери произволна дума от текста. Ето как изглежда за словоформата "думата":
.

Изображение

Ако кликнатата дума е английска, а не българска, вместо типова информация в инфопрозорчето ще видиш превод на български.
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: 0 гости