IDI спелчекър 4.44

От време на време се появяват идеи за странични проекти. Обсъждайте ги тук.

Re: IDI спелчекър v2.03

Мнениеот dd » 02 ноември 2010, 16:56

Версия 2.03 — 80 нови бг форми и 500+ нови английски значения в преводача.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.10

Мнениеот dd » 16 януари 2011, 00:23

Версия 2.10 - доста допълнения и корекции във всички бази. Сложих на сайта и FB "Like" бутонче, за да се ориентирам доколко си струва усилието.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.10

Мнениеот Mandor » 16 януари 2011, 11:45

Само имай едно наум, че доста хора не използват FB, но използват твоя спелчекър. Аз, например, няма да мога да „гласувам“.
Mandor
 
Мнения: 730
Регистрация: 19 август 2006, 10:56

Re: IDI спелчекър v2.10

Мнениеот beertobeer » 20 януари 2011, 20:13

@dd
Ще те помоля за малко разяснения като за хора, които не са спецове в тази област - бих искал да знам какво се променя когато се активира опцията "режим роман"
beertobeer
 
Мнения: 35
Регистрация: 26 декември 2008, 19:07

Re: IDI спелчекър v2.10

Мнениеот dd » 21 януари 2011, 01:39

beertobeer написа:@dd
Ще те помоля за малко разяснения като за хора, които не са спецове в тази област - бих искал да знам какво се променя когато се активира опцията "режим роман"

Трябва да включиш опцията, когато правиш окончателна проверка на текст, предназначен за Читанката. Остави я изключена, както е по подразбиране, при проверка на всички други видове текстове, примерно статии за/от новинарски и прочие сайтове, субтитри и т.н. При активирана опция програмата проверява дали всички абзаци започват с табулатор (задължително за SFB-формата), като се разпознават и прескачат FSB-таговете. В самите абзаци се прави допълнителна проверка за несъответстващ брой отварящи и затварящи двойки символи: „“ «» "" () {} [] _, като несъвпадащ брой означава пропуснат или грешен символ, който трябва ръчно да се оправи. В левия панел се извежда и обобщена статистика за абзаците и се посочва най-дългия абзац. Най-дългият абзац (примерно цяла страница без нов абзац) като нищо може да се окаже случай на два или повече слепени абзаца. При визуално съмнение за подобно нещо, може да се направи справка с оригинала и евентуалното слепване да се коригира.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.12

Мнениеот smarfietka » 08 февруари 2011, 14:25

А има ли версия за линукс
smarfietka
 
Мнения: 1
Регистрация: 08 февруари 2011, 14:24

Re: IDI спелчекър v2.12

Мнениеот dd » 19 март 2011, 23:22

Версия 2.17

smarfietka написа:А има ли версия за линукс

Не и вероятно скоро няма да има, тъй като предполагам, че малцина биха се възползвали. Но никога нищо не се знае.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.17

Мнениеот petrovich » 20 март 2011, 10:02

Аз също съм "за" версията за Линукс. Пробвах преди няколко седмици под Wine, но не винаги работи, както трябва.
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.20

Мнениеот dd » 29 март 2011, 23:11

Версия 2.20

Оправих един стар проблем, който не позволяваше автоматичното позициониране в десния панел чрез кликване в левия върху грешки, които са на повече от един ред. Това не касае текстовете за Читанката, тъй като абзаците винаги са на един ред, но беше доста досадно за преводачите на субтитри например, които при всеки такъв случай трябваше да търсят грешката в текста с помощта на Find+replace.

На картинката в левия панел буквата "й" в "най богатите" е с малко по-светъл цвят, което ни показва, че след тази буква текстът продължава на нов ред. Не беше задължително да оцветявам различно буквата, тъй като това нищо не променя, но реших да го направя за нагледност.

Изображение
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.17

Мнениеот dd » 30 март 2011, 00:08

petrovich написа:Аз също съм "за" версията за Линукс. Пробвах преди няколко седмици под Wine, но не винаги работи, както трябва.


Би било добре, но истината е, че нишата на такъв вид програми е доста "тясна" и едва ли би си струвало труда за потенциално едноцифрен брой потребители. Та то повечето професионални журналисти не правят правописна проверка, съдейки по многобройни тестове върху статии от уж уважавани издания, а какво остава за "обикновените граждани".
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.20

Мнениеот dd » 05 април 2011, 13:37

Версия 2.22 — открива случаите на непълен член след или пред форма на глагола "съм". В редки случаи алгоритъмът открива и несъществуващи грешки (например при обратен словоред), тъй че грешките трябва да се оправят, след като се прочете и осмисли контекста. Грешката е доста честа при текстовете домашно производство, като този на картинката, и нетипична при текстовете в Читанката, въпреки че се среща. Не знам дали този вид грешки трябва да се оправят, или да се оставят както са в печатния оригинал.

Изображение
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.23

Мнениеот zelenkroki » 17 април 2011, 12:18

Здравейте,

Нямам голям опит с предишните версии, затова вероятно въпросът ми е заради общата грамотност при ползването на програмата.

Ето пример за съобщение при проверката:
предлог пред глагол (обикновено е грешка)
от вся -> no suggestions


Това „вся“ е част от думата „всякаква“ в текста.

Имало ли е подобни неясни моменти при досегашните версии за този вид грешка?

Съзнавам, че е малка вероятността да се случва често точно такова недоразумение при обработването на текстове, дано други потребители да го потвърдят.
Примерът е взет от работа с версия IDI Spell checker v2.23.
По-добре късно, отколкото още по-късно!
zelenkroki
 
Мнения: 71
Регистрация: 06 юли 2010, 14:01
Местонахождение: Трявна

Re: IDI спелчекър v2.23

Мнениеот yoda » 19 април 2011, 09:02

zelenkroki написа: Ето пример за съобщение при проверката:
предлог пред глагол (обикновено е грешка)
от вся -> no suggestions


Това „вся“ е част от думата „всякаква“ в текста.


Така си е и се случва често. При мене е версия 2.19.
yoda
 
Мнения: 7
Регистрация: 27 октомври 2010, 09:14

Re: IDI спелчекър v2.23

Мнениеот dd » 26 април 2011, 15:46

zelenkroki написа:Здравейте,
Ето пример за съобщение при проверката:
предлог пред глагол (обикновено е грешка)
от вся -> no suggestions


Това „вся“ е част от думата „всякаква“ в текста.

Имало ли е подобни неясни моменти при досегашните версии за този вид грешка?


Проблемът вече е обясняван по-напред в темата. Просто в текста ти се срещат едновременно и "от всякаква", и "от вся каква", като второто е грешно. Понеже програмата в някои случаи (невинаги) позиционира чрез просто търсене на проблемния текст в десния панел, когато "от всякаква" е преди "от вся каква" в текста, първото кликване в левия панел намира "от всякаква", затова просто кликни още един-два или колкото трябва пъти върху "от вся" в левия панел, докато не стигнеш до истинската грешка в дeсния панел. За тези, които не се сещат, "вся" е глагол, напр. "вся смут в...".
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.23

Мнениеот zelenkroki » 28 април 2011, 09:06

Благодаря за отговора. Изяснението на причината е точно.
Още търся къде преди това е обяснявано в този форум, рано или късно ще го намеря. :)
Малко неудобничко е да се изчете поред всичко, но пак е от полза да я има хронологията.
Поздрави за постоянството и търпението към питащите. И най-вече - за огромния труд по IDI спелчекър!
По-добре късно, отколкото още по-късно!
zelenkroki
 
Мнения: 71
Регистрация: 06 юли 2010, 14:01
Местонахождение: Трявна

Re: IDI спелчекър v2.24

Мнениеот dd » 28 април 2011, 21:26

Версия 2.24 / Огледало


1. Допълнения и корекции в базите.

2. Добавих търсене на "не" пред членувано съществително (напр. не масата -> на масата). Комбинацията е валидна, но е рискова. За да минимизирам откриването на несъществуващи грешки, правя някои контекстни проверки, например обикновено не е грешка ако по-назад в изречението или директно пред "не" се среща ", а" (напр. "не масата се оказа счупена, а столът.").
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.24

Мнениеот petrovich » 29 април 2011, 13:34

Благодаря ти много за чудесната програма!
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.25

Мнениеот dd » 01 май 2011, 20:38

Версия 2.25

1. Добавих около 320 бг форми, предимно липсващите в чекъра професии от НКПД, но не всички, тъй като някои са рискови и биха компрометирали правописната проверка. Пропуснал съм и тези, които според Гугъл се срещат единствено в НКПД, но никъде в жива реч.

2. Нова опция "Честотен списък на всички думи". Включете я при зареден текст, след което натиснете "Refresh" и вместо списък с грешките в левия панел ще се изведе списък на всички думи, подредени по честота на срещане. Опцията няма отношение към правописната проверка, но има други приложения.

3. Имената на домейните вече не се третират като непознати латински думи, така че например "chitanka.info" вече няма да се появява в левия панел като непознат текст. Добавих и файл "b_english_skip.txt", в който може да добавят произволни латински низове, които не трябва да се третират като непознати (нещо като потребителски речник). Засега вътре е само прословутото "Kodirane", но всеки при желание може да си добави например псевдонима, с който се подписва в текстовете.
petrovich написа:Благодаря ти много за чудесната програма!

Моля! :)
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.25

Мнениеот mechok » 01 май 2011, 20:48

Пич, ти си ужасен.
Такова нещо, дето ни предлагаш, няма никъде.
И аз не знам как да ти благодаря, но което правиш, прави нещата Х1000 - бъди сигурен. :)
mechok
 
Мнения: 55
Регистрация: 20 декември 2010, 15:48

Re: IDI спелчекър v2.25

Мнениеот dd » 03 май 2011, 11:37

Версия 2.26

1. Доработих начина на извеждане на честотния списък, въведен в предната версия, като добавих опция "Различаване на малки и главни букви". Тази опция, в комбинация с опцията "Показвай непознатите думи (или честотния списък) по азбучен ред", позволява извеждане на честотния списък на думите в целия документ по четири различни начина. Генерирам го, тъй като в бъдеще ще го ползвам за някои нови алгоритми, и просто реших да има възможност за извеждане. По големината на този списък може да съдим за сложността на текста, както вероятно и за речниковия запас и фантазията на автора.

Изображение

2. Около 60 нови бг форми в базата.
Последната и единствена промяна е направена от dd на 05 май 2011, 16:34.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.26

Мнениеот petrovich » 04 май 2011, 22:11

Според мен двете опции: „Клипборд“ и „В реално време“ не трябва по подразбиране да са включени, тъй като вероятността, да копираш друг текст на мястото на вече коригиран, в самата програма, е голяма.

В тази връзка искам да попитам къде в settings.txt може да се изключи „Клипборд“, защото единствено откривам за „В реално време“?
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.27

Мнениеот dd » 05 май 2011, 16:13

Версия 2.27

petrovich написа:Според мен двете опции: „Клипборд“ и „В реално време“ не трябва по подразбиране да са включени, тъй като вероятността, да копираш друг текст на мястото на вече коригиран, в самата програма, е голяма. В тази връзка искам да попитам къде в settings.txt може да се изключи „Клипборд“, защото единствено откривам за „В реално време“?

Точно за да не си изтриеш без да искаш корекциите, двете опции се изключват автоматично, когато пуснеш файл в десния панел или го отвориш от менюто. Но не се самоизключват, когато просто копираш текст от документ с CTLR+C. Може да направя "Клипборд" да се самоизключва след всяко подобно копиране, но тогава човек ръчно трябва да щраква опцията всеки път, преди да копира нов текст. Изглежда леко досадно и излишно преосигуряване, но е възможно да се направи и така, примерно с добавяне на допълнителна опция за избор на един от двата варианта.

Опцията "Клипборд" отговаря на TRANSLATE_CLIPBOARD в "settings.txt". Просто промени числото до опцията от 1 на 0, за да я изключиш по подразбиране. Ако си го пробвал и не е станало, това е защото имаше бъг в кода и опцията изобщо не се четеше от файла, както и след изключването й не можеше да се активира отново чрез отметката. Грешката е оправена във v2.27. Благодаря, че ме насочи! :)
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.27

Мнениеот petrovich » 05 май 2011, 16:49

Благодаря ти, че си оправил проблема.

По принцип исках, по подразбиране, тези две опции да са изключени, защото когато автоматично се взима вече копиран текст от клипборда, то в случая с текстовете от библиотеката трябва да се зададат няколко настройки - „Режим роман“, „Показвай непознатите думи по азбучен ред“, иначе проверката се обезсмисля. Да, знам че всеки път когато се появи нова версия на програмата, мога да пипна в settings.txt, но не всеки ще го направи, а случайно може да се забрави, предвид това че ежеседмично има новости в програмата.
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.27

Мнениеот petrovich » 10 май 2011, 19:40

Имам още едно предложение, което смятам, че ще бъде полезно за всички. Да се сложи един бутон „Clear“, чрез който да се изтрива целият текст в десния прозорец на програмата.
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.27

Мнениеот dd » 11 май 2011, 21:12

petrovich написа:Имам още едно предложение, което смятам, че ще бъде полезно за всички. Да се сложи един бутон „Clear“, чрез който да се изтрива целият текст в десния прозорец на програмата.


Бутончето "Clr" изчиства и двата панела. Вероятно това искаш. Няма бутонче само за десния панел, но може да изтриеш съдържанието на всеки панел, в частност на десния, чрез десен бутон на мишката върху панела и после "Clear" от контекстното меню.

......................
Версия 2.29

1. Над 200 нови бг форми спрямо 2.27

2. Нова опция "Показвай предложения за корекция дори на верните думи". Предимно за лична употреба, тоест няма смисъл да се включва, тъй като няма отношение към правописната проверка. При включена опция програмата извежда предложения за корекция на абсолютно всички български думи в текста, не само на непознатите. Предложенията за корекция се генерират така, сякаш съответната дума е изтрита от словоформения списък и програмата я счита за непозната. Целта е да се види списъка с близки думи на най-честите думи и съответно ако има съмнение, че дадена рядка дума от този списък би компрометирала проверката, тази рядка дума да се изтрие от бг базата или да се добави към съответната база с рискови думи.

Изображение

3. Доработки в интерфейса на вградения английско-български речник.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.29

Мнениеот dd » 12 май 2011, 16:59

От днес idispell.com е официалният адрес на IDI Spell Checker. Другите адреси също ще продължават да се ъпдейтват.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.29

Мнениеот petrovich » 12 май 2011, 21:04

Честит да ни е idispell.com.

Забелязах, че спелчекъра дава грешка за маркера „M“ и в режим „Роман“. Можеш да видиш по-подробна информация тук.

Освен това виждам, че си пуснал видеоурок, но версията, която използваш (Talking) нещо я е хванала липсата. :wink:
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v2.29

Мнениеот dd » 13 май 2011, 17:58

petrovich написа:Честит да ни е idispell.com.

Забелязах, че спелчекъра дава грешка за маркера „M“ и в режим „Роман“. Можеш да видиш по-подробна информация тук.
Освен това виждам, че си пуснал видеоурок, но версията, която използваш (Talking) нещо я е хванала липсата. :wink:

Маркерът "М" или е въведен след като съм писал кода за маркерите, или просто съм го пропуснал. Оправих го във v2.30.
А говореща версия не качвам от известно време, въпреки че именно с нея работя. Може да я дръпнеш тук.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.30

Мнениеот Blacksheep » 17 май 2011, 18:01

Здравейте,
Idi спелчекър наистина е нещо хубаво. Моят въпрос е обаче как rechnik.chitanka.info определя вида на думите -- примерно съществително, м.р., членувано? Гледайки файловете в idi виждам словоформи и след някои от словоформите има числа, предполагам честота на срещане. На мен обаче ми трябва и вида на думата, как мога да го намеря?
Blacksheep
 

Re: IDI спелчекър v2.30

Мнениеот dd » 23 май 2011, 22:34

Версия 2.33

Актуализация на базата и оправяне на дребни грешки. Заради реплика на @petrovich вече има опция "Изключвай опцията "Клипборд" след всяко копиране", която е изключена по подразбиране, но може да се включи във файла settings.txt, чрез промяна на числото до текста "AUTO_CLIPBOARD_DISLABLE" от 0 на 1. Идеята на опцията е да не загубим неволно вече коригиран текст, ако сме го заредили чрез копиране с CTRL+C (примерно от уебстраница) и по средата на корекцията ни хрумне да копираме нещо друго в клипборда, забравяйки, че в момента имаме зареден текст. Такъв риск има само при зареждане на текст чрез копиране, но не и ако отворим файл чрез менюто или го пуснем в десния панел (както се прави с текстовете за Читанката), тъй като пускането изключва опцията "Клипборд" автоматично.

Blacksheep написа:На мен обаче ми трябва и вида на думата, как мога да го намеря?

Цялата типова информация е в некодиран вид във файла "_D2_ungrouped_sorted.txt". Форматът на файла е четири полета, значението на които не е трудно за разгадаване. Също така в меню "Помощ" на чекъра има 2 подменюта, които ще ти покажат описанието на почти всички типовете в табличен вид, макар че има няколко типа, които все още не са описани в таблиците.

Ако искаш да видиш типовата информацията за произволна словоформа в прегледен вид, просто зареди текст в левия панел, кликни бутончето "инфо" и избери произволна дума от текста. Ето как изглежда за словоформата "думата":
.
Изображение

Ако кликнатата дума е английска, а не българска, вместо типова информация в инфопрозорчето ще видиш превод на български.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

ПредишнаСледваща

Обратно към Начинания

Кой е на линия

Потребители, разглеждащи форума: Николко регистрирани потребители и 2 гости