IDI Spell Checker 24.02.07

От време на време се появяват идеи за странични проекти. Обсъждайте ги тук.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
Фен на ИДИ

Re: IDI спелчекър 2.42.1

Мнение от Фен на ИДИ »

Има ли възможност /от опциите/ да се изключва проверката за опашен интервал? Това не винаги е грешка, а пълни излишно списъка с грешките.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър 2.42.1

Мнение от petrovich »

Долните 5 бутона са програмируеми и може да поставиш линк към "Речко" на мястото на някой от сегашните линкове.
Аз знам, че могат да се програмират, но исках, ако може тази връзка да е включена постоянно във всяка следваща версия на програмата. Не че това представлява кой знае какъв проблем.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.42.1

Мнение от dd »

Фен на ИДИ написа:Има ли възможност /от опциите/ да се изключва проверката за опашен интервал? Това не винаги е грешка, а пълни излишно списъка с грешките.
Няма такава възможност, тъй като опашният интервал винаги е грешка. Но и аз съм срещал текстове с десетки такива интервали (например в мърляво написани субтитри) и има известен резон да има и такава опция, ако за да спестим време, решим да не оправяме изобщо този вид грешки. Лесно можеш да ги оправиш всичките чрез диалога "Find+replace", който позволява търсене и заместване на многоредови текстове. В полето за търсене въвеждаш интервал и нов ред, в полето за заместване въвеждаш нов ред (тоест натискаш веднъж клавиша ""Enter") и накрая натискаш бутона "Replace all".

petrovich написа: Аз знам, че могат да се програмират, но исках, ако може тази връзка да е включена постоянно във всяка следваща версия на програмата. Не че това представлява кой знае какъв проблем.
Ще помисля. Може да добавя още един бутон.
fen na IDI

Re: IDI спелчекър 2.42.1

Мнение от fen na IDI »

Не е точно така. Има текстове и текстове.
Програмата ти се ползва за корекция на най-различни типове текстове
Примерно при стихове масово има опашни интервали, които не са грешка. Т.е да, грешка са, но тотално не пречат на никого и оправянето им не си струва времето. Преценката дали са грешка се решава във всеки случай поотделно /да, за субтитри наистина са проблем/.
Въпросът беше дали има начин да се изключват при проверка, защото пълнят голямо пространство в левия прозорец.
Благодаря предварително.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: IDI спелчекър 2.42.1

Мнение от Mandor »

fen na IDI, опашните интервали винаги са грешка, която може да предизвика много неприятен визуален ефект на всички видове четци. Освен това, както отбеляза dd, премахването им е въпрос на секунди — една проста замяна. Дали твоите текстове си заслужават тези 5-10 секунди усилия — това вече си решаваш сам.

И пак казвам — поне от елементарно уважение, правете си труда да влизате с регистрациите си.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.43

Мнение от dd »

Версия 2.43 — актуализация на базите.
Стоян

Re: IDI спелчекър 2.43

Мнение от Стоян »

Здравейте,
Имам едно предложение, което смятам, че би било полезно за много хора, ако се реализира.
Възможно ли е да се добави опция, с която при проверка IDI-то да прескача <тагове> т.е. всичко между знаците "<" и ">"? Ще бъде от огромно значение при проверка на fb2 текстове и изобщо всякакъв xml и html.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.43

Мнение от dd »

Стоян написа:Здравейте,
Имам едно предложение, което смятам, че би било полезно за много хора, ако се реализира.
Възможно ли е да се добави опция, с която при проверка IDI-то да прескача <тагове> т.е. всичко между знаците "<" и ">"? Ще бъде от огромно значение при проверка на fb2 текстове и изобщо всякакъв xml и html.
Възможно е, но засега нямам намерение да добавям поддръжка на други формати. В бъдеще може и да стане. Винаги може да отвориш текст с произволен формат в програма, която го чете (браузър, текстов редактор, четец и пр.) и да го провериш с прост Copy-Paste от програмата в чекъра. Ако в чекъра включиш чекбокса "Клипборд", само Copy (Ctrl+C) ще ти е достатъчно.
Стоян

Re: IDI спелчекър 2.43

Мнение от Стоян »

dd написа:Винаги може да отвориш текст с произволен формат в програма, която го чете и да го провериш с прост Copy-Paste от програмата в чекъра.
Така и правя. Но за дълги текстове с много грешки... оправянето е трудно - гледаш в иди-то, търсиш в другата програма, поправяш и пак наново стотици пъти :(
Както и да е :) Благодаря за отговора и за страхотната програма, която си създал и поддържаш (също много важно ;)
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.44

Мнение от dd »

Версия 2.44

1. Допълнения и корекции във всички бази, особено в модула за машинен превод.

2. Нова опция "Генерирай файл с инфо за дублиращ се текст". Пожелателна и неактивна по подразбиране. Ако я активираме, преди да пуснем файл за проверка, в папката на файла ще се генерира файл с префикс "_REPEATED_", в който се изброяват дублиращите се части в текста, по-дълги от 9 думи. Обикновено повтарящите се пасажи, по-къси от стотина думи, са в реда на нещата (цитат/стих на повече от едно място), като по-дългите от 200 думи почти сигурно говорят за неволно дублиран пасаж, който трябва да се изтрие. Върху дублиращите се части позиционираме, като отворим генерирания файл и чрез "Find+replace" намерим цитираното във файла начало на текста.

По-долу виждате как изглежда примерен генериран файл. В случая са открити 3 дублирания — първото с дължина 30 думи, като дублиращият се текст започва с "Чака ли някой един младеж" и свършва с "ли някой да го чака", второто с дължина 17 думи, дублиращият се текст започва с "О, очите ми и краката" и свършва с "жлъчката ми, какво искаш? Гр-рр" и т.н. И в трите открити случая не става дума за грешка — първите 2 са цитати, третият — случайност.


ct:30, word: 25230 to 25259 -- 25271 to 25300 (char: 146457 to 146631 -- 146727 to 146901)
... Чака ли някой един младеж ... ли някой да го чака
ct:17, word: 66491 to 66507 -- 66549 to 66565 (char: 386316 to 386403 -- 386654 to 386741)
... О, очите ми и краката ... жлъчката ми, какво искаш? Гр-рр
ct:10, word: 69449 to 69458 -- 75633 to 75642 (char: 403291 to 403339 -- 439013 to 439061)
... предай почитанията ми на мистър ... Дик и му кажи, че


Опцията може да активирате по подразбиране, като във файла "settings.txt" откриете текста "REPEATED_PARTS 0" и ръчно го промените на "REPEATED_PARTS 1". Промяна на числото в текста "REPEATED_LONGER_THAN 9" ще промени минималната дължина (в думи) на повтарящия се текст. Може примерно да се увеличи от 9 на 100, за да не се показват несъществуващи грешки.

3. Възможност за ръчно оцветяване на избран текст в червено. За целта избираме текст, върху него натискаме десния клавиш на мишката и от отвореното контекстно меню изпълняваме "Color red". Разоцветяването става с бутона Undo. Така удобно може да маркираме различни части от текста, за да не ги губим от поглед. Примерно двата пасажа повтарящ се текст (виж по-горе), преди да изтрием единия. Но не само.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.45

Мнение от dd »

Версия 2.45

1. Пропуснати препинателни знаци в края на ред вече се откриват и при проверка на .srt субтитри. Досега подобна проверка (потенциално грешен край на параграф) се правеше само при включена опция "Режим роман", но опцията задължително трябва да е изключена при проверка на субтитри и грешките не се засичаха.

Пример за пропусната точка:


Изображение

2. Кодът за търсене на "сравнителна степен без тире" е доста по-прецизен и открива значително по-малко несъществуващи грешки. Например изрази като "по цял ден", "по взаимно съгласие", "по здравословни причини" и стотици други, вече не се откриват като потенциално съдържащи сравнителни степени (по-цял, по-взаимно, по-здравословни).
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.46.1

Мнение от dd »

Версия 2.46.1

1. Слепени или откъснати кавички (всички видове) досега не се хващаха. Примери:


Този "велик"певец.
Този "велик " певец.


2. Малък ъпдейт на базите и дребни доработки.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.46.1

Мнение от dd »

Версия 2.47 SFB

Неофициална версия, няма да я пускам на сайта. Нова опция "Показвай честотен списък на междудумията" (изключена по подразбиране). С нея в левия панел се извежда списък на всички различни междудумия в текста, подобно на списъците с думи. Опцията работи само с SFB файлове и не съм решил дали по-натам ще я направя универсална. Примерно за srt субтитрите или за уебстатиите алгоритмите са коренно различни. Идеята ми дойде, докато мислех как да откривам най-пълно пунктуационните грешки, без да оставям нищо на случайността. Една от идеите е от списъка с всички междудумия в текста да се игнорират позволените, като се взима предвид SFB-формата, и останалите съвсем малко на брой просто визуално да се проверят за потенциални грешки. Проблемът е, че съставянето на алгоритъм дали дадено междудумие е позволено, се оказа не толкова елементарно (комбинациите са огромно число) и тепърва ще мисля как да го направя най-елегантно, ако изобщо го направя. Засега съм въвел някои правила за определяне на позволени междудумия, плюс "твърд" списък с междудумия, които се считат за позволени, но все още не всички позволени се разпознават като такива, което води до показване и на доста "фалшиви". Отделно в един контекст теоретично валидно междудумие може да е позволено, но в друг да е грешно (напр. " „_"). При всички случаи дори да се окаже, че не върши особена работа, тази опция е интересна за тестване.

На скрийншота долу виждате как изглежда. Междудумията се показват между две сиви вертикални черти, за да се вижда добре къде точно е началото и края на стринга (особено ако междудумието започва или свършва с интервал). В междудумията символът "·" (interpunct) означава нов ред, а "›" — табулатор (\x9B). Може да кликате междудумията директно в списъка, за да скролирате текста в десния панел, точно както се прави с думите. Допълнително има опция "Показвай само грешните и непознатите междудумия", която би трябвало да изведе само списъка, който ни интересува (вторият скрийншот), тоест потенциалните грешки. Ако в текста няма грешки и програмата открива правилно всички позволени междудумия, този списък трябва да е празен. Засега това не е така поради гореизложеното. Все пак върши работа, ако отделим време да прегледаме всички показани непознати (unknown).
Тази опция практически дублира някои от вече съществуващите пунктуационни проверки, в смисъл че една и съща грешка ще се появи и тук, в списъка на непознатите междудумия, и по-долу в левия панел, където се извеждат дадения тип пунктуационни грешки (примерно <интервал><дясна скоба>). Но тук еднотипните са групирани в един ред, а по-долу са показани негрупирани на различни редове и в контекст от няколко думи.

Изображение

Същият текст с включена опция "Показвай само грешните и непознатите междудумия":
Изображение

С изключена опция (както е по подразбиране) тази версия е идентична с 2.46.1 (плюс десетина нови думи в бг базата), тъй че няма проблем да я ползвате, въпреки че е неофициална. :wink:
Последната и единствена промяна е направена от dd на 05 октомври 2012, 18:02.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.46.1

Мнение от dd »

От около седмица има нов нормативен речник на БАН, наречен „Официален правописен речник на българския език”. Предишният нормативен речник е от 2002 г., затова събитието е доста значимо. Очертава се актуализация на правописа на много думи в чекъра, но няма да стане веднага. Например някои думи, които досега беше правилно да се пишат само разделно, вече могат да се пишат и слято, и разделно.

Ето няколко клипчета:

http://bnt.bg/bg/news/view/84704/nov_pr ... skija_ezik

http://tv7.bg/news/society/9438892.html

http://btvnews.bg/video/news/nov-rechni ... -ezik.html
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.46.2

Мнение от dd »

Версия 2.46.2 — скромен ъпдейт на базите.
traiki
Мнения: 15
Регистрация: 25 септември 2012, 23:18

Re: IDI спелчекър 2.46.2

Мнение от traiki »

Много добра програма, лично аз използвам по-стара версия, но май ще трябва да премина към последната, която, е дал dd
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.48

Мнение от dd »

Версия 2.48

Задължителен ъпдейт!

1. Оправих една критична грешка, която крашваше програмата, макар и рядко. Грешката е стара, още от първите версии, тъй че ако имате спомен чекърът да ви е забивал, най-вероятно това е бил проблемът.

2. Допълнения и корекции в базите.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.49

Мнение от dd »

Версия 2.49

1. Широчината на двата панела вече може да се променя чрез влачене с мишката. Досега панелите бяха статични, което леко дразнеше.
2. Малък ъпдейт на базите.
ckitnik
Мнения: 43
Регистрация: 03 ноември 2008, 09:54

Re: IDI спелчекър 2.49

Мнение от ckitnik »

Много добра новина за панелите, ще бъде много по-удобно.
Благодаря.
„Добрият пътешественик няма твърди планове и не държи да пристигне на всяка цена.“ Лао Дзъ
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.49

Мнение от dd »

Версия 2.49.2

Лека актуализация на базите. Незадължителен ъпдейт.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.49.3

Мнение от dd »

Версия 2.49.3 — като горе.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър 2.49.3

Мнение от petrovich »

Тъй като използвам клавиатура с макрос бутони реших да си добавя IDI Spell Checker да ми се стартира директно от един от макрос бутоните. В следствие на това ми се появи следната грешка:

Код: Избиране на всичко

Problem signature:
  Problem Event Name:	APPCRASH
  Application Name:	idispell.exe
  Application Version:	0.0.0.0
  Application Timestamp:	514ddd6b
  Fault Module Name:	idispell.exe
  Fault Module Version:	0.0.0.0
  Fault Module Timestamp:	514ddd6b
  Exception Code:	c0000005
  Exception Offset:	0000fefb
  OS Version:	6.1.7601.2.1.0.256.48
  Locale ID:	1026
  Additional Information 1:	0a9e
  Additional Information 2:	0a9e372d3b4ad19135b953a78882e789
  Additional Information 3:	0a9e
  Additional Information 4:	0a9e372d3b4ad19135b953a78882e789

Read our privacy statement online:
  http://go.microsoft.com/fwlink/?linkid=104288&clcid=0x0409

If the online privacy statement is not available, please read our privacy statement offline:
  C:\Windows\system32\en-US\erofflps.txt
Интересното, което забелязах е, че когато стартирам директно приложението ми се изписва „IDI Spell Checker 2.49.3 стартира, моля почакайте…“, а когато се стартира от макрос бутона се изписва „IDI Dictionary 4.84 стартира, моля почакайте…“. След това разбира се появява „idispell.exe has stopped working“ и грешката, която копирах по-горе.

Ако можеш да ми дадеш насока как да разреша този проблем?
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.49.4

Мнение от dd »

petrovich написа:Ако можеш да ми дадеш насока как да разреша този проблем?
Не знам как да го решиш, но проблемът очевидно идва от факта, че стартирана по този начин, програмата не си намира файловете, тоест базите. Същата грешка ще ти даде, ако изтриеш всички файлове от папката на чекъра, освен exe-то, след което стартираш exe-то. Или още по-лесно, ако копираш exe-то в празна папка и го стартираш. Понеже не съм си играл да правя проверка при стартиране и да извеждам съобщение, ако някой файл липсва, програмата просто крашва.

"IDI Dictionary" е част от чекъра и ако програмата не намери файла "settings.txt" (както е в твоя случай), тя се стартира в режим "речник", който е по подразбиране, а не в режим "чекър" (тоест стартира се различен модул). Затова ти се появява различно съобщение в началото. Може да стартираш речника и ръчно в чекъра от меню "Модули" -> "Английско-български речник".
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър 2.50

Мнение от petrovich »

Здравей,

Видях, че вече има нова версия 2.51. Можеш ли да споделиш какви са промени в нея?
Забелязах, че има голяма разлика в размера на пакета спрямо 2.49.3 (след разархивиране 149 MB), а 2.51 (след разархивиране 97,1 MB).
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.50

Мнение от dd »

petrovich написа:Здравей,

Видях, че вече има нова версия 2.51. Можеш ли да споделиш какви са промени в нея?
Забелязах, че има голяма разлика в размера на пакета спрямо 2.49.3 (след разархивиране 149 MB), а 2.51 (след разархивиране 97,1 MB).
Обичайните неголеми ъпдейти на словоформената база. Оптимизирах някои неща, затова пакетът е по-малък. Целта е по-бързо стартиране.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.50

Мнение от dd »

Версия 2.52

Ъпдейт на базите и оптимизии в кода, в резултат на което програмата се зарежда в 40 MB по-малко памет от 2.51.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.52

Мнение от dd »

По повод 24 май БАН за пръв път осигурява свободен онлайн достъп до Речника на българския език. Още подробности тук.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър 2.52

Мнение от petrovich »

Доживяхме. Туко виж са разбрали последното послание изпратено от екипа. Отделен е въпросът, че в томовете има не малко грешки. :)
zearendil
Мнения: 46
Регистрация: 26 юли 2010, 16:24

Re: IDI спелчекър 2.52

Мнение от zearendil »

Не разбрах, има ли надежда да публикуват самата база данни или ще оставят само уеб интерфейс? Защото второто, струва ми се, би било по-полезно.
dd
Мнения: 168
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.53

Мнение от dd »

Версия 2.53 — малък ъпдейт на базите.
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: един гост