IDI Spell Checker 24.09.15
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Re: IDI спелчекър 2.42.1
Има ли възможност /от опциите/ да се изключва проверката за опашен интервал? Това не винаги е грешка, а пълни излишно списъка с грешките.
Re: IDI спелчекър 2.42.1
Аз знам, че могат да се програмират, но исках, ако може тази връзка да е включена постоянно във всяка следваща версия на програмата. Не че това представлява кой знае какъв проблем.Долните 5 бутона са програмируеми и може да поставиш линк към "Речко" на мястото на някой от сегашните линкове.
Re: IDI спелчекър 2.42.1
Няма такава възможност, тъй като опашният интервал винаги е грешка. Но и аз съм срещал текстове с десетки такива интервали (например в мърляво написани субтитри) и има известен резон да има и такава опция, ако за да спестим време, решим да не оправяме изобщо този вид грешки. Лесно можеш да ги оправиш всичките чрез диалога "Find+replace", който позволява търсене и заместване на многоредови текстове. В полето за търсене въвеждаш интервал и нов ред, в полето за заместване въвеждаш нов ред (тоест натискаш веднъж клавиша ""Enter") и накрая натискаш бутона "Replace all".Фен на ИДИ написа:Има ли възможност /от опциите/ да се изключва проверката за опашен интервал? Това не винаги е грешка, а пълни излишно списъка с грешките.
Ще помисля. Може да добавя още един бутон.petrovich написа: Аз знам, че могат да се програмират, но исках, ако може тази връзка да е включена постоянно във всяка следваща версия на програмата. Не че това представлява кой знае какъв проблем.
Re: IDI спелчекър 2.42.1
Не е точно така. Има текстове и текстове.
Програмата ти се ползва за корекция на най-различни типове текстове
Примерно при стихове масово има опашни интервали, които не са грешка. Т.е да, грешка са, но тотално не пречат на никого и оправянето им не си струва времето. Преценката дали са грешка се решава във всеки случай поотделно /да, за субтитри наистина са проблем/.
Въпросът беше дали има начин да се изключват при проверка, защото пълнят голямо пространство в левия прозорец.
Благодаря предварително.
Програмата ти се ползва за корекция на най-различни типове текстове
Примерно при стихове масово има опашни интервали, които не са грешка. Т.е да, грешка са, но тотално не пречат на никого и оправянето им не си струва времето. Преценката дали са грешка се решава във всеки случай поотделно /да, за субтитри наистина са проблем/.
Въпросът беше дали има начин да се изключват при проверка, защото пълнят голямо пространство в левия прозорец.
Благодаря предварително.
Re: IDI спелчекър 2.42.1
fen na IDI, опашните интервали винаги са грешка, която може да предизвика много неприятен визуален ефект на всички видове четци. Освен това, както отбеляза dd, премахването им е въпрос на секунди — една проста замяна. Дали твоите текстове си заслужават тези 5-10 секунди усилия — това вече си решаваш сам.
И пак казвам — поне от елементарно уважение, правете си труда да влизате с регистрациите си.
И пак казвам — поне от елементарно уважение, правете си труда да влизате с регистрациите си.
Re: IDI спелчекър 2.43
Версия 2.43 — актуализация на базите.
Re: IDI спелчекър 2.43
Здравейте,
Имам едно предложение, което смятам, че би било полезно за много хора, ако се реализира.
Възможно ли е да се добави опция, с която при проверка IDI-то да прескача <тагове> т.е. всичко между знаците "<" и ">"? Ще бъде от огромно значение при проверка на fb2 текстове и изобщо всякакъв xml и html.
Имам едно предложение, което смятам, че би било полезно за много хора, ако се реализира.
Възможно ли е да се добави опция, с която при проверка IDI-то да прескача <тагове> т.е. всичко между знаците "<" и ">"? Ще бъде от огромно значение при проверка на fb2 текстове и изобщо всякакъв xml и html.
Re: IDI спелчекър 2.43
Възможно е, но засега нямам намерение да добавям поддръжка на други формати. В бъдеще може и да стане. Винаги може да отвориш текст с произволен формат в програма, която го чете (браузър, текстов редактор, четец и пр.) и да го провериш с прост Copy-Paste от програмата в чекъра. Ако в чекъра включиш чекбокса "Клипборд", само Copy (Ctrl+C) ще ти е достатъчно.Стоян написа:Здравейте,
Имам едно предложение, което смятам, че би било полезно за много хора, ако се реализира.
Възможно ли е да се добави опция, с която при проверка IDI-то да прескача <тагове> т.е. всичко между знаците "<" и ">"? Ще бъде от огромно значение при проверка на fb2 текстове и изобщо всякакъв xml и html.
Re: IDI спелчекър 2.43
Така и правя. Но за дълги текстове с много грешки... оправянето е трудно - гледаш в иди-то, търсиш в другата програма, поправяш и пак наново стотици пътиdd написа:Винаги може да отвориш текст с произволен формат в програма, която го чете и да го провериш с прост Copy-Paste от програмата в чекъра.
Както и да е Благодаря за отговора и за страхотната програма, която си създал и поддържаш (също много важно
Re: IDI спелчекър 2.44
Версия 2.44
1. Допълнения и корекции във всички бази, особено в модула за машинен превод.
2. Нова опция "Генерирай файл с инфо за дублиращ се текст". Пожелателна и неактивна по подразбиране. Ако я активираме, преди да пуснем файл за проверка, в папката на файла ще се генерира файл с префикс "_REPEATED_", в който се изброяват дублиращите се части в текста, по-дълги от 9 думи. Обикновено повтарящите се пасажи, по-къси от стотина думи, са в реда на нещата (цитат/стих на повече от едно място), като по-дългите от 200 думи почти сигурно говорят за неволно дублиран пасаж, който трябва да се изтрие. Върху дублиращите се части позиционираме, като отворим генерирания файл и чрез "Find+replace" намерим цитираното във файла начало на текста.
По-долу виждате как изглежда примерен генериран файл. В случая са открити 3 дублирания — първото с дължина 30 думи, като дублиращият се текст започва с "Чака ли някой един младеж" и свършва с "ли някой да го чака", второто с дължина 17 думи, дублиращият се текст започва с "О, очите ми и краката" и свършва с "жлъчката ми, какво искаш? Гр-рр" и т.н. И в трите открити случая не става дума за грешка — първите 2 са цитати, третият — случайност.
ct:30, word: 25230 to 25259 -- 25271 to 25300 (char: 146457 to 146631 -- 146727 to 146901)
... Чака ли някой един младеж ... ли някой да го чака
ct:17, word: 66491 to 66507 -- 66549 to 66565 (char: 386316 to 386403 -- 386654 to 386741)
... О, очите ми и краката ... жлъчката ми, какво искаш? Гр-рр
ct:10, word: 69449 to 69458 -- 75633 to 75642 (char: 403291 to 403339 -- 439013 to 439061)
... предай почитанията ми на мистър ... Дик и му кажи, че
Опцията може да активирате по подразбиране, като във файла "settings.txt" откриете текста "REPEATED_PARTS 0" и ръчно го промените на "REPEATED_PARTS 1". Промяна на числото в текста "REPEATED_LONGER_THAN 9" ще промени минималната дължина (в думи) на повтарящия се текст. Може примерно да се увеличи от 9 на 100, за да не се показват несъществуващи грешки.
3. Възможност за ръчно оцветяване на избран текст в червено. За целта избираме текст, върху него натискаме десния клавиш на мишката и от отвореното контекстно меню изпълняваме "Color red". Разоцветяването става с бутона Undo. Така удобно може да маркираме различни части от текста, за да не ги губим от поглед. Примерно двата пасажа повтарящ се текст (виж по-горе), преди да изтрием единия. Но не само.
1. Допълнения и корекции във всички бази, особено в модула за машинен превод.
2. Нова опция "Генерирай файл с инфо за дублиращ се текст". Пожелателна и неактивна по подразбиране. Ако я активираме, преди да пуснем файл за проверка, в папката на файла ще се генерира файл с префикс "_REPEATED_", в който се изброяват дублиращите се части в текста, по-дълги от 9 думи. Обикновено повтарящите се пасажи, по-къси от стотина думи, са в реда на нещата (цитат/стих на повече от едно място), като по-дългите от 200 думи почти сигурно говорят за неволно дублиран пасаж, който трябва да се изтрие. Върху дублиращите се части позиционираме, като отворим генерирания файл и чрез "Find+replace" намерим цитираното във файла начало на текста.
По-долу виждате как изглежда примерен генериран файл. В случая са открити 3 дублирания — първото с дължина 30 думи, като дублиращият се текст започва с "Чака ли някой един младеж" и свършва с "ли някой да го чака", второто с дължина 17 думи, дублиращият се текст започва с "О, очите ми и краката" и свършва с "жлъчката ми, какво искаш? Гр-рр" и т.н. И в трите открити случая не става дума за грешка — първите 2 са цитати, третият — случайност.
ct:30, word: 25230 to 25259 -- 25271 to 25300 (char: 146457 to 146631 -- 146727 to 146901)
... Чака ли някой един младеж ... ли някой да го чака
ct:17, word: 66491 to 66507 -- 66549 to 66565 (char: 386316 to 386403 -- 386654 to 386741)
... О, очите ми и краката ... жлъчката ми, какво искаш? Гр-рр
ct:10, word: 69449 to 69458 -- 75633 to 75642 (char: 403291 to 403339 -- 439013 to 439061)
... предай почитанията ми на мистър ... Дик и му кажи, че
Опцията може да активирате по подразбиране, като във файла "settings.txt" откриете текста "REPEATED_PARTS 0" и ръчно го промените на "REPEATED_PARTS 1". Промяна на числото в текста "REPEATED_LONGER_THAN 9" ще промени минималната дължина (в думи) на повтарящия се текст. Може примерно да се увеличи от 9 на 100, за да не се показват несъществуващи грешки.
3. Възможност за ръчно оцветяване на избран текст в червено. За целта избираме текст, върху него натискаме десния клавиш на мишката и от отвореното контекстно меню изпълняваме "Color red". Разоцветяването става с бутона Undo. Така удобно може да маркираме различни части от текста, за да не ги губим от поглед. Примерно двата пасажа повтарящ се текст (виж по-горе), преди да изтрием единия. Но не само.
Re: IDI спелчекър 2.45
Версия 2.45
1. Пропуснати препинателни знаци в края на ред вече се откриват и при проверка на .srt субтитри. Досега подобна проверка (потенциално грешен край на параграф) се правеше само при включена опция "Режим роман", но опцията задължително трябва да е изключена при проверка на субтитри и грешките не се засичаха.
Пример за пропусната точка:
2. Кодът за търсене на "сравнителна степен без тире" е доста по-прецизен и открива значително по-малко несъществуващи грешки. Например изрази като "по цял ден", "по взаимно съгласие", "по здравословни причини" и стотици други, вече не се откриват като потенциално съдържащи сравнителни степени (по-цял, по-взаимно, по-здравословни).
1. Пропуснати препинателни знаци в края на ред вече се откриват и при проверка на .srt субтитри. Досега подобна проверка (потенциално грешен край на параграф) се правеше само при включена опция "Режим роман", но опцията задължително трябва да е изключена при проверка на субтитри и грешките не се засичаха.
Пример за пропусната точка:
2. Кодът за търсене на "сравнителна степен без тире" е доста по-прецизен и открива значително по-малко несъществуващи грешки. Например изрази като "по цял ден", "по взаимно съгласие", "по здравословни причини" и стотици други, вече не се откриват като потенциално съдържащи сравнителни степени (по-цял, по-взаимно, по-здравословни).
Re: IDI спелчекър 2.46.1
Версия 2.46.1
1. Слепени или откъснати кавички (всички видове) досега не се хващаха. Примери:
Този "велик"певец.
Този "велик " певец.
2. Малък ъпдейт на базите и дребни доработки.
1. Слепени или откъснати кавички (всички видове) досега не се хващаха. Примери:
Този "велик"певец.
Този "велик " певец.
2. Малък ъпдейт на базите и дребни доработки.
Re: IDI спелчекър 2.46.1
Версия 2.47 SFB
Неофициална версия, няма да я пускам на сайта. Нова опция "Показвай честотен списък на междудумията" (изключена по подразбиране). С нея в левия панел се извежда списък на всички различни междудумия в текста, подобно на списъците с думи. Опцията работи само с SFB файлове и не съм решил дали по-натам ще я направя универсална. Примерно за srt субтитрите или за уебстатиите алгоритмите са коренно различни. Идеята ми дойде, докато мислех как да откривам най-пълно пунктуационните грешки, без да оставям нищо на случайността. Една от идеите е от списъка с всички междудумия в текста да се игнорират позволените, като се взима предвид SFB-формата, и останалите съвсем малко на брой просто визуално да се проверят за потенциални грешки. Проблемът е, че съставянето на алгоритъм дали дадено междудумие е позволено, се оказа не толкова елементарно (комбинациите са огромно число) и тепърва ще мисля как да го направя най-елегантно, ако изобщо го направя. Засега съм въвел някои правила за определяне на позволени междудумия, плюс "твърд" списък с междудумия, които се считат за позволени, но все още не всички позволени се разпознават като такива, което води до показване и на доста "фалшиви". Отделно в един контекст теоретично валидно междудумие може да е позволено, но в друг да е грешно (напр. " „_"). При всички случаи дори да се окаже, че не върши особена работа, тази опция е интересна за тестване.
На скрийншота долу виждате как изглежда. Междудумията се показват между две сиви вертикални черти, за да се вижда добре къде точно е началото и края на стринга (особено ако междудумието започва или свършва с интервал). В междудумията символът "·" (interpunct) означава нов ред, а "›" — табулатор (\x9B). Може да кликате междудумията директно в списъка, за да скролирате текста в десния панел, точно както се прави с думите. Допълнително има опция "Показвай само грешните и непознатите междудумия", която би трябвало да изведе само списъка, който ни интересува (вторият скрийншот), тоест потенциалните грешки. Ако в текста няма грешки и програмата открива правилно всички позволени междудумия, този списък трябва да е празен. Засега това не е така поради гореизложеното. Все пак върши работа, ако отделим време да прегледаме всички показани непознати (unknown).
Тази опция практически дублира някои от вече съществуващите пунктуационни проверки, в смисъл че една и съща грешка ще се появи и тук, в списъка на непознатите междудумия, и по-долу в левия панел, където се извеждат дадения тип пунктуационни грешки (примерно <интервал><дясна скоба>). Но тук еднотипните са групирани в един ред, а по-долу са показани негрупирани на различни редове и в контекст от няколко думи.
Същият текст с включена опция "Показвай само грешните и непознатите междудумия":
С изключена опция (както е по подразбиране) тази версия е идентична с 2.46.1 (плюс десетина нови думи в бг базата), тъй че няма проблем да я ползвате, въпреки че е неофициална.
Неофициална версия, няма да я пускам на сайта. Нова опция "Показвай честотен списък на междудумията" (изключена по подразбиране). С нея в левия панел се извежда списък на всички различни междудумия в текста, подобно на списъците с думи. Опцията работи само с SFB файлове и не съм решил дали по-натам ще я направя универсална. Примерно за srt субтитрите или за уебстатиите алгоритмите са коренно различни. Идеята ми дойде, докато мислех как да откривам най-пълно пунктуационните грешки, без да оставям нищо на случайността. Една от идеите е от списъка с всички междудумия в текста да се игнорират позволените, като се взима предвид SFB-формата, и останалите съвсем малко на брой просто визуално да се проверят за потенциални грешки. Проблемът е, че съставянето на алгоритъм дали дадено междудумие е позволено, се оказа не толкова елементарно (комбинациите са огромно число) и тепърва ще мисля как да го направя най-елегантно, ако изобщо го направя. Засега съм въвел някои правила за определяне на позволени междудумия, плюс "твърд" списък с междудумия, които се считат за позволени, но все още не всички позволени се разпознават като такива, което води до показване и на доста "фалшиви". Отделно в един контекст теоретично валидно междудумие може да е позволено, но в друг да е грешно (напр. " „_"). При всички случаи дори да се окаже, че не върши особена работа, тази опция е интересна за тестване.
На скрийншота долу виждате как изглежда. Междудумията се показват между две сиви вертикални черти, за да се вижда добре къде точно е началото и края на стринга (особено ако междудумието започва или свършва с интервал). В междудумията символът "·" (interpunct) означава нов ред, а "›" — табулатор (\x9B). Може да кликате междудумията директно в списъка, за да скролирате текста в десния панел, точно както се прави с думите. Допълнително има опция "Показвай само грешните и непознатите междудумия", която би трябвало да изведе само списъка, който ни интересува (вторият скрийншот), тоест потенциалните грешки. Ако в текста няма грешки и програмата открива правилно всички позволени междудумия, този списък трябва да е празен. Засега това не е така поради гореизложеното. Все пак върши работа, ако отделим време да прегледаме всички показани непознати (unknown).
Тази опция практически дублира някои от вече съществуващите пунктуационни проверки, в смисъл че една и съща грешка ще се появи и тук, в списъка на непознатите междудумия, и по-долу в левия панел, където се извеждат дадения тип пунктуационни грешки (примерно <интервал><дясна скоба>). Но тук еднотипните са групирани в един ред, а по-долу са показани негрупирани на различни редове и в контекст от няколко думи.
Същият текст с включена опция "Показвай само грешните и непознатите междудумия":
С изключена опция (както е по подразбиране) тази версия е идентична с 2.46.1 (плюс десетина нови думи в бг базата), тъй че няма проблем да я ползвате, въпреки че е неофициална.
Последната и единствена промяна е направена от dd на 05 октомври 2012, 18:02.
Re: IDI спелчекър 2.46.1
От около седмица има нов нормативен речник на БАН, наречен „Официален правописен речник на българския език”. Предишният нормативен речник е от 2002 г., затова събитието е доста значимо. Очертава се актуализация на правописа на много думи в чекъра, но няма да стане веднага. Например някои думи, които досега беше правилно да се пишат само разделно, вече могат да се пишат и слято, и разделно.
Ето няколко клипчета:
http://bnt.bg/bg/news/view/84704/nov_pr ... skija_ezik
http://tv7.bg/news/society/9438892.html
http://btvnews.bg/video/news/nov-rechni ... -ezik.html
Ето няколко клипчета:
http://bnt.bg/bg/news/view/84704/nov_pr ... skija_ezik
http://tv7.bg/news/society/9438892.html
http://btvnews.bg/video/news/nov-rechni ... -ezik.html
Re: IDI спелчекър 2.46.2
Версия 2.46.2 — скромен ъпдейт на базите.
Re: IDI спелчекър 2.46.2
Много добра програма, лично аз използвам по-стара версия, но май ще трябва да премина към последната, която, е дал dd
Re: IDI спелчекър 2.48
Версия 2.48
Задължителен ъпдейт!
1. Оправих една критична грешка, която крашваше програмата, макар и рядко. Грешката е стара, още от първите версии, тъй че ако имате спомен чекърът да ви е забивал, най-вероятно това е бил проблемът.
2. Допълнения и корекции в базите.
Задължителен ъпдейт!
1. Оправих една критична грешка, която крашваше програмата, макар и рядко. Грешката е стара, още от първите версии, тъй че ако имате спомен чекърът да ви е забивал, най-вероятно това е бил проблемът.
2. Допълнения и корекции в базите.
Re: IDI спелчекър 2.49
Версия 2.49
1. Широчината на двата панела вече може да се променя чрез влачене с мишката. Досега панелите бяха статични, което леко дразнеше.
2. Малък ъпдейт на базите.
1. Широчината на двата панела вече може да се променя чрез влачене с мишката. Досега панелите бяха статични, което леко дразнеше.
2. Малък ъпдейт на базите.
Re: IDI спелчекър 2.49
Много добра новина за панелите, ще бъде много по-удобно.
Благодаря.
Благодаря.
„Добрият пътешественик няма твърди планове и не държи да пристигне на всяка цена.“ Лао Дзъ
Re: IDI спелчекър 2.49.3
Версия 2.49.3 — като горе.
Re: IDI спелчекър 2.49.3
Тъй като използвам клавиатура с макрос бутони реших да си добавя IDI Spell Checker да ми се стартира директно от един от макрос бутоните. В следствие на това ми се появи следната грешка:
Интересното, което забелязах е, че когато стартирам директно приложението ми се изписва „IDI Spell Checker 2.49.3 стартира, моля почакайте…“, а когато се стартира от макрос бутона се изписва „IDI Dictionary 4.84 стартира, моля почакайте…“. След това разбира се появява „idispell.exe has stopped working“ и грешката, която копирах по-горе.
Ако можеш да ми дадеш насока как да разреша този проблем?
Код: Избиране на всичко
Problem signature:
Problem Event Name: APPCRASH
Application Name: idispell.exe
Application Version: 0.0.0.0
Application Timestamp: 514ddd6b
Fault Module Name: idispell.exe
Fault Module Version: 0.0.0.0
Fault Module Timestamp: 514ddd6b
Exception Code: c0000005
Exception Offset: 0000fefb
OS Version: 6.1.7601.2.1.0.256.48
Locale ID: 1026
Additional Information 1: 0a9e
Additional Information 2: 0a9e372d3b4ad19135b953a78882e789
Additional Information 3: 0a9e
Additional Information 4: 0a9e372d3b4ad19135b953a78882e789
Read our privacy statement online:
http://go.microsoft.com/fwlink/?linkid=104288&clcid=0x0409
If the online privacy statement is not available, please read our privacy statement offline:
C:\Windows\system32\en-US\erofflps.txt
Ако можеш да ми дадеш насока как да разреша този проблем?
Re: IDI спелчекър 2.49.4
Не знам как да го решиш, но проблемът очевидно идва от факта, че стартирана по този начин, програмата не си намира файловете, тоест базите. Същата грешка ще ти даде, ако изтриеш всички файлове от папката на чекъра, освен exe-то, след което стартираш exe-то. Или още по-лесно, ако копираш exe-то в празна папка и го стартираш. Понеже не съм си играл да правя проверка при стартиране и да извеждам съобщение, ако някой файл липсва, програмата просто крашва.petrovich написа:Ако можеш да ми дадеш насока как да разреша този проблем?
"IDI Dictionary" е част от чекъра и ако програмата не намери файла "settings.txt" (както е в твоя случай), тя се стартира в режим "речник", който е по подразбиране, а не в режим "чекър" (тоест стартира се различен модул). Затова ти се появява различно съобщение в началото. Може да стартираш речника и ръчно в чекъра от меню "Модули" -> "Английско-български речник".
Re: IDI спелчекър 2.50
Здравей,
Видях, че вече има нова версия 2.51. Можеш ли да споделиш какви са промени в нея?
Забелязах, че има голяма разлика в размера на пакета спрямо 2.49.3 (след разархивиране 149 MB), а 2.51 (след разархивиране 97,1 MB).
Видях, че вече има нова версия 2.51. Можеш ли да споделиш какви са промени в нея?
Забелязах, че има голяма разлика в размера на пакета спрямо 2.49.3 (след разархивиране 149 MB), а 2.51 (след разархивиране 97,1 MB).
Re: IDI спелчекър 2.50
Обичайните неголеми ъпдейти на словоформената база. Оптимизирах някои неща, затова пакетът е по-малък. Целта е по-бързо стартиране.petrovich написа:Здравей,
Видях, че вече има нова версия 2.51. Можеш ли да споделиш какви са промени в нея?
Забелязах, че има голяма разлика в размера на пакета спрямо 2.49.3 (след разархивиране 149 MB), а 2.51 (след разархивиране 97,1 MB).
Re: IDI спелчекър 2.50
Версия 2.52
Ъпдейт на базите и оптимизии в кода, в резултат на което програмата се зарежда в 40 MB по-малко памет от 2.51.
Ъпдейт на базите и оптимизии в кода, в резултат на което програмата се зарежда в 40 MB по-малко памет от 2.51.
Re: IDI спелчекър 2.52
По повод 24 май БАН за пръв път осигурява свободен онлайн достъп до Речника на българския език. Още подробности тук.
Re: IDI спелчекър 2.52
Доживяхме. Туко виж са разбрали последното послание изпратено от екипа. Отделен е въпросът, че в томовете има не малко грешки.
Re: IDI спелчекър 2.52
Не разбрах, има ли надежда да публикуват самата база данни или ще оставят само уеб интерфейс? Защото второто, струва ми се, би било по-полезно.
Re: IDI спелчекър 2.53
Версия 2.53 — малък ъпдейт на базите.
Кой е на линия
Потребители, разглеждащи форума: 0 гости