IDI Spell Checker 24.09.15

От време на време се появяват идеи за странични проекти. Обсъждайте ги тук.
Правила
Уважавайте другите участници и се отнасяйте с тях така, както бихте желали те да се отнасят с вас!
Отговор
beertobeer
Мнения: 38
Регистрация: 26 декември 2008, 19:07

Re: IDI спелчекър v2.33

Мнение от beertobeer »

Направи ми впечатление, че маркира като грешни думи, които са си верни, макар и рядко използвани. Пример - "Гъсти вълма дим скриваха..."
Думата "вълма" се маркира като грешна. И още нещо, според мен по-важно - НЕ се маркират като грешка случаите, когато в пряка реч има край на изречение, точка и след дълго тире следващата дума е с малка буква
- Това е всичко, което мога да направя. - отговори той след кратък размисъл.
В този случай "отговори" трябва да е с главна буква
Epsilon
Мнения: 16
Регистрация: 02 септември 2009, 14:19

Re: IDI спелчекър v2.33

Мнение от Epsilon »

Всъщност не трябва да е с главна буква, а трябва да се махне точката.
Mandor
Мнения: 752
Регистрация: 19 август 2006, 10:56
Връзка:

Re: IDI спелчекър v2.33

Мнение от Mandor »

beertobeer написа:Направи ми впечатление, че маркира като грешни думи, които са си верни, макар и рядко използвани. Пример - "Гъсти вълма дим скриваха..."
Напълно логично — никой спелчекър не включва особено редки думи, за да се избегне пропускането на грешни изписвания; ами ако правилната дума горе беше „вълна“? Всъщност този проблем — за количеството включвани думи в речника на спелчекърите — беше обсъждан в друга тема.
beertobeer написа:И още нещо, според мен по-важно - НЕ се маркират като грешка случаите, когато в пряка реч има край на изречение, точка и след дълго тире следващата дума е с малка буква
Е, това е спелчекър, а не пунктуационен анализатор. Не можем да очакваме да прави всичко.


Колкото до посочения пример, Xesiona вече ти отговори — в този случай точката е грешна, а не малката буква.
Аватар
NomaD
Мнения: 200
Регистрация: 10 март 2007, 19:39

Re: IDI спелчекър v2.33

Мнение от NomaD »

Всъщност правилните форми са "валмо" (ед. ч.), "валма" (мн. ч.) - и двете присъстват в база данните на спелчекъра. Прилагателно - "валмест".
Изображение
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.35

Мнение от dd »

Версия 2.35

Дребни промени. Няма да има нови версии поне до есента, тъй че се актуализирайте.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.36

Мнение от dd »

Версия 2.36

Натрупаха се доста корекции в базите и реших да не бавя поредната версия:
— Около 150 нови бг форми и дузина коригирани.
— Към 2'000 нови значения във вградения машинен псевдопреводач.

Некритичен ъпдейт, тъй че по-мързеливите може да го пропуснат.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.36

Мнение от dd »

Версия 2.37 — оправих една потенциално критична грешка (проявява се в много редки случаи).
svetlisashkov

Re: IDI спелчекър v2.17

Мнение от svetlisashkov »

petrovich написа:Аз също съм "за" версията за Линукс. Пробвах преди няколко седмици под Wine, но не винаги работи, както трябва.
Да, аз също подкрепям идеята. Всъщност ако имаше версия за Линукс, щях с удоволствие да включа програмата (стига авторите ѝ да разрешат, разбира се) в българската дистрибуция УСУ Линукс...
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.39

Мнение от dd »

Версия 2.39

1. Всички непознати думи на латиница вече се групират в левия панел подобно на непознатите български думи. Досега думите на латиница се извеждаха негрупирано по реда на срещане преди българския списък, което при смесени текстове с повече латиница (цитати, имена и пр.) водеше до извеждане на досадно дълъг списък с непознати английски (примерно) думи. По този начин програмата се превръща в мощно средство и за правописна проверка на английски текстове. Скоро ще кача версия с преведен на английски интерфейс и без българските бази, за да може да се ползва и от англоговорещия свят.

2. Ново меню "Английски списък" с дузина опции, управляващи начина на извеждане на списъка с думи на латиница. Не всички опции имат пряко отношения към правописната проверка, например опцията "Честотен списък на всички думи..." извежда всички думи, подредени по честота на срещане.

3. Несъществена опция "Инфо в долния вместо в левия панел". Активирането й уголемява леко долния десен панел и при двойно кликане върху английски или български думи в горния панел, в долния се извежда различна информация за думите (тип, български превод и пр.). Опцията се ползва предимно при активиран модул "Машинен превод", при който информацията обикновено се извежда в левия панел, но ако там стои текст, който не искаме да припокриваме, може да ползваме временно долния панел.

4. Стотина допълнения и корекции в базите.
Epsilon
Мнения: 16
Регистрация: 02 септември 2009, 14:19

Re: IDI спелчекър 2.39

Мнение от Epsilon »

А възможно ли е да се добави маркера M>tabframe/M$ и да се премахне маркера L>/L$ към "Режим роман", тъй като това вече е променено при форматирането в SFB?
Не че е нещо фатално, разбира се, всички знаем (или поне по-старите редактори) за промените, но е просто по-удобно, когато това не се отчита като грешка.
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: IDI спелчекър 2.39

Мнение от gioganotti »

Здравейте,
Имам следния проблем. Когато отворя файл в спелчекъра, всичко е ок, до момента в който реша да го запазя. След запазването и последващо отваряне, вместо букви, файла съдържа въпросителни. Прегледах си настройките на компютъра: всичко е както трябва. Ето снимки от процеса: https://picasaweb.google.com/gioganotti/152011. За проба редактирах малък текст в спелчекъра и без да давам сейв, го копирах и прехвърлих в празен документ, който запазих. При отваряне всичко си е наред. Всички други файлове се разчитат без проблем, дори и в интернет. Компютъра ми е с windows XP SP3; фонетична кирилица 3.0 на "инжинера" Г.Атанасов; open office 3.2; регионални настройки - навсякъде bulgarian. Моля, ако някой има рецепта, да я сподели. Засега се справям по индианския начин, но е дразнещо.
п.п. Забравих да допълня, че самото българско меню на спелчекъра го виждам като въпросителни, но съм го научил почти наизуст, така че не ми е проблем.
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.39

Мнение от dd »

Версия 2.40

@gioganotti, щом регионалните настройки са наред, но менюто не се показва, подозирам, че фонетичната кирилица, за която говориш, е подменила (оплескала) системните настройки.
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: IDI спелчекър 2.40

Мнение от gioganotti »

Но с други програми нямам такъв проблем. Не ми е толкова важно менюто на чекъра да е четимо, колкото да мога да запазвам файл, който съм обработил примерно на 17% и на другия ден да мога да си продължа. Ако наистина фонетиката "бърка" нещата, кажете коя от многото да си инсталирам? Предварително благодаря.
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.40

Мнение от dd »

gioganotti написа:Не ми е толкова важно менюто на чекъра да е четимо, колкото да мога да запазвам файл, който съм обработил примерно на 17% и на другия ден да мога да си продълж
Това, че първоначалният файл е наред, а записаният не се извежда добре, ми подсказва, че може би има частен проблем при записването, който няма нищо общо с шрифтовете. Ако можеш, качи ми някъде оригинален и записан файл, за да ги погледна на ниско ниво. Поне при мен всичко работи добре. Може да пробваш и със старата версия 1.87, която е на сайта, за да видиш дали повторно отвореният файл ще е наред. Също от меню "Формат" -> "Шрифт" опитай да избереш "Microsoft Sans Serif" (ако изобщо го намериш в списъка), после натисни бутона "Refresh". На втория от скрийншотовете ти забелязвам, че текстът в десния панел не е с шрифта, който чекърът ползва (Microsoft Sans Serif), което ми подсказва, че по някаква причина програмата не може да го зареди (освен ако преди това не си сменил ръчно шрифта чрез менюто). Това може би обяснява и защо менютата не се виждат. Не правя никаква проверка за наличието на необходимите шрифтове на кирилица, но май ще се наложи.
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: IDI спелчекър 2.40

Мнение от gioganotti »

http://dox.bg/files/dw?a=897420dccd
http://dox.bg/files/dw?a=477ecc9c27
http://dox.bg/files/dw?a=4d0f61bf2b
http://dox.bg/files/dw?a=8f270214de

Поредността на файловете е както следва: Запазен файл от спелчекъра; скрийншот при отваряне на същия; скрийншот при зареждане на файла в спелчекъра; оригинален файл. Пробвах с версии 1.87 ; 2.39full и2.39lite.
п.п. Току що (19:30) свалих и изпробвах версия 2.40. При направените проби установих следното: При запис на файл в юникод, след това при отваряне се чете на кирилица. При запис в анси - не. Надписите продължават да са във вид на въпросителни. Падащите менюта са на кирилица.
Ето резултата: http://dox.bg/files/dw?a=4dca204eca
Не съм променял нищо по настройките на компютъра. За мен решението е намерено. Ако мога да бъда полезен в бъдеще, съм на линия.
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.40

Мнение от dd »

@gioganotti, пробвай и ми кажи дали с тази версия надписите на кирилица на бутоните се четат, или пак са въпросителни.

Виждам, че изходният ти файл е .rtf и явно на твоята система има проблем с коректното прочитане. При мен твоят .rtf файл се отваря и коригира нормално (без "гаргите" в левия панел) и после може да се записва без проблем и в ANSI. Имам няколко идеи и ще търся решение. Засега просто конвертирай изходните .rtf файлове в ANSI или UTF-8, преди да ги заредиш в чекъра.
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: IDI спелчекър 2.40

Мнение от gioganotti »

Направих всички проби, за които се сетих. В "readme" файла е описано кой изходен файл в какъв вариант е. http://dox.bg/files/dw?a=5cac5d3f97
Надявам се, че съм бил полезен.
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.40

Мнение от dd »

@gioganotti, файла "redaction 2.txt" с "fine reader" ли си го записал като utf, или с чекъра, след като си го отворил като rft?
заинтересован

Re: IDI спелчекър 2.40

Мнение от заинтересован »

И аз да се включа: как точно се определя типовата информация от ,,_D2_ungrouped_sorted``?
Трябва ми типовата информация без да пускам програмата и бих искал да си я извлека от речника. Ще съм благодарен на разяснения за чисълцата в този файл.
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: IDI спелчекър 2.40

Мнение от gioganotti »

С "рийдъра".
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.40

Мнение от dd »

gioganotti написа:С "рийдъра".
Ясно. Проблемът е, че файла си го записал не като UTF-8, а като UTF-16, а чекърът разпознава само UTF-8 файлове (имат различен BOM в началото). Ако не открие UTF-8 BOM, чекърът си мисли, че е ANSI и го отваря като такъв, затова после като го отвориш, виждаш "гарги". UTF-16 файловете са по-редки, затова досега не съм си играл, но в някоя следваща версия ще добавя възможност да се отварят, тъй като е десетина реда код.
Последната и единствена промяна е направена от dd на 06 септември 2011, 20:15.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.40

Мнение от dd »

заинтересован написа:И аз да се включа: как точно се определя типовата информация от ,,_D2_ungrouped_sorted``?
Трябва ми типовата информация без да пускам програмата и бих искал да си я извлека от речника. Ще съм благодарен на разяснения за чисълцата в този файл.
Форматът на файла е 4 полета: производна форма, основна форма, идентификатор на тип и идентификатор на суфикс. Ето таблиците на образуване на производните форми за почти всички типове: тук и тук. Трябва само да определиш на кой тип (примерно "19a") кой идентификатор във файла отговаря (това за домашно). Идентификаторите на тип са числа от 0 до 471 (тоест има 472 типа и подтипа), а идентификаторите на суфикс са от 0 до "X", като "X" зависи от типа. Една форма може да бъде в един или повече типа - например формата "бара" е в три типа: основна форма (бара, тоест река), производна форма на съществителното "бар" (влезе в бара) и производна форма на глагола "барам". Във файла това е кодирано така:


бара бар 0 1
бара бар 0 5
бара бара 85 0
бара барам 440 2
бара барам 440 7
бара барам 440 8
gioganotti
Мнения: 36
Регистрация: 03 април 2008, 18:26
Местонахождение: София

Re: IDI спелчекър 2.40

Мнение от gioganotti »

dd написа:Ясно. Проблемът е, че файла си го записал не като UTF-8, а като UTF-16
Грешката е моя, дори не го бях забелязал този 16. Явно другия път не трябва да бързам, а да се оглеждам внимателно. Много благодаря за отделеното време.
Ако не отговарям на писмата Ви, вижте [url]http://6lyokavitza.org/mail[/url]
заинтересован

Re: IDI спелчекър 2.40

Мнение от заинтересован »

Много благодаря за разясненията, ще разгледам таблиците.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.41

Мнение от dd »

Версия 2.41

Няколко дузини нови български думи и към 2'000 нови значения в машинния псевдопреводач от английски. Незадължителен ъпдейт.
lodiko
Мнения: 2
Регистрация: 28 ноември 2011, 12:43

Re: IDI спелчекър 2.41

Мнение от lodiko »

Здравей,

Използвам спелчекъра, създаден от теб и съм изключително доволен от него. Често обаче ми се налага да обработвам текст на таблет, чиято операционна система е Android 3.1, а за нея поне за сега не съм намерил софтуер за проверка на правописа и граматиката. планираш ли създаването на подобен софтуер (независимо дали това ще бъде платена или безплатна версия). Ако отговорът ти е"да" съм готов да помагам с тестове или с каквото друго бих бил полезен.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.41

Мнение от dd »

@lodiko, за Linux може и да няма, но за Android вероятно ще има, особено ако след 2-3 години се окаже, че PC-то е заминало при грамофонните плочи.


Версия 2.42 — препоръчителен ъпдейт:

— Оправих няколко недоглеждания при работа с диалога Find+replace. Например "Replace all" досега работеше само ако поне веднъж преди това сме натиснали "Find Next".
— Неголеми допълнения в базите.
lodiko
Мнения: 2
Регистрация: 28 ноември 2011, 12:43

Re: IDI спелчекър 2.41

Мнение от lodiko »

dd написа:@lodiko, за Linux може и да няма, но за Android вероятно ще има, особено ако след 2-3 години се окаже, че PC-то е заминало при грамофонните плочи.
Не ми се вярва това да стане чак толкова скоро ;), но със сигурност Android-базираните устройства ще се увеличат. Мобилността и непрекъснатата възможност да обработваш и редактираш информация на тях според мен ще ги "изстреля" доста на високо. За това мисля, че има бъдеще разработката на този софтуер за подобни устройства.
petrovich
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър 2.42

Мнение от petrovich »

Имам предложение да поставиш бутон за „Речко“, както си направил за сайтове като Google и Wikipedia. Така директно ще може да се търси, в речника на библиотеката, дадената дума.
dd
Мнения: 170
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър 2.42

Мнение от dd »

Версия 1.42.1 — малък ъпдейт на базите.

petrovich написа:Имам предложение да поставиш бутон за „Речко“, както си направил за сайтове като Google и Wikipedia.
Долните 5 бутона са програмируеми и може да поставиш линк към "Речко" на мястото на някой от сегашните линкове. Отваряш "settings.txt", намираш опциите LINK5 и LINKL5, които в момента са:

Код: Избиране на всичко

LINK5 http://www.urbandictionary.com/define.php?term=XXXXX
LINKL5 ur
и ги променяш така:

Код: Избиране на всичко

LINK5 http://rechnik.chitanka.info/w/XXXXX
LINKL5 Р
Програмата замества петте хикса "XXXXX" в първата опция с избрания в някой от панелите текст и отваря получения адрес. Втората опция е етикетчето, което ще виждаш върху бутона, и може да е произволен текст (една или повече букви).
Отговор

Обратно към

Кой е на линия

Потребители, разглеждащи форума: 0 гости