IDI спелчекър 4.44

От време на време се появяват идеи за странични проекти. Обсъждайте ги тук.

Мнениеот petrovich » 06 юни 2010, 14:32

Благодаря за новата версия.
Относно страничната бележка:
1. Текста Моби Дик е пълен с грешки, но той чака проверка;
2. Никой няма да допусне такъв текст за добавяне. Просто ще промени статуса си от „Чака проверка“ на „За редакция“. :)
3. Идеята за текста е добра, но тук вече е въпросът как ще се реализира. :wink:
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Мнениеот dd » 06 юни 2010, 15:59

Hari, прав си. Казах го по-скоро по принцип, отколкото за определена книга.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот dd » 09 юни 2010, 11:00

Открих една много стара грешка, правейки това демовидео, показващо коригиране на над 1000 OCR грешки в субтитри. Ето оправена версия 1.86. Грешката няма отношение към текстовете от Читанката и спокойно може да пропуснете ъпдейта.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот petrovich » 05 юли 2010, 20:26

Тъй като dd не писа, си позволявам да напиша, че е излезнала нова версия 1.87 на IDI Spell Checker.

Благодаря на dd за трудът, който е положил!
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Мнениеот dd » 19 юли 2010, 08:07

Версия 1.88

В чекъра няма нови функции, но оправих 2 грешки. Заради едната забиваше при текст с над 900 хиляди думи (около 10MB utf-8 файл). Сега може да отваряте огромни txt файлове (50-100MB и повече), стига да имате достатъчно памет и да промените лимита по подразбиране (1 милион думи) във файла settings.txt. За целта увеличете числото до опцията MAX_WORDS_IN_FILE. Има и някои козметични промени.

За всички, които ползват чекъра и като английско-българско-английски справочник, има доста нови неща в 1.88. Просто чрез менюто превключете в режим "Машинен превод от английски", отворете "Инфо", след което може да зареждате английски или български текстове в горния или долен десен панел и да кликвате върху думи или да избирате изрази като влачите мишката върху тях. За избрания текст (дума или израз) в левия панел се показват най-различни справки. Засега няма никаква документация кое какво е, тъй че ползвайте интуицията си. Машинният превод все още е лош, но работя сериозно по въпроса.

Edit: Версия 1.89 — една важна корекция в последната минута.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот slacker » 19 юли 2010, 19:57

Извинявам се предварително за неудобния въпрос.

Защо този проект не е с отворен код? И защо този, който работи по проекта (тези, които работят по проекта) не си сътрудничат с разработчиците на проекта БГ Офис? А може би не съм прав и си сътрудничат?
slacker
 
Мнения: 62
Регистрация: 15 октомври 2009, 03:24

Мнениеот hammster » 19 юли 2010, 22:41

Искам да попитам dd защо не работят опциите "Генерирай коригиран файл" и "Генерирай коригиран OCR файл" в IDI-то, и каква е разликата между тях? Спомням си, че във версия 1.4 се генерираше файл с всички направени правописни корекции, като най-отдолу се изписваше общият брой на корекциите. Сега във файла AUTO_ххххххххххх.txt има само последната коригирана дума, а AUTOLOG_ххххххххххх.txt е празен! Дали пък аз не бъркам някъде? :roll:
С пари можеш да купиш книга, но не и знание.
Аватар
hammster
 
Мнения: 79
Регистрация: 08 юли 2006, 20:24
Местонахождение: София

Мнениеот dd » 20 юли 2010, 02:56

slacker написа:Защо този проект не е с отворен код? И защо този, който работи по проекта (тези, които работят по проекта) не си сътрудничат с разработчиците на проекта БГ Офис? А може би не съм прав и си сътрудничат?

Ще го отворя някой ден, след като спра работа по него, въпреки че не вярвам някой да седне да дописва код. Авторът на БГ Офис е основно един човек (Р. Раднев) и доколкото знам отдавна работи по други неща, въпреки че преди няколко месеца се е наложило да промени нещо по лиценза на БГ Офис (по изискване на Chrome) и покрай това е добавил стотина думи.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот dd » 20 юли 2010, 03:33

hammster написа:Искам да попитам dd защо не работят опциите "Генерирай коригиран файл" и "Генерирай коригиран OCR файл" в IDI-то, и каква е разликата между тях? Спомням си, че във версия 1.4 се генерираше файл с всички направени правописни корекции, като най-отдолу се изписваше общият брой на корекциите. Сега във файла AUTO_ххххххххххх.txt има само последната коригирана дума, а AUTOLOG_ххххххххххх.txt е празен! Дали пък аз не бъркам някъде? :roll:


"Генерирай коригиран файл" и "Генерирай коригиран OCR файл" работят по следния начин:
1. Стартираш чакъра.
2. Активираш една от опциите, преди да си отворил файл.
3. Отваряш текстов файл от менюто (или чрез влачене и пускане в десния панел) и изчакваш няколко секунди да свърши проверката.
4. Поглеждаш в папката на файла, който си отворил, за да откриеш автоматично генериран файл с префикс съответно за двете опции "AUTO_" или "ORC_".

Опцията "Генерирай коригиран файл" се мъчи да оправи автоматично всички грешки като замени непознатите думи с първото предложение от списъка с предложения за корекции, който виждаш в левия панел. Тази опция е експериментална и на този етап не върши никаква работа, тъй като понякога заменя и верни думи, въпреки че съм сложил ограничения на замяната, например да не се заменят думите с главни букви и някои други рискови случаи. Имам идея в бъдеще да прецизирам алгоритъма на замяна, но засега опцията не трябва да се ползва за нищо друго освен за тестове.

Опцията "Генерирай коригиран OCR файл" може да се ползва при текстове, в които има огромно количество смесен текст (понякога хиляда и повече думи), резултат от лошо OCR разпознаване. Под смесен текст разбирай текст, в който кирилски букви погрешно са заменени със съответните латински, които изглеждат еднакво или почти еднакво. За да се избегне нежелано конвертиране на правилни думи се спазват следните 2 правила:
1. Ако в дадена дума се открие дори една латинска буква, която няма кирилско съответствие, се приема че цялата дума е правилно написана и тя не се пипа, дори ако други латински букви в нея могат да се конвертират по таблицата по-долу).
2. Английски думи, в които е възможно всички букви да се заменят с бг съответствия по таблицата по-долу (напр. английската "appearance" -> и кирилската "арреагапсе"), не се пипат, ако фигурират в специално съставения за целта "забранителен списък" от подобни английски думи (файлът "b_ocrskip.txt"). Ако една дума е съставена изцяло от латински букви, които могат да се заменят, но не фигурира в забранителния списък, програмата я конвертира, напр. латинската "ce" става българската "се", латинската "camo" става българската "само" и т.н. Дори ако полученото при конвертирането българско съответсвие не е позната на програмата българска дума (липсва в слофовормения бг списък), конвертирането се извършва, тъй като почти винаги става дума за различни собствени имена, съкращения и прочие стрингове, които липсват в слофовормения списък, но обикновено са верни думи.

Ето част от кода, която показва кои латински букви с кои български се заменят (вътрешно програмата работи с ASCII версии на UTF-8 думите, ако входният файл е UTF-8 ):
Код: Избиране на всичко
               for( p = t1_fixed; *p != 0; p++ ) {
                  if( *p == 0x61 ) *p = 0xE0; //'а' latin - 'a' cyrillic
                  else if( *p == 0x41 ) *p = 0xC0; //A А
                  else if( *p == 0x65 ) *p = 0xE5; //e e
                  else if( *p == 0x45 ) *p = 0xC5; //E Е
                  else if( *p == 0x6F ) *p = 0xEE; //o o
                  else if( *p == 0x4F ) *p = 0xCE; //O О
                  else if( *p == 0x62 ) *p = 0xE2; //b в
                  else if( *p == 0x42 ) *p = 0xC2; //В В
                  else if( *p == 0x63 ) *p = 0xF1; //c c
                  else if( *p == 0x43 ) *p = 0xD1; //C С
                  else if( *p == 0x48 ) *p = 0xCD; //H Н
                  else if( *p == 0x72 ) *p = 0xE3; //г r
                  else if( *p == 0x75 ) *p = 0xE8; //u и
                  else if( *p == 0x55 ) *p = 0xC8; //U И
                  else if( *p == 0x6B ) *p = 0xEA; //k k
                  else if( *p == 0x4B ) *p = 0xCA; //K К
                  else if( *p == 0x6D ) *p = 0xF2; //m т
                  else if( *p == 0x4D ) *p = 0xCC; //M М
                  else if( *p == 0x6E ) *p = 0xEF; //n п
                  else if( *p == 0x70 ) *p = 0xF0; //p p
                  else if( *p == 0x50 ) *p = 0xD0; //P Р
                  else if( *p == 0x54 ) *p = 0xD2; //T Т
                  else if( *p == 0x78 ) *p = 0xF5; //x x
                  else if( *p == 0x58 ) *p = 0xD5; //X Х
                  else if( *p == 0x79 ) *p = 0xF3; //y у
                  else if( *p == 0x59 ) *p = 0xD3; //Y У
               //   else if( *p == 0x36 ) *p = 0xE1; //б 6
                  else if( ascii_latin[ *p ] ) { //latin char without a bg match, so use the original t1 without replacing any chars
                     fg = 1;
                     break;
                  }
               }
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот slacker » 20 юли 2010, 11:40

dd написа:Ще го отворя някой ден, след като спра работа по него, въпреки че не вярвам някой да седне да дописва код.


Какъв е смисълът отварянето на кода да се прави след спиране на работата по проекта?

Забелязах, че има още два проекта, които правят граматичен анализ на думите: http://slovored.com/ http://rechnik.chitanka.info/
rechnik.chitanka.info написа:Тълковната информация на думите е взета от речниците eurodict.com и onlinerechnik.com.

Словоформите са генерирани с помощта на данни от програмата IDI Spell Checker, които пък са базирани на данни от проекта БГ Офис. От БГ Офис идва и синонимната база.

Грешните изписвания на думите са създадени автоматично.


На сайта Словоред няма информация за историята на проекта. Обаче на http://bgoffice.sourceforge.net/ има връзки към slovored.com, което предполагам значи, че този проект ползва базите от данни на проекта БГ Офис.

Има ли синхронизация на базите от данни между тези проекти?
slacker
 
Мнения: 62
Регистрация: 15 октомври 2009, 03:24

Мнениеот Борислав » 20 юли 2010, 14:02

slacker написа:Забелязах, че има още два проекта, които правят граматичен анализ на думите: http://slovored.com/ http://rechnik.chitanka.info/
...
Има ли синхронизация на базите от данни между тези проекти?

rechnik.chitanka.info ще ползва текущата база на IDI Spell Checker, но все още не е изграден канала на комуникация. Преди време писах на slovored.com, но никой не ми отговори.
Аватар
Борислав
 
Мнения: 933
Регистрация: 15 ноември 2005, 17:25

Мнениеот dd » 21 юли 2010, 08:05

slacker написа:Какъв е смисълът отварянето на кода да се прави след спиране на работата по проекта?

Изходният код не е нищо особено и всеки средно добър програмист, въоръжен с типовете и базата (и желание да се труди безплатно на ползу роду), може за около месец да напише подобна програма. Но и най-добрият програмист, без базата, няма да може да направи програмата в този вид за по-малко от 2 години.

Най-ценното в чекъра е словоформената база, която е отворена, а не изходният код. Съставянето на базата е това, което ми е отнело най-много време, буквално хиляди часове, тъй като съм добавил към 500 хиляди липсващи форми към базата на БГ Офис (да не говорим за чистенето на наследените грешки). Правя го чрез статистически анализ на огромни текстови корпуси и после трудоемко изчитане на генерираните честотни списъци с липсващи форми и добавяне в съответните типове на валидните форми, които считам за безопасни за добавяне. За целта ползвам още 2 програми, които съм написал специално за целта, но не са публични. Тази за статистическия анализ на огромни корпуси (теоретично терабайти) е не по-малко сложна от самия чекър (ето скрийншот). Наложи се да я пиша, тъй като нито една програма, която намерих, не се справя. Та ако се наложи да отварям изходни кодове, ще трябва да отворя или всичко, или нищо, но вероятно един ден ще отворя всичко. Засега тривиалната причина да не отварям нищо, е че изходните кодове на места са доста разхвърляни, има дузини глупави коментари, много алгоритми тепърва ще оптимизирам, други неща тепърва ще добавям и т.н. и т.н. С една дума, искам да не се срамувам от кода, след като го отворя.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот ckitnik » 21 юли 2010, 09:39

Възможно ли е да има повече клавишни комбинации?
Например за добавяне на думи към речника или при поправка.
В случай на това
ла 16 -> за | на | са | да | ли | а | та | ела | ала | ха | ма | ал | зла | па | лай | лас | ща | лак | лае | яла | ле | лу | ба | лая | лаф | ля | лан | ола | лаг | кла
поне първите пет най-вероятни да се поправят с натискане на цифра.
................1....2....3....4.....5
ла 16 -> за | на | са | да | ли
Идеята е да се елиминира излишното въртене с мишката при най-често използваните функции.
ckitnik
 
Мнения: 43
Регистрация: 03 ноември 2008, 09:54

Мнениеот dd » 22 юли 2010, 19:44

@ckitnik, не виждам как ползването на клавиш е по-бързо от еднократно кликване с мишката върху съответното предложение. Първо ще трябва да броим предложенията, а после да търсим съответния клавиш. Това е не само по-бавно, но и предразполага към грешки. Но като цяло си прав, че за някои неща може да се добавят бързи клавиши. Това става сравнително лесно.

Версия 1.91

1. Оправих една грешка, забелязана от @petrovich. При кликване в левия панел върху някой от единичните символи # • · & ~ ^ ¶ @ ¦ |, за чието наличие в текста програмата алармира, невинаги се извършва позиционирането в десния панел върху съответния символ. Това се случва ако символът е долепен до някоя буква, а не е самостоятелен. Проблемът бе, че изпълнявам EM_FINDTEXTEXW с включен флаг FR_WHOLEWORD, което забранява откриването на търсен текст, ако той е част от дума. Този флаг е резонен за останалите случаи в чекъра, но не и ако става дума за търсене на единичен символ.

2. Оправих типовете на десетина думи с "труден" за определяне род. Например "предтеча" и "пройдоха" са в м.р., но досега бяха в типове за ж.р., както съм ги заварил в БГ Офис. Други, като "будала", "пияница", "хаймана" и подобни, са с двоен род според тълковния речник (срещат се и в мъжки, и в женски род), но досега бяха само в един тип. Тези неща са важни, защото при неправилно въведен тип алгоритъмът за съгласуване между прилагатално и съществително ще хване несъществуващ проблем при един от изразите "голям пияница" или "голяма пияница", поради това, че "пияница" фигурира само в 1 тип, а не в двата.

3. Добавих около 50 липсващи думи.
4. Други дребни корекции.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот moosehead » 02 август 2010, 16:27

dd, в последната версия (не че знам как е било в предните) не ми дава "по отделно" като потенциално разкъсана дума, а само в групата за сравнителна степен без тире.
Аватар
moosehead
 
Мнения: 112
Регистрация: 17 февруари 2007, 18:29
Местонахождение: София

Мнениеот dd » 02 август 2010, 21:08

moosehead написа:dd, в последната версия (не че знам как е било в предните) не ми дава "по отделно" като потенциално разкъсана дума, а само в групата за сравнителна степен без тире.


Не е грешка. Виж следните верни примери: "Чуждестранните граждани се приемат по отделно определен ред", "Организирането на екскурзии се осъществява по отделно договаряне".

"Отделно" е или прилагателно, или наречие, затова може да се степенува, въпреки че точно за тази дума е рядко. Затова се извежда като потенциално липсващо тире за сравнителна степен.

Логиката е следната: Ако двете части на потенциалното разкъсване съществуват като отделни думи, какъвто е случая, тогава не се съобщава за разкъсана дума, тъй като невинаги е грешка. За хората с повече свободно време за проверка има опция "Търси всички потенциално разделени думи", която извежда дори изрази, които невинаги са грешки, както е случая с "по отделно". За съжаление тази опция извежда освен потенциални грешки и огромен списък с верни изрази ("не ми", "си на", "за грижи", "за ръка"), затова не е активна по подразбиране. Възможно е някога да добавя код за допълнителна контекстна проверка за всяка възможна разкъсана дума поотделно (има над хиляда подобни думи), но играчката вероятно ще е голяма, освен ако тези над хиляда се окаже, че може да се групират по типове грешки. Например, "не ми казвай" е вярно, защото "казвай" е глагол, "не ми хора" не е вярно, защото "хора" е съществително.

Иначе има лесен начин да накараш програмата да святка изрази, които смяташ, че обикновено са грешки. Просто във файла "b_bulgarian_misspelling.txt" добавяш на самостоятелен ред, без значение на каква позиция във файла, следния ред:

по_отделно поотделно
Последната и единствена промяна е направена от dd на 05 август 2010, 22:28.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Мнениеот dd » 04 август 2010, 03:49

Версия 1.92 — Скромен ъпдейт. Тези, които ползват единствено правописния модул, може да пропуснат.

1. 30-ина нови думи в чекъра.
2. Доста допълнения в базата на машинния преводач (v0.13), но без нови алгоритми, които да водят до видимо по-качествен превод (предстои).
3. Машинният превод на английски .srt файл (субтитри) вече запазва структурата на файла, макар че някои редове стават по-дълги от допустимите 40-ина символа. Резултатният текст може да се запише като нов .srt (дясна мишка и "Save as an ANSI file") и директно да се гледа, но докато не се оправи качеството на превода, това няма голям смисъл.
4. Ново меню "Модули". В него преместих "Машинен превод" и добавих "Английско-български речник". Последното стартира пълната версия на IDI Dictionary в отделен прозорец, което в някои случаи е полезно, тъй като пълноекранният речник активира превод на копирана в клипборда дума в трейбалонче (удобно за превод във фонов режим) и някои други екстри, които досега липсваха при "голия" превод в инфопрозорчето. Речникът и досега беше част от чекъра, тоест в 1.92 не съм добавил никакъв код, който да утежнява чекъра. Просто преди нямаше интерфейс да се покаже в този вид.
5. Оправени дребни грешки плюс различни оптимизации на кода.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v1.92

Мнениеот petrovich » 12 август 2010, 12:20

Забелязах следната промяна в новите версии (не съм сигурен от коя нататък) — преди когато стартирах програмата и съответно махах отметки и правех промени (уголемяване на прозореца например), настройките ми се запомняха при следващото пускане на програмата. Сега това не е така. Възможно ли е отново да я има тази функция?
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v1.92

Мнениеот dd » 15 август 2010, 18:16

petrovich написа:Забелязах следната промяна в новите версии (не съм сигурен от коя нататък) — преди когато стартирах програмата и съответно махах отметки и правех промени (уголемяване на прозореца например), настройките ми се запомняха при следващото пускане на програмата. Сега това не е така. Възможно ли е отново да я има тази функция?


Програмата никога не е запазвала настройките по този начин, макар че е елементарно да се направи. Единственият начин да промениш опциите по подразбиране, е да промениш ръчно текстовия файл с настройките "settings.txt". Все още никъде не съм го документирал подробно (и скоро няма да го направя), но ако изчетеш цялата тема, ще откриеш тук-там информация за някои от опциите, които в дадени частни случаи вероятно има смисъл да се променят. Например моята лична версия е с една идея по-голям шрифт от този в публичната версия (FONT_SIZE 10 вместо FONT_SIZE 8), но подобни дреболии са въпрос на вкус. При всяка нова версия трябва да правиш същите промени в "settings.txt". За по-бързо може да запазваш стария "settings.txt" и да припокриваш с него новия, но това е рисковано, тъй като нищо чудно в бъдеще да добавям нови опции. Общо взето няма нужда да се пипат опциите по подразбиране, единствено за текстовете от Читанката може да се включва "Режим роман", който активира някои допълнителни проверки, съобразени с SFB форматирането.

И като странична забележка: правя известно преструктуриране на проекта и линковете към чекъра няма да се отварят известно време (свалил съм целите сайтове).
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v1.92

Мнениеот dd » 18 август 2010, 07:30

Вчера качих 1.93, но малко след това открих проблем в 1.92 (забива в един частен случай), затова даунгрейднах сайта до v1.91, тъй като тя е последната стабилна версия. За да не поемате излишни рискове, ползвайте 1.87 или 1.91 — и двете ги има на сайта. В момента преглеждам кода, за да открия проблема.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v1.92

Мнениеот Epsilon » 18 август 2010, 12:05

А има ли възможност да се отчита като грешка "нов ред-малка буква", "нов ред-тире-малка буква", "нов ред-кавички-малка буква", както и "нов ред-малко тире"?
В момента това го няма, макар че има и други начини за откриване на този тип грешки..
Epsilon
 
Мнения: 14
Регистрация: 02 септември 2009, 14:19

Re: IDI спелчекър v1.92

Мнениеот Телотен » 18 август 2010, 12:39

На този въпрос вече е отговаряно:

Някои правила не са включени по очевидни причини. Как да обясня на тези, които редактират субтитри, например, защо символът за край на ред е забранен в средата на изречението или защо малкото тире не е добра идея за пряка реч. Или пък: Защо ме кара да почвам нов параграф с табулация?
Телотен
 

Re: IDI спелчекър v1.92

Мнениеот ckitnik » 18 август 2010, 19:18

Да, но е интересно предложение специално за режим "роман".
„Добрият пътешественик няма твърди планове и не държи да пристигне на всяка цена.“ Лао Дзъ
ckitnik
 
Мнения: 43
Регистрация: 03 ноември 2008, 09:54

Re: IDI спелчекър v1.92

Мнениеот dd » 21 август 2010, 23:07

Версия 1.94 — Оправих грешката, за която стана дума по-горе.

Във v1.93:

1. Добавих проверка за <край на изречение><тайминг><малка буква> при проверка на субтитри (доста чест проблем):
.
Изображение

2. Известно количество допълнения и корекции във всички бази.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v1.94

Мнениеот dd » 25 август 2010, 19:02

Версия 1.95

Открива следните грешки:
Изображение

1. Пълен член след предлог — с много редки изключения е грешка. Не е грешка след "като", когато "като" е в ролята на съюз и след него следва подлог ("като" е омонимен предлог и съюз).

2. Непълен член в началото на изречение — обикновено е грешка, но не и при обратен словоред или ако изречението започва с допълнение, което логически се подразбира от предното изречение. Добавих и опция "Търси всички потенциално грешни кратки членове в нач. на изречение", която е изключена по подразбиране. Тази опция кара програмата да третира всички омоними и омографи като прилагателни или съществителни от мъжки род, въпреки че думите може да са глаголи. Затова опцията извежда много несъществуващи грешки, но в някои случаи може да открие и истински такива. Например в изречението "Разказа ми за пътуването, което беше..." първата дума е или съществително (моят разказ за пътуването), или глагол (той ми разказа за пътуването). При изключена опция програмата няма да изведе това изречение, тъй като формата "разказа" е омограф (съществува и в глаголен, и в съществителен тип), но при включена ще изведе изречението като потенциално грешно, тъй като подлогът не е с пълен член. Човек трябва сам да прецени дали е грешка или не. Програмата не знае, тъй като трябва да изследва много широк контекст, често пъти от няколко изречения.

Тествайки новите неща, открих няколко книги с по няколко дузини подобни грешки, очевидно поради занижен контрол в самите издателства, а не заради OCR проблем. Въпрос на решение е дали да се оставят "верни с оригинала", или да се коригират. Аз лично бих ги коригирал, въпреки че не би било престъпление, ако оставим варианта на писателя или преводача.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v1.95

Мнениеот dd » 13 септември 2010, 07:04

Версия 2.00 — говореща версия за тези, които искат да усъвършенстват/поддържат английския си. Няма да я публикувам официално на сайта, тъй като е огромна и няма пряко отношение към правописната проверка. При желание може да се свали дори и от тези, на които не им трябва говорещ чекър, тъй като звуковият модул по никакъв начин не пречи на основната функция на програмата, просто имате един допълнителен 800MB файл, който не се зарежда в паметта предварително, а микроскопични части от него се четат единствено при поискване (кликване на звуковото бутонче).

Звуковата база е 63'500 думи. С двойно кликване изберете произволна английска или българска дума от който и да е панел, после натиснете бутона със зелената колонка, за да я чуете. Ако избраната дума е българска, речникът произнася английския превод. Добавил съм и изключена по подразбиране опция "Произнасяй избраните думи", чрез която може да произнасяте думите автоматично при избиране (напр. с двойно кликване), без да кликвате звуковото бутонче. Ако избраната английска дума е производна словоформа и за нея няма асоцииран звук (например мн.ч. или сегашно или минало причастие), програмата произнася основната форма. Същото се прави и за наречията, завършващи на -ly. Постарал съм се доста и по отношение на пълнотата на базата и до честотен ранг 30'000 няма думи, за които да липсва звук.

За да чувате звук, трябва да имате инсталиран плейър, който да може да свири ogg файлове, напр. Winamp, Media Player Classic и пр. При първото кликване на аудиобутончето се отваря съответния плейър, асоцииран с ogg разширението (например Winamp-а). Не го затваряйте, а го дръжте минимизиран във фонов режим, за да работи произнасянето на следващите думи мигновено.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v1.97

Мнениеот petrovich » 15 септември 2010, 07:27

Забелязах, че не показва като грешка когато имаш комбинация <...><голяма буква>, <…><голяма буква>, <.><->, <!><->, <?><->.
Всички са без интервал. Мисля, че ще е хубаво ако има възможност и тези комбинации да ги показва в червено.
petrovich
 
Мнения: 762
Регистрация: 31 юли 2008, 14:20

Re: IDI спелчекър v1.97

Мнениеот dd » 18 септември 2010, 09:02

petrovich написа:Забелязах, че не показва като грешка когато имаш комбинация <...><голяма буква>, <…><голяма буква>, <.><->, <!><->, <?><->.
Всички са без интервал. Мисля, че ще е хубаво ако има възможност и тези комбинации да ги показва в червено.

Скоро няма да има никакви функционални подобрения в правописния модул, тъй като от доста време нямам мотивация да го развивам, пък и вече е достатъчно добър и върши отлично работата, за която е предназначен. Новите ъпдейти, когато има такива, ще са единствено с дребни добавки в базите. Версия 2.01 — 50-тина нови думи и някои други дреболии.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.01

Мнениеот dd » 19 септември 2010, 12:35

v2.01 — говорещата версия за тези, които имат интерес.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

Re: IDI спелчекър v2.01

Мнениеот dd » 15 октомври 2010, 11:35

Версия 2.02

1. Ъпдейтнах базите — 150 нови бг форми и към 1'000 нови английски значения в преводача.
2. Оправих 2 дребни грешки.
dd
 
Мнения: 157
Регистрация: 12 април 2009, 05:05

ПредишнаСледваща

Обратно към Начинания

Кой е на линия

Потребители, разглеждащи форума: Николко регистрирани потребители и 0 гости