Страница 1 от 1

db.sql.gz непълен?

Пуснато: 24 март 2016, 12:39
от ench0
Изтеглих си базата на речника от тази стр: http://rechnik.chitanka.info/about , на която долу в ляво има линк към файла db.sql.gz. Импортирах в mySQL на localhost:
mysql Ver 14.14 Distrib 5.5.23, for Linux (i686) using readline 5.1
- - -

Базата ми изглежда НЕПЪЛНА? Възможно ли е това? Не изключвам възможността и аз нещо да съм омазал, но дори при прост search във sql файла се вижда че липсват доста думи...
- - -
Липсите доколкото мога да видя са най-вече от към глаголи. При SQL search за глаголи излизат общо около 12 хиляди думи, като тука има и много дублираши се форми на един и същ корен (от рода на "ям"-"ще ям"-"щях да ям"-"ядете"-"ядяхте" и т.н.)... т.е. реално да има 1-2 хиляди думи (глагoли)??

Всъщност точно "ям", например липсва. Последната дума която се вижда във SQL файла е "зейва", а предполагам че са по азбучен ред? Но и между "абдикирам" (първата в списъка) и "зейва" има много дупки! Например има "агонизирам" но няма "агитирам". Не виждам "виждам" :) ... макар че се пада преди "зейвам" която уж е последната.

Интересно е че в РЕЧКО няма очевидни липси (т.е. всички описани като липси от мен по-горе думи Речко ги намира). Т.е. най-вероятно файла db.sql.gz който е предоставен за download не е актуализиран? Би ли било възможно да се актуализира? В краен случай, ако има съображения да не се поства цялата база за публичен достъп/download - дали е възможно да ми предоставите линк от където да си я дръпна? Правя си обратен (римен) речник и много се надявах тази база да ми свърши работа и на пръв поглед изглеждаше точно така... ако не бяха тия липси...

:)

Re: db.sql.gz непълен?

Пуснато: 24 март 2016, 12:42
от ench0
За вс. случай ето MD5 + размера на файла при мен:
размер, байтове: 70,834,811
MD5: 2036b92a00ff5cd5794dbccf999e03bf

Re: db.sql.gz непълен?

Пуснато: 24 март 2016, 12:56
от Борислав
Това е пълната база. Вероятно не търсиш където трябва.

Re: db.sql.gz непълен?

Пуснато: 24 март 2016, 13:04
от Борислав
Ето размерите на по-важните таблици в базата:
  • word – 119 678
  • derivative_form – 4 013 667
  • incorrect_form – 404 099

Re: db.sql.gz непълен?

Пуснато: 24 март 2016, 14:54
от ench0
Бориславе, благодаря за бързия отговор и за помощта.

Значи явно наистина ми е бил "омазан" импорта. Първия път го правих през phpMyAdmin и като се замисля, май ми даде timeout грешка обаче аз погледнах че има таблици, има някакви данни и реших че вс. е ок.

Този път го направих директно през mysql. Импорта завърши без каквото и да е съобщение за грешка, и броя записи в таблиците съвпада с твоя.

:)