WN

WN (https://www.wn.se/forum/index.php)
-   Serversidans teknologier (https://www.wn.se/forum/forumdisplay.php?f=4)
-   -   databas till rimordlista? (https://www.wn.se/forum/showthread.php?t=14656)

koala 2006-06-15 18:25

Jag har också gjort ett liknande script, kan väl användas till både rim, korsord, scrabble, och för det mesta också de där töntiga ordpusslen som går på TV som man ska ringa in på. http://www.expensive.se/scrabble/scrabble.php För den intresserade...

Förresten undrar jag om någon vet var man kan få tag på olika språkdatabaser. Jag skulle t ex vilja ha tabeller över kanske 100 000 ord i språket, och sedan tabeller där man kan få reda på vilken ordklass varje ord tillhör, hur det böjs, hur vanligt förekommande ordet var procentuellt sett under olika år, osv... Tänkte leka lite AI-forskare om jag har tid...

zilveer 2006-06-15 21:06

självklart an man ju inte rimma hur som helst, detta är upp till användaren .


PeterM & egomaster:

men då blir ju databasen dubbelt så stor om jag har en word_reversed- kolumnen också?
vad blir det för skillnaden i prestandan ifall jag har med "word_reversed" resp. att jag inte har word_reversed, utan bara söker i word-kolumnen?

jonny 2006-06-15 21:55

Citat:

Originally posted by zilveer@Jun 15 2006, 21:06
självklart an man ju inte rimma hur som helst, detta är upp till användaren .

PeterM egomaster:
men då blir ju databasen dubbelt så stor om jag har en word_reversed- kolumnen också?
vad blir det för skillnaden i prestandan ifall jag har med word_reversed resp. att jag inte har word_reversed, utan bara söker i word-kolumnen?

Tanken var väl att du bara skulle ha en tabell (inte kolumn!) där orden stod baklänges och att du skulle "vända" på dem för att presentera dem.

zilveer 2006-06-15 21:57

jonny:

jag menade en tabell där kolumnen word_reverse fanns med.

har ni andra förslag på hur jag kan göra databasen?

jonny 2006-06-15 22:03

Sorry för missförståndet. Men om du har orden baklänges kan du vända på dem. Du behöver inte ha dem både fram och baklänges.

eg0master 2006-06-15 22:39

Nja, om du skall söka efter ABD....GHT och vill optimera sökningarna efter index genom att använda 'ABC%' Så behöver du orden i båda ordningarna och syftet med det är att kunna ha index på orden både fram och baklänges. Troligen ger det bättre prestanda och tid har du ont om, medans diskplats kan du alltid köpa. SÅ att optimera för att spara plats i databasen är knappast något du skall lägga tid på.

Sedan hur bra indexen kommer fungera får du nog tyvärr göra någon form av tester för att se.

zilveer 2006-07-18 22:37

Hejsan,
först och främst vill jag tacka för lösningarna, de fungerar bra i mindre tabeller. då databasen inte alls kan indexera trots att vi har FULLTEXT på word och word_reverse.

när jag väljer att söka på ett "k" i början av ordet och "ek" i slutet av ordet får jag följande resultat:

Kod:

SELECT * FROM rimlexikon_words WHERE word LIKE 'k%' AND word_reversed LIKE 'ke%' LIMIT 0, 30


id  word    word_reversed description
1  kortlek  keltrok        NULL
14 kartotek ketotrak      NULL
15 kinotek  ketonik        NULL
16 klippotek ketoppilk      NULL

jag väljer att visa EXPLAIN för denna sql sats och får fram följande:
Kod:

table type possible_keys key key_len ref rows Extra
rimlexikon_words ALL word_reversed,word NULL NULL NULL 29 where used

jag har sammanlagt 29 ord i databasen bara för att testa och den söker igenom hela databasen. om jag nu haft 1 miljon ord så skulle den söka igenom alla dessa ord.

kan jag inte undkomma detta på något sätt?

nicclas 2006-07-18 23:14

Du ska väl inte ha FULLTEXT på word och word_reverse!? Du ska väl ange att du vill ha INDEX på dem!? Tag bort FULLTEXT:en och addera ett INDEX istället och prova igen. Ett vanligt INDEX på båda kolumnerna border nog fungera bra, eller vad tror ni andra?

nomicon 2006-07-19 00:51

Varför uppfinna hjulet på nytt =)

http://www.gameelite.se/rimma/

-martin

zilveer 2006-07-19 22:40

Citat:

Originally posted by nomicon@Jul 19 2006, 00:51
Varför uppfinna hjulet på nytt =)

http://www.gameelite.se/rimma/

-martin

den är nog mer komplicerad än så.
dels vill jag lära mig dels innehåller inte det lexikonet alla ord.=)


Alla tider är GMT +2. Klockan är nu 08:03.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson