WN

WN (https://www.wn.se/forum/index.php)
-   Serversidans teknologier (https://www.wn.se/forum/forumdisplay.php?f=4)
-   -   Singularis algoritm (https://www.wn.se/forum/showthread.php?t=1038223)

Aerpe 2009-09-27 23:37

Singularis algoritm
 
Söker efter en algoritm för att göra om pluralis till singularis på svenska, alternativt veta mera om pluralisändelsernas grammatiska regler.

När -ar, -or, -er, -r, respektive -n används.

Vilket programmeringspråk spelar ingen roll igentligen, dock helst Ruby eller PHP.

Med vänlig hälsning,
Robert

emilv 2009-09-28 07:05

Du kan börja här: http://sv.wikipedia.org/wiki/Substantiv#Numerus
och här: http://sv.wikipedia.org/wiki/Plural

Det ser ut att krävas en ordlista med varje ords böjningsformer.

JLE 2009-09-28 07:34

Jag tror att det som du beskriver kallas för word-stemming. Och används av bl.a Google för att ge dig mer relevanta träffar.

"PyStemmer provides stemmer functionality in Pythonfor English, German, Norwegian, Italian, Dutch,Portuguese, French, Swedish. PyStemmer is based on the Snowball stemmer"

http://pypi.python.org/pypi/PyStemmer/1.0.1

Samt

http://snowball.tartarus.org/algorit...h/stemmer.html

tartareandesire 2009-09-28 11:05

Tyvärr finns det nog ingen enklare metod. Det svenska språket är svårt med ganska få allmängiltiga grammatiska regler och en hel del undantag.

Aerpe 2009-10-01 19:41

Tack för alla svaren.

En word-stemming tjänst skulle sitta fint (håller tummarna!) Ska kika närmare på det, tack!

Med vänlig hälsning,
Robert

tartareandesire 2009-10-03 08:16

Citat:

Ursprungligen postat av Aerpe (Inlägg 20324468)
Tack för alla svaren.

En word-stemming tjänst skulle sitta fint (håller tummarna!) Ska kika närmare på det, tack!

Med vänlig hälsning,
Robert

Återkom gärna om du hittar någonting bra som fungerar.

Erik Stenman 2009-10-03 12:08

Porten till PHP för stemmern på svenska fungerar bra. Så titta på den.

Perben 2009-10-03 13:21

Jag har använt Snowball i ganska många projekt. Speciellt effektivt är det om du använder dig av Lucene, då stöd finns för att plugga in in analyzers / stemmers i vanliga... lingvistiska kedjan.


Alla tider är GMT +2. Klockan är nu 13:19.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson