FAQ |
Kalender |
2009-09-27, 23:37 | #1 | ||
|
|||
Medlem
|
Söker efter en algoritm för att göra om pluralis till singularis på svenska, alternativt veta mera om pluralisändelsernas grammatiska regler.
När -ar, -or, -er, -r, respektive -n används. Vilket programmeringspråk spelar ingen roll igentligen, dock helst Ruby eller PHP. Med vänlig hälsning, Robert |
||
Svara med citat |
2009-09-28, 07:05 | #2 | |||
|
||||
Bara ett inlägg till!
|
Du kan börja här: http://sv.wikipedia.org/wiki/Substantiv#Numerus
och här: http://sv.wikipedia.org/wiki/Plural Det ser ut att krävas en ordlista med varje ords böjningsformer. |
|||
Svara med citat |
2009-09-28, 07:34 | #3 | |||
|
||||
Flitig postare
|
Jag tror att det som du beskriver kallas för word-stemming. Och används av bl.a Google för att ge dig mer relevanta träffar.
"PyStemmer provides stemmer functionality in Pythonfor English, German, Norwegian, Italian, Dutch,Portuguese, French, Swedish. PyStemmer is based on the Snowball stemmer" http://pypi.python.org/pypi/PyStemmer/1.0.1 Samt http://snowball.tartarus.org/algorit...h/stemmer.html |
|||
Svara med citat |
2009-09-28, 11:05 | #4 | ||
|
|||
Supermoderator
|
Tyvärr finns det nog ingen enklare metod. Det svenska språket är svårt med ganska få allmängiltiga grammatiska regler och en hel del undantag.
__________________
Full-stack developer, free for smaller assignments |
||
Svara med citat |
2009-10-01, 19:41 | #5 | ||
|
|||
Medlem
|
Tack för alla svaren.
En word-stemming tjänst skulle sitta fint (håller tummarna!) Ska kika närmare på det, tack! Med vänlig hälsning, Robert |
||
Svara med citat |
2009-10-03, 08:16 | #6 | ||
|
|||
Supermoderator
|
Återkom gärna om du hittar någonting bra som fungerar.
__________________
Full-stack developer, free for smaller assignments |
||
Svara med citat |
2009-10-03, 12:08 | #7 | ||
|
|||
Klarade millennium-buggen
|
Porten till PHP för stemmern på svenska fungerar bra. Så titta på den.
|
||
Svara med citat |
2009-10-03, 13:21 | #8 | ||
|
|||
Flitig postare
|
Jag har använt Snowball i ganska många projekt. Speciellt effektivt är det om du använder dig av Lucene, då stöd finns för att plugga in in analyzers / stemmers i vanliga... lingvistiska kedjan.
|
||
Svara med citat |
Svara |
|
|