Medlem
|
|
Reg.datum: Nov 2012
Inlägg: 211
|
|
Medlem
Reg.datum: Nov 2012
Inlägg: 211
|
Matchning av texter, STORT antal
Hej,
Jag har cirka 80 000 texter där det KAN finnas dubletter, inte precis exakt men det skiljer väl sig på något ord/punkt/tecken.
Då jag inte har ork eller tid för att gå igenom 1 och 1 så kanske det finns någon smart teknik som kan leta fram ganska stora likheter i texter? Jag har allting sparat i en databas och i textfiler. Någon som vet vilken teknik jag ska använda?
|