Visa ett inlägg
Oläst 2013-05-10, 16:56 #1
secag secag är inte uppkopplad
Medlem
 
Reg.datum: Nov 2012
Inlägg: 211
secag secag är inte uppkopplad
Medlem
 
Reg.datum: Nov 2012
Inlägg: 211
Standard Matchning av texter, STORT antal

Hej,

Jag har cirka 80 000 texter där det KAN finnas dubletter, inte precis exakt men det skiljer väl sig på något ord/punkt/tecken.

Då jag inte har ork eller tid för att gå igenom 1 och 1 så kanske det finns någon smart teknik som kan leta fram ganska stora likheter i texter? Jag har allting sparat i en databas och i textfiler. Någon som vet vilken teknik jag ska använda?
secag är inte uppkopplad   Svara med citatSvara med citat