Hej!
Jag håller på att koda en sökmotor för jobb och kommit så långt att sidan crawlar jobb från Sveriges största jobbsidor och stoppar in allt i min databas. Det är mycket information som crawlas och stoppas in i databasen.. speciellt löptexten för ett jobb. Tabellen som tar hand om annonserna ligger på ca 58MB efter att ha crawlat alla stora jobbsidor. Cirka 40 000 rader, men det är löptexten som tar sån plats i databasen.
Nu undrar jag hur jag ska fixa en effektiv relevanssökning? Har aldrig pillat med relevanssökningar tidigare, utan det har mest blivit LIKE i MySQL då det inte har varit lika mycket information att söka efter i tidigare projekt.
Sphinx har jag hört talas om som grazzy har rekommenderat mig och det är GRYMT! Verkligen grymt, äger sönder MySQLs fulltext index extremt. Men nu är det såhär att jag inte har någon möjlighet att ha sidan på en server privat, utan jag måste ha den på ett webbhotell, i början iaf. Och där finns det ingen möjlighet att köra in Sphinx
Väldigt tacksam om folk har tips på hur man kan göra
// skriver lite luddigt eftersom jag nyss vaknade...