Om det är en nisch som inte finns med i Pricerunner, etc. kanske det går att övertala ägarna av butikerna att exportera sina data i lämpligt format?
Annars är tipset att du börjar läsa in dig på regular expressions.

Vilket dock, som du säger, kan bli jobbigt om butikerna ändrar om.
Så här gör Pricerunner:
Citat:
Information som presenteras på Pricerunner.com samlas in på följande sätt:
1. Med hjälp av agentteknik samlar vi kontinuerligt in produkt- och prisinformation från återförsäljare och tillverkare på nätet. Information lagrar vi sedan tillfälligt i vår databas. (Agentteknik är en mjukvara som automatiskt går ut på Internet och hämtar in detaljerad information.)
2. Vissa återförsäljare skickar regelbunden information innehållande bl a prisuppgifter från sitt ekonomisystem/webshop till oss på Pricerunner.com. Filen läses sedan in automatiskt i vår databas(filformatet kan t ex vara en tabseparerad textfil).
3. Utöver detta har vi ”Prisagenter” som regelbundet går och läser av sortiment och priser i butik och sedan uppdaterar databasen med denna information. Detta för att ge konsumenterna en bra bild av utbudet på hela den svenska marknaden.
|