Visa ett inlägg
Oläst 2010-01-17, 11:59 #6
Clarence Clarence är inte uppkopplad
Administratör
 
Reg.datum: Jan 2003
Inlägg: 1 974
Clarence Clarence är inte uppkopplad
Administratör
 
Reg.datum: Jan 2003
Inlägg: 1 974
1.) Hämta dokumentet ifråga. Curl är smidigt men ska du inte greja med cookies, sessions, redirects osv är det inte så viktigt vad du väljer.
2.) Läs ut informationen du vill ha. Vanligaste metoderna är att traversera dom-trädet respektive reguljära uttryckt (regular expressions/regex).
3.) Lägg in den hämtade information i en databas-tabell som du har skapat med en struktur som passar din data.

Det finns ingen färdig kod för att göra detta utan det kräver lite kunskap och pill.

Det finns dock desktop-program för att hämta delar av dokument från din egen dator för att sen publicera dessa. Tyvärr minns jag inte vad dessa kan heta då jag bara stött på dom som hastigast. Men söker du på screen scraping och går igenom ett par sidors resultat kanske du hittar något sådant.
Clarence är inte uppkopplad   Svara med citatSvara med citat