Citat:
Ursprungligen postat av dAEk
Utan att gå in på vad som är bäst tycker jag att någon form av parser som kan gå igenom DOM-trädet är att föredra. Skriver man en screen-scraper får man vara beredd på att sidorna ändras titt som tätt och då är det verkligen inge kul att sitta med en massa regex.
|
Det bör väl påpekas att det inte är särskilt ovanligt med en inkorrekt html-struktur.