Citat:
Ursprungligen postat av Martin™
Vilken eller vilka metoder skulle du säga är bäst för att scrapa information från hemsidor?
1# Regex
2# XPath
3# Vet-ej-vad-den-heter*
Vet-ej-vad-den-heter*=
|
PHPQuery kan du nog titta på för #3.
Regex är krångligast men flexbilast. PHPQuery är väldigt enkelt att lära sig och de flesta har iallafall lite koll på hur det ska användas, de flesta med någon webberfarenhet har ju använt sig av jquery selektorer.
För andra språk, som t ex Python eller Java, finns rätt bra och mer utbyggda scraping bibliotek - men för PHP har iallafall inte jag hittat något intressant.