Citat:
Ursprungligen postat av emilv
Det ser ut som att du försöker tolka HTML med något som liknar reguljära uttryck. Jag rekommenderar att du använder PHPs in inbyggda XML-klasser för att tolka dokument istället, så kan du till exempel plocka ut alla noder av en viss typ och iterera över dem, alltså oavsett hur många noder det är.
Ett enkelt exempel där jag skriver ut innehållet i alla <p>-element:
Kod:
$html = new DOMDocument();
$html->loadHTML($content);
$ps = $html->getElementByTagName('p');
for($i = 1; $i < $ps->length; $i++) {
echo $ps->item($i)->nodeValue . "\n";
}
|
Långt ifrån alla sidor är XHTML kompitabla. Och därmed så kommer inte XML klasserna att funka.
Men däremot är de att rekommendera.