WN - Visa ett inlägg - HtmlAgilityPack

Daniel.st · 2008-10-31, 19:03

Citat:

Originally posted by peterbf@Oct 31 2008, 16:11
Ok. Då är det uppklarat.
Hur itererar jag nu genom detta dokument för att hitta specifika element?

Jag är inte helt 100 på hur du menar men är jag fel ute får du formulera om frågan så jag kanske förstår bättre.

Du behöver inte spara ner informationen i en fil om du inte vill. Syntaxen för att plocka upp ett element påminner om xpath och kan se ut såhär:

HtmlNode content = doc.DocumentNode.SelectSingleNode("//div[@id='bodyContent']");

content kommer då att vara den div som har id bodyContent.

Jag testade en gång att plocka ut innehåll från engelska wikipedia, organisera den i en xml fil och därefter köra innehållet mot Google tanslate för att få ut texten på svenska. Slutresultatet blev väl sådär och det var inget jag använde men tekniken fungerade