Citat:
Originally posted by peterbf@Oct 31 2008, 16:11
Ok. Då är det uppklarat.
Hur itererar jag nu genom detta dokument för att hitta specifika element?
|
Jag är inte helt 100 på hur du menar men är jag fel ute får du formulera om frågan så jag kanske förstår bättre.
Du behöver inte spara ner informationen i en fil om du inte vill. Syntaxen för att plocka upp ett element påminner om xpath och kan se ut såhär:
HtmlNode content = doc.DocumentNode.SelectSingleNode("//div[@id='bodyContent']");
content kommer då att vara den div som har id bodyContent.
Jag testade en gång att plocka ut innehåll från engelska wikipedia, organisera den i en xml fil och därefter köra innehållet mot Google tanslate för att få ut texten på svenska. Slutresultatet blev väl sådär och det var inget jag använde men tekniken fungerade