Visa ett inlägg
Oläst 2008-11-01, 16:15 #7
peterbf peterbf är inte uppkopplad
Nykomling
 
Reg.datum: Sep 2008
Inlägg: 48
peterbf peterbf är inte uppkopplad
Nykomling
 
Reg.datum: Sep 2008
Inlägg: 48
Okej. Väldigt givande svar.

I.o.m. att jag vill få ut den första informationen i varje artikel, exempelvis:
"Bob Marley föddes ...."

Denna kontenta ligger inom ett

-element. Så jag testade att hämta texten mellan de första

</p>-taggarna i dokumentet. Då får jag ut informationen jag vill, såtillvida att artikeln är utformad som så. Det jag vill få fram är att artiklarna är olika utformade. Om jag hämtar texten inom

-elementet i artikeln om Manchester United så får jag ut korrekt output, men om jag däremot hämtar ut texten från Bob Marley-artikeln får texten "Rastafari", då detta är den första

-taggen i den artikeln.

Jag har väldigt svårt att se hur jag ska lyckas med att få ut det jag vill i.o.m. att just den texten inte är omgiven av en unik id-nyckel i dess element.

Min nuvarande kod:

Kod:
        HtmlWeb document = new HtmlWeb();
        string url = string.Format("http://en.wikipedia.org/wiki/{0}", name);
        Uri uri = new Uri(url);

        HtmlDocument doc = document.Load(url);

        HtmlNode content = doc.DocumentNode.SelectSingleNode("//div[@id='bodyContent']");
     
        litFacts.Text = content.InnerText;
Några erfarenheter eller tips?
peterbf är inte uppkopplad   Svara med citatSvara med citat