Kom ihåg mig?
Home Menu

Menu


HtmlAgilityPack - hämta specifika element

 
Ämnesverktyg Visningsalternativ
Oläst 2008-10-31, 12:10 #1
peterbf peterbf är inte uppkopplad
Nykomling
 
Reg.datum: Sep 2008
Inlägg: 48
peterbf peterbf är inte uppkopplad
Nykomling
 
Reg.datum: Sep 2008
Inlägg: 48
Tjänare!

Nu har man börjat på WN också, här verkar det vara en trevlig stämning i trådarna!

Jag jobbar just nu med ett projekt där jag vill hämta artiklar från Wikipedia och presentera text på min webbplats. Jag använder följande kod för att hämta data från HTTP för att senare ladda in datan i ett HtmlDocument och tillslut konvertera till XDocument:

Kod:
        HtmlWeb document = new HtmlWeb();
        string url = "http://en.wikipedia.org/wiki/Manchester_united";
        Uri uri = new Uri(url);

        HtmlDocument doc = document.Load(url);

        var XDoc = doc.ToXDocument();

        XDoc.Save(Server.MapPath("output.xml"));
ToXDocument() är en extension method som jag själv adderat till namespace:t. Den ser ut som följer:

Kod:
  public static class HtmlDocumentExtensions
  {
    public static XDocument ToXDocument(this HtmlDocument document)
    {
      using (StringWriter sw = new StringWriter())
      {
        document.OptionOutputAsXml = true;
        document.Save(sw);
        return XDocument.Parse(sw.GetStringBuilder().ToString());
      }
    }
  }
Som ni ser så sparar jag ned filen för att se vad den returnerar och på så sätt hämta ut det jag vill från dokumentet, d.v.s. texten, informationen om - i detta fall - Manchester United. Det som returneras i "output.xml" är just nu följande:

http://aspsidan.se/code/default.asp?c=23755

Är det någon själ här inne som har egna erfarenheter av HtmlAgilityPack som kan hjälpa mig iterera genom dokumentet för att hitta det jag söker? Det krävs kanske bara ett litet exempel. Just nu ser ju inte outputen ut som en XML-fil vilket förvirrar mig. För på rätt spår är jag väl?
peterbf är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 15:08.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017