Nykomling
|
|
Reg.datum: Sep 2008
Inlägg: 48
|
|
Nykomling
Reg.datum: Sep 2008
Inlägg: 48
|
Tack för svaren.
Precis, Daniel.st, det blir för många generella regler att sätta upp. Har insett efter väldigt mycket jobb med detta att de flesta artiklar är helt olika utformade, att hämta ut HTML-koden som jag gjort är rätt bra, om det man vill ha ligger inom ett element med ett specifikt id eller klassnamn. Men det är mycket trixande, speciellt om man har ett system kopplat till att per automatik hämta artiklar och formattera dem on the fly.
Att hämta ut texten i MediaWiki-format är att rekommendera, om man har en parser, det finns inga ute i ASP.NET C# vad jag sett (hojta till om ni hittar nån), och i denna parser är det otroligt många regler och reguljära uttryck, ska man skriva detta själv ska du ha väldigt mycket tid och stora kunskaper om reguljära uttryck.
Men i.o.m. att de flesta artiklar som sagt är olika utformade kommer ni som jobbar med detta i framtiden få sätta upp regler för de undantag som finns, då måste ni även hitta alla undantag (artiklar är t.ex. olika om ni läser om en organisation, person, sjukdom m.fl.).
Det jag kommer göra är att försöka skapa en parser som formatterar MediaWikis format, det känns dessutom säkrare då det är detta formatet artiklarna är i redigerbart läge.
Som sagt, tack för svaren. Jag kommer uppdatera tråden om jag kommer på nåt nytt eller hittar en lösning tillslut.
|