Citat:
Originally posted by nord84@Sep 3 2008, 09:09
Tack för alla svar hittills, om det är någon som har en lösning färdig så kollar jag gärna på hur den ser ut.
Elliasson >> Läste på wiki om reguljära uttryck: används det verkligen för själva hämtandet av data? Eller används det snarare för att försäkra sig om att man hittar sidan, när man inte är helt säker på URL?
|
Reguljära uttryck (Regular expressions) används för att hämta ut en substräng ur en sträng. Man kan alltså t.ex. använda det för att hämta ut title-elementet ur en HTML-fil, eller för att hämta ut alla siffror i strängen "AB123C".
I ditt fall tror jag du kommer snabbare undan genom att ladda ner Wikipedias databas och plocka ut datan du är intresserad av... Det kan du göra här:
http://en.wikipedia.org/wiki/Wikiped...abase_download