FAQ |
Kalender |
![]() |
#1 | |||
|
||||
Bara ett inlägg till!
|
Hej hopp alla Julsurfare, nu är det väl inte den här delen av forumet jag brukar skriva i mest. Men jag hoppas ändå att kunna få ut lite info här med
![]() jag har lagat ett litet script med cURL som skickar en länk till en sida, och "scrappar" hela resultattexten från sidan.. men jag vill inte ha allting, utan enbart ett par få rader.. någon som har info om hur jag sätter en begränsning på vad som ska läsas? Eller är det smidigare att läsa hela, och bara sortera ut i det man får hem? Det jag önskar vore att via html kunna ange classen (div) som ska läsas. eller .ex från ett visst ord och x antyl rader från det. Sidans resultat kommer alltid att se likadant ut, någon som har en tanke om detta |
|||
![]() |
![]() |
![]() |
#2 | ||
|
|||
Klarade millennium-buggen
|
Om texten är felformaterad enligt standard så kan du läsa in sidan via XML (html följer samma struktur), och sedermera söka efter ev. id eller class och ladda in denna.
Om inte så får du nog fnula på lite regexps mm. |
||
![]() |
![]() |
![]() |
#3 | ||
|
|||
Supermoderator
|
Med största sannolikhet får du som Jonas säger sortera ut det du vill ha med reguljära uttryck.
Det här hör ju egentligen till serversidan.
__________________
Full-stack developer, free for smaller assignments |
||
![]() |
![]() |
![]() |
#4 | |||
|
||||
Bara ett inlägg till!
|
Jo precis, räknar med att få filtrera ut det med reg_exp, men vad menar du med att det egentligen tillhör serversidan?
|
|||
![]() |
![]() |
![]() |
#5 | ||
|
|||
Supermoderator
|
Citat:
__________________
Full-stack developer, free for smaller assignments |
||
![]() |
![]() |
![]() |
#6 | |||
|
||||
Bara ett inlägg till!
|
nån som har ett exempel på hur man scrapar en sida med xml?
|
|||
![]() |
![]() |
![]() |
#7 | |||
|
||||
Bara ett inlägg till!
|
åh, jag måste ha klickat fel, menade naturligtvis serversida
![]() |
|||
![]() |
![]() |
![]() |
#8 | ||
|
|||
Klarade millennium-buggen
|
Citat:
|
||
![]() |
![]() |
![]() |
#9 | |||
|
||||
Bara ett inlägg till!
|
Hej Novocain.
Vad är det du är ute efter? Känner lite att ditt svar på tartareandesire tips inte riktigt funkar ihop med din fråga.. ![]() Hela google är full med kod.. här är bara några exempel på söksträngar: Kod:
file_get_contents preg_match php parse html curl preg_match curl parse xml php class parse xml |
|||
![]() |
![]() |
![]() |
#10 | |||
|
||||
Bara ett inlägg till!
|
Coredev: ah äntligen det var ordet parse jag saknade
![]() ![]() Jag vill alltså parsea ut en viss del av en sida, och jag skulle vilja kunna använda antingen html ( som att ange ett html element där den ska börja läsa, och sen ett till där den ska sluta läsa. Eller så vill jag kunna ange text där den ska börja, och där den ska sluta.. dessa punkter kommer alltid att var detsamma, oavsett vad jag matar in till sidan) Jonas jag kör med php cURL. (läst ett par artiklar om att det är snabbast för att hämta info) Ursäkta otydlighet. Jag ska läsa på lite om regular expressions och hur man sätter parse regler i xpath/ eller någon xml lösning. Dessa är relativt nya områden för mig. Om någon orkar skriva ett litet exempel medans så vore det tacksamt.. fex ett exempel som hämtar ut "Board statistics" på framsidan av wn, vore intressant. Edit: jag hittade alltså massor intressant nu när jag visste vad jag skulle söka efter, så jag tror att jag kommer att få det till, men ett exempel vore ändå trevligt ![]() God Jul & Gott nytt år. |
|||
![]() |
![]() |
Svara |
|
|