| FAQ |
| Kalender |
|
|
|
|
#1 | ||
|
|||
|
Supermoderator
|
Måste instämma att regex för det mesta är att föredra. Fördelarna uppväger definitivt eventuella nackdelar och är man hyfsat van blir det sällan alltför tidsödande.
Vilken teknik du än väljer så kan du vara säker på en sak nämligen att detta är inte en engångskostnad. Har du ett gäng scrapers igång så kommer du garanterat att behöva uppdatera dessa då och då. Det är tråkigt värre men inte mycket man kan göra åt det.
__________________
Full-stack developer, free for smaller assignments Senast redigerad av tartareandesire den 2011-04-01 klockan 20:57 |
||
|
|
Svara med citat
|
|
|
#2 | |||
|
||||
|
Mycket flitig postare
|
||||
|
|
Svara med citat
|
|
|
#3 | ||
|
|||
|
Flitig postare
|
Nej, du är inte ensam och jag tror inte du missat någonting alls. Jag skulle vilja se någon skriva en parser som parsar ut brödtexten ur alla inlägg till en tråd på wn.se. Med xpath är det en baggis.
|
||
|
|
Svara med citat
|
|
|
#4 | |||
|
||||
|
Bara ett inlägg till!
|
Det är en baggis med reguljära uttryck också (särskilt eftersom inläggen verkar ha kommentarer i början och slutet, något som är extremt lätt att fånga med reguljära uttryck). Jag har förresten inte tagit ställning för eller emot någon teknik utan hävdar fortfarande att det beror på omständigheterna.
|
|||
|
|
Svara med citat
|
|
|
#5 | ||
|
|||
|
Flitig postare
|
Citat:
Kod:
//div[contains(@id, "post_message")]/text() |
||
|
|
Svara med citat
|
|
|
#6 | ||
|
|||
|
Administratör
|
Citat:
__________________
eldefors.com - Personlig (teknik)-blogg |
||
|
|
Svara med citat
|
| Svara |
|
|