Citat:
Ursprungligen postat av nomicon
Citat:
Ursprungligen postat av Robert
Jag har själv screenscrapat i mina dagar (länge sedan nu) men använde lite mer krångligare metoder.
Nu sitter jag på "andra sidan" och vill skydda en viss site från ss. Hur är bästa sättet att *försvåra* en ss? Alltså inte förhindra, för det går inte.
Jag tänkte alternera outputen på olika sätt (utan att störa funktionalitet och design), men frågan är hur en sådan alternering skulle göras för att försvåra regex och andra parsningar? Tilläggas ska att siten är i xhtml vilket faktiskt i sig borde förenkla viss typ av ss (xmlparsning etc). :angry:
Vad är det vanligaste att regexp går efter? Id'n? classnamn? n-te DIV'en i outputen?
|
Jag har sett att vissa siter lägger in ett skräptecken mellan varje ord (dvs där det är ett blanksteg) och gör det i samma färg som bakgrunden, så att det inte syns.. Försöker man markera och kopiera texten så får man med dessa tecken också... störigt! 
|
Då sessa skräptecken måste vara taggade på något sätt för att kunna ha en annan färg så är det alldeles för enkelt att plocka bort dem ur datat.
Kanske några extra "dummy" divar, alternerande class-namn för css-klasserna/eventuellt id-namn, samt lite "vaskning" av divarna kanske borde få 10% av de intresserade ss'arna att inte orka fortsätta. Mer sätt?