Ämne: Parsa
Visa ett inlägg
Oläst 2005-01-19, 10:45 #9
Roberts avatar
Robert Robert är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Jan 2004
Inlägg: 2 103
Robert Robert är inte uppkopplad
Klarade millennium-buggen
Roberts avatar
 
Reg.datum: Jan 2004
Inlägg: 2 103
Citat:
Ursprungligen postat av nomicon
Citat:
Ursprungligen postat av Robert
Jag har själv screenscrapat i mina dagar (länge sedan nu) men använde lite mer krångligare metoder.
Nu sitter jag på "andra sidan" och vill skydda en viss site från ss. Hur är bästa sättet att *försvåra* en ss? Alltså inte förhindra, för det går inte.

Jag tänkte alternera outputen på olika sätt (utan att störa funktionalitet och design), men frågan är hur en sådan alternering skulle göras för att försvåra regex och andra parsningar? Tilläggas ska att siten är i xhtml vilket faktiskt i sig borde förenkla viss typ av ss (xmlparsning etc). :angry:

Vad är det vanligaste att regexp går efter? Id'n? classnamn? n-te DIV'en i outputen?
Jag har sett att vissa siter lägger in ett skräptecken mellan varje ord (dvs där det är ett blanksteg) och gör det i samma färg som bakgrunden, så att det inte syns.. Försöker man markera och kopiera texten så får man med dessa tecken också... störigt!
Då sessa skräptecken måste vara taggade på något sätt för att kunna ha en annan färg så är det alldeles för enkelt att plocka bort dem ur datat.

Kanske några extra "dummy" divar, alternerande class-namn för css-klasserna/eventuellt id-namn, samt lite "vaskning" av divarna kanske borde få 10% av de intresserade ss'arna att inte orka fortsätta. Mer sätt?
Robert är inte uppkopplad   Svara med citatSvara med citat