FAQ |
Kalender |
![]() |
#1 | ||
|
|||
Har WN som tidsfördriv
|
För några år sedan var det rätt ovanligt, men idag är det väldigt vanligt förekommande, det ske konstant, dygnet-runt i webbloggar att man ser Ip-adresser som orimligtvis borde besöka en sida man har.
Nyss såg jag exempelvis les.lib.hibbing.k12.mn.us. ingen aning vad det är förutom att det verkar vara minesota state. Svårt att se att dom besöker en svensk sida ![]() Hur brukar ni göra? Skita i det / Spärra etc? Svårt och se ett bra sätt och spärra också såklart.. |
||
![]() |
![]() |
![]() |
#2 | |||
|
||||
Klarade millennium-buggen
|
Beror lite på, kör man WP kan man installera pluginet "bad behavior" som blockar en hel del.
De är ju många som scrapar nätet och URL'er i mängder, inte bara sökmotorer utan spammare av diverse slag. |
|||
![]() |
![]() |
![]() |
#3 | ||
|
|||
Supermoderator
|
Bad Behavior (funkar inte bara till WP) skyddar väl i princip bara mot spammare? Att skydda sig mot scraping är betydligt svårare. Den som har några smarta lösningar får gärna tipsa. Inte många WP-sidor som har något material värt att scrapa.
__________________
Full-stack developer, free for smaller assignments |
||
![]() |
![]() |
![]() |
#4 | ||
|
|||
Flitig postare
|
http://www.hibbing.mn.us/
Hibbing är en stad i Minnesota, K12 är det där IT programmet som USA drog igång typ 98 eller liknande... Det var nåt med att alla barnen skulle logga in på www i skolan, eller nåt liknande. (Inte Hem -pc som vi har och inte "en dator till varje elev".) Inga länkar fungerar och det är en Macserver i andra ändan... Så... du får väl dra dina egna slutsatser och göra vad du känner känns rätt för dig. Någon inom skolan i staden Hibbing, är mitt tips. Måttligt spännande... men visst... you never know!! :-) Lycka till!! *** Kuriosa: Kan tillägga att Apple för någon vecka sedan meddelade att man har beslutat lägga ner Mac OS X Server och den hårdvaran och enbart satsa på konsumentgrejer. Mera kuriosa: Tydligen kommer Bob Dylan från denna staden... Av kändis texten och museet att döma!! :-) Senast redigerad av MrBob den 2010-11-24 klockan 16:05 Anledning: Bollen är rund... allt kan hända...!! :-) |
||
![]() |
![]() |
![]() |
#5 | ||
|
|||
Har WN som tidsfördriv
|
Citat:
Njae, det är nog snart 2 veckor sen och det är XServer som dom beslutat sig för att lägga ner, inte OSX Server. |
||
![]() |
![]() |
![]() |
#6 | ||
|
|||
Banned
|
K12 är inget "IT program" utan förskola till årskurs 12.
K = Kindergarten |
||
![]() |
![]() |
![]() |
#7 | |||
|
||||
Klarade millennium-buggen
|
Citat:
Den blockar robotar som ligger med i svartlistan och en del andra saker också. Sen blockar den om någon utger sig för att vara en "useragent" som den inte är. t.ex. som denna: 217.7.253.152 pd907fd98.dip0.t-ipconnect.de User-Agent claimed to be Googlebot, claim appears to be false. GET *** HTTP/1.1 Connection: Keep-Alive User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; http://www.google.com/bot.html) Eller som denna som useragenten är i blacklisten. 64.27.0.28 unassigned.calpop.com User-Agent was found on blacklist GET *** HTTP/1.1 Connection: Keep-Alive User-Agent: Mozilla/4.0 (compatible ; MSIE 6.0; Windows NT 5.1) Eller om den saknar header. 78.129.242.88 srv-1.viewsonyou.com Required header 'Accept' missing GET / HTTP/1.1 User-Agent: Mozilla/5.0 (compatible; BuiltWith/0.3; +http://builtwith.com/bot.html) På vissa WP sidor jag har är de väldigt mycket trafik, fast 90% är bara skräp trafik som är botar, scraping, och annat skit. |
|||
![]() |
![]() |
![]() |
#8 | ||
|
|||
Har WN som tidsfördriv
|
Tack BarateaU,
Mycket intressant. Försöker ta reda på var man hittar Bad Behavior om man inte kör WP, några tips? |
||
![]() |
![]() |
![]() |
#9 | ||
|
|||
Supermoderator
|
Citat:
Exemplen ovan tar ju i princip bara bort spammare ändå, vill någon scrapa din sida så hjälper det normalt sett inte ett dugg.
__________________
Full-stack developer, free for smaller assignments |
||
![]() |
![]() |
![]() |
#10 | |||
|
||||
Mycket flitig postare
|
"scanning" - rätt ord är scraping.
Vanligt fenomen att bottar söker av sidor för material de anser är intressant. Finns massa bottar som scrapar eniro eller andra katalogtjänster. Ett otyg men det finns botemedel ![]() |
|||
![]() |
![]() |
Svara |
|
|