Kom ihåg mig?
Home Menu

Menu


Hur många scannar din sajt?

 
Ämnesverktyg Visningsalternativ
Oläst 2010-11-24, 14:07 #1
studiox studiox är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2004
Inlägg: 1 356
studiox studiox är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2004
Inlägg: 1 356
Standard Hur många scannar din sajt?

För några år sedan var det rätt ovanligt, men idag är det väldigt vanligt förekommande, det ske konstant, dygnet-runt i webbloggar att man ser Ip-adresser som orimligtvis borde besöka en sida man har.

Nyss såg jag exempelvis les.lib.hibbing.k12.mn.us. ingen aning vad det är förutom att det verkar vara minesota state. Svårt att se att dom besöker en svensk sida

Hur brukar ni göra? Skita i det / Spärra etc?

Svårt och se ett bra sätt och spärra också såklart..
studiox är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 15:26 #2
BarateaUs avatar
BarateaU BarateaU är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Nov 2007
Inlägg: 2 648
BarateaU BarateaU är inte uppkopplad
Klarade millennium-buggen
BarateaUs avatar
 
Reg.datum: Nov 2007
Inlägg: 2 648
Beror lite på, kör man WP kan man installera pluginet "bad behavior" som blockar en hel del.
De är ju många som scrapar nätet och URL'er i mängder, inte bara sökmotorer utan spammare av diverse slag.
BarateaU är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 15:49 #3
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
Citat:
Ursprungligen postat av BarateaU Visa inlägg
Beror lite på, kör man WP kan man installera pluginet "bad behavior" som blockar en hel del.
De är ju många som scrapar nätet och URL'er i mängder, inte bara sökmotorer utan spammare av diverse slag.
Bad Behavior (funkar inte bara till WP) skyddar väl i princip bara mot spammare? Att skydda sig mot scraping är betydligt svårare. Den som har några smarta lösningar får gärna tipsa. Inte många WP-sidor som har något material värt att scrapa.
__________________
Full-stack developer, free for smaller assignments
tartareandesire är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 15:50 #4
MrBob MrBob är inte uppkopplad
Flitig postare
 
Reg.datum: Mar 2009
Inlägg: 459
MrBob MrBob är inte uppkopplad
Flitig postare
 
Reg.datum: Mar 2009
Inlägg: 459
http://www.hibbing.mn.us/

Hibbing är en stad i Minnesota, K12 är det där IT programmet som USA drog igång typ 98 eller liknande...
Det var nåt med att alla barnen skulle logga in på www i skolan, eller nåt liknande. (Inte Hem -pc som vi har och inte "en dator till varje elev".)

Inga länkar fungerar och det är en Macserver i andra ändan...
Så... du får väl dra dina egna slutsatser och göra vad du känner känns rätt för dig.
Någon inom skolan i staden Hibbing, är mitt tips.
Måttligt spännande... men visst... you never know!! :-)

Lycka till!!


***
Kuriosa:
Kan tillägga att Apple för någon vecka sedan meddelade att man har beslutat lägga ner Mac OS X Server och den hårdvaran och enbart satsa på konsumentgrejer.


Mera kuriosa:
Tydligen kommer Bob Dylan från denna staden... Av kändis texten och museet att döma!! :-)

Senast redigerad av MrBob den 2010-11-24 klockan 16:05 Anledning: Bollen är rund... allt kan hända...!! :-)
MrBob är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 16:02 #5
studiox studiox är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2004
Inlägg: 1 356
studiox studiox är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2004
Inlägg: 1 356
Citat:
Ursprungligen postat av MrBob Visa inlägg
http://www.hibbing.mn.us/

Någon inom skolan i staden Hibbing, är mitt tips.
Måttligt spännande... men visst... you never know!! :-)
Det var mest ett exempel. Spontant så tror jag att det i det där fallet kanske rör sig om ett bibliotet där det eventuellt råkar sitta en svensk eller att biblioteket scannar stora stygga internet (ungefär som Kungliga biblioteket)

Citat:
Ursprungligen postat av MrBob Visa inlägg
Kan tillägga att Apple för någon vecka sedan meddelade att man har beslutat lägga ner Mac OS X Server och den hårdvaran och enbart satsa på konsumentgrejer.
Njae, det är nog snart 2 veckor sen och det är XServer som dom beslutat sig för att lägga ner, inte OSX Server.
studiox är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 16:46 #6
hnn hnn är inte uppkopplad
Banned
 
Reg.datum: Mar 2004
Inlägg: 2 587
hnn hnn är inte uppkopplad
Banned
 
Reg.datum: Mar 2004
Inlägg: 2 587
K12 är inget "IT program" utan förskola till årskurs 12.

K = Kindergarten
hnn är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 16:46 #7
BarateaUs avatar
BarateaU BarateaU är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Nov 2007
Inlägg: 2 648
BarateaU BarateaU är inte uppkopplad
Klarade millennium-buggen
BarateaUs avatar
 
Reg.datum: Nov 2007
Inlägg: 2 648
Citat:
Ursprungligen postat av tartareandesire Visa inlägg
Bad Behavior (funkar inte bara till WP) skyddar väl i princip bara mot spammare? Att skydda sig mot scraping är betydligt svårare. Den som har några smarta lösningar får gärna tipsa. Inte många WP-sidor som har något material värt att scrapa.
Mja och nej, inte bara mot spammare.
Den blockar robotar som ligger med i svartlistan och en del andra saker också.

Sen blockar den om någon utger sig för att vara en "useragent" som den inte är.
t.ex. som denna:


217.7.253.152
pd907fd98.dip0.t-ipconnect.de

User-Agent claimed to be Googlebot, claim appears to be false. GET *** HTTP/1.1
Connection: Keep-Alive
User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; http://www.google.com/bot.html)


Eller som denna som useragenten är i blacklisten.
64.27.0.28
unassigned.calpop.com

User-Agent was found on blacklist GET *** HTTP/1.1
Connection: Keep-Alive
User-Agent: Mozilla/4.0 (compatible ; MSIE 6.0; Windows NT 5.1)


Eller om den saknar header.

78.129.242.88
srv-1.viewsonyou.com

Required header 'Accept' missing GET / HTTP/1.1
User-Agent: Mozilla/5.0 (compatible; BuiltWith/0.3; +http://builtwith.com/bot.html)

På vissa WP sidor jag har är de väldigt mycket trafik, fast 90% är bara skräp trafik som är botar, scraping, och annat skit.
BarateaU är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-24, 23:12 #8
studiox studiox är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2004
Inlägg: 1 356
studiox studiox är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2004
Inlägg: 1 356
Tack BarateaU,
Mycket intressant.

Försöker ta reda på var man hittar Bad Behavior om man inte kör WP, några tips?
studiox är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-25, 00:16 #9
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
Citat:
Ursprungligen postat av studiox Visa inlägg
Tack BarateaU,
Mycket intressant.

Försöker ta reda på var man hittar Bad Behavior om man inte kör WP, några tips?
http://www.bad-behavior.ioerror.us/

Exemplen ovan tar ju i princip bara bort spammare ändå, vill någon scrapa din sida så hjälper det normalt sett inte ett dugg.
__________________
Full-stack developer, free for smaller assignments
tartareandesire är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-11-25, 03:52 #10
Normans avatar
Norman Norman är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Feb 2004
Inlägg: 589
Norman Norman är inte uppkopplad
Mycket flitig postare
Normans avatar
 
Reg.datum: Feb 2004
Inlägg: 589
"scanning" - rätt ord är scraping.
Vanligt fenomen att bottar söker av sidor för material de anser är intressant.

Finns massa bottar som scrapar eniro eller andra katalogtjänster. Ett otyg men det finns botemedel
Norman är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 16:57.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017