Kom ihåg mig?
Home Menu

Menu


Kungen på besök... eller kanske inte...

Ämnesverktyg Visningsalternativ
Oläst 2005-06-29, 10:28 #1
Roberts avatar
Robert Robert är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Jan 2004
Inlägg: 2 103
Robert Robert är inte uppkopplad
Klarade millennium-buggen
Roberts avatar
 
Reg.datum: Jan 2004
Inlägg: 2 103
En relativt liten site i min ägo fick igår över 1000 laddade sidor ifrån "Sunet - Kungliga Biblioteket". Saken är den att siten innehåller endast en bråkdel av detta och samtliga sidor är icke parameterstyrda så även om det skulle vara en spindel så finns det inga parametervärden att trixa med. Det laddades bara sidor, inga bilder el dyl. (har dock bara tillgång till statisitk, inte webloggar)

Vad kan det vara? Är det det svenska arkiveringsprojektet som drivs ifrån K.B. eller kommer jag ihåg fel? Hursomhelst så har någon spindel någonstans hakat upp sig rejält. Någon annan som fått besök eller vet vad det är?
Robert är inte uppkopplad   Svara med citatSvara med citat
Oläst 2005-06-29, 10:40 #2
Roberts avatar
Robert Robert är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Jan 2004
Inlägg: 2 103
Robert Robert är inte uppkopplad
Klarade millennium-buggen
Roberts avatar
 
Reg.datum: Jan 2004
Inlägg: 2 103
Hmmm, ser att det kan vara en spindel vid namn Larbin som tydligen är en open source spindel som enligt dess egen sida kan hämta "över 5.000.000 sidor från en vanlig pc med bra bandbredd"... jojo, om den sitter och försöker tugga i sig min indexsida länge nog så kanske den kommer upp i sådana volymer.

(Larbin är tydligen för utvecklare, så någon har kodat fel någonstans..)
Robert är inte uppkopplad   Svara med citatSvara med citat
Oläst 2005-06-29, 12:51 #3
Marcuss avatar
Marcus Marcus är inte uppkopplad
Supermoderator
 
Reg.datum: Nov 2003
Inlägg: 2 655
Marcus Marcus är inte uppkopplad
Supermoderator
Marcuss avatar
 
Reg.datum: Nov 2003
Inlägg: 2 655
Det svenska insamlandet från KB togs upp här. Verkar inte ha samma namn på spindeln iaf...
__________________
[ Finanstips.se | Riktnummer.se | Väderlek.se | 3W.se | WWWW.se ]
. [ Marbella.se | ValutaGraf.se | Virusprogram.se | Malta Bolag.se | Växlingskontor.se ] .
Marcus är inte uppkopplad   Svara med citatSvara med citat
Oläst 2005-06-29, 15:20 #4
Lindahl Lindahl är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Dec 2004
Inlägg: 854
Lindahl Lindahl är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Dec 2004
Inlägg: 854
Du skriver att den laddat ett tusental sidor även att du bara har en bråkdel av detta. Jag har samma problem, nån form av robot går in och laddar startsidan hundratals gånger, problemet är att den identifierar sig som IE6. Har ingen ip-loggning inlagd, kanske borde börja med det.
Lindahl är inte uppkopplad   Svara med citatSvara med citat
Oläst 2005-06-29, 15:48 #5
grazzy grazzy är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Mar 2004
Inlägg: 3 471
grazzy grazzy är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Mar 2004
Inlägg: 3 471
Jag hade ett rätt jobbigt problem med nån mupp som håller och utvecklar ett korsordsprogram.. han tyckte det var en skitbra ide att spindla nyhetsportalen.se med 5 sidor / sekunden för att hitta nya ord att lägga till i sin orddatabas

Fattar inte varifrån alla keffon får sina dumma ideer från, om han hade frågat snällt hade jag ju kunnat göra en dump åt honom istället bara..
grazzy är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 00:07.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017