Kom ihåg mig?
Home Menu

Menu


Länk spindel?

Ämnesverktyg Visningsalternativ
Oläst 2009-12-09, 08:43 #1
FredrikNass avatar
FredrikNas FredrikNas är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Oct 2006
Inlägg: 1 995
FredrikNas FredrikNas är inte uppkopplad
Bara ett inlägg till!
FredrikNass avatar
 
Reg.datum: Oct 2006
Inlägg: 1 995
Standard Länk spindel?

Ett par frågor:

Hur fungerar No Follow på en spindel?

Om jag skapar en spindel, som har för uppgift att crawla sidor i syfte att få reda på vart länkar går, vilka som är trasiga osv. Kan jag då få en spindel att gå förbi en "no follow" tag?

Samt hur fungerar robots.txt? Eller rättare sagt: Hur är det vanligt att man använder robots.txt? Är det vanligt att sidor blockerar allt förutom dom vitala spindlarna?

Spindeln ska ha som uppgift att crawla igenom ett förutsatt antal sidor, och sedan samla in url:erna för att jämföra hur dessa sidor relaterar till varandra, och i hur många led. D.vs sajt A länkar till Sajt B, medans om vi följer fler länkar på Sajt B så visar det sig att vi efter 2 URL:er kommer tillbaka till Sajt A (tillexempel). Tanken var då att påvissa detta i en liknande struktur som LinkedIN visar vännerrelationer. D.vs 1,2,3 steg. Som då visar genom hur många led man måste gå innan man man har en återkoppling.

Rörigt blev det, men någon kanske förstår?

Jag kan tänka mig att det finns något liknande på marknaden idag, någon seo-nisse borde ju ha skapat det tycker jag?
FredrikNas är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 08:46 #2
StefanBergfeldts avatar
StefanBergfeldt StefanBergfeldt är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Sep 2004
Inlägg: 1 535
StefanBergfeldt StefanBergfeldt är inte uppkopplad
Bara ett inlägg till!
StefanBergfeldts avatar
 
Reg.datum: Sep 2004
Inlägg: 1 535
Din spindel behöver inte alls respektera vare sig no follow eller robots.txt

Det vanliga sättet att använda robots.txt är att hindra att till exempel administratörssidor indexeras.
StefanBergfeldt är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 08:54 #3
FredrikNass avatar
FredrikNas FredrikNas är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Oct 2006
Inlägg: 1 995
FredrikNas FredrikNas är inte uppkopplad
Bara ett inlägg till!
FredrikNass avatar
 
Reg.datum: Oct 2006
Inlägg: 1 995
Tack før snabbt svar Stefan!

MYcket bra nyheter.
FredrikNas är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 09:23 #4
StefanBergfeldts avatar
StefanBergfeldt StefanBergfeldt är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Sep 2004
Inlägg: 1 535
StefanBergfeldt StefanBergfeldt är inte uppkopplad
Bara ett inlägg till!
StefanBergfeldts avatar
 
Reg.datum: Sep 2004
Inlägg: 1 535
Förresten, jag vill reservera mig för felaktigheter i mitt svar om robots.txt

Jag är inte helt 100% säker på att den inte gör något på servern som faktiskt hindrar servern att skicka filer till spindlarna.
Jag TROR dock inte det.
StefanBergfeldt är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 09:39 #5
emilvs avatar
emilv emilv är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Feb 2004
Inlägg: 1 564
emilv emilv är inte uppkopplad
Bara ett inlägg till!
emilvs avatar
 
Reg.datum: Feb 2004
Inlägg: 1 564
robots.txt påverkar normalt inte webbservern. Det är dock kutym att följa robots.txt om du bygger en crawler. Om du väljer att strunta i robots.txt bör du använda en user-agent med en kontaktadress så att sajtägaren kan nå dig.
emilv är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 09:57 #6
FredrikNass avatar
FredrikNas FredrikNas är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Oct 2006
Inlägg: 1 995
FredrikNas FredrikNas är inte uppkopplad
Bara ett inlägg till!
FredrikNass avatar
 
Reg.datum: Oct 2006
Inlägg: 1 995
Emilv, bra råd där, vi kommer sannolikt att följa robots.txt om det är det som är kotym/standard som du säger, vi ønskar inte att provosera, tjänsten ska ju skapa mervärde för våra medlemmar. Tanken är ju att skapa en relationskarta på kundens domäner.
FredrikNas är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 02:44.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017