Kom ihåg mig?
Home Menu

Menu


Ta bort utskriftssidor med ? i url med robots.txt

Ämnesverktyg Visningsalternativ
Oläst 2007-07-18, 00:56 #1
Seattlegrunges avatar
Seattlegrunge Seattlegrunge är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2003
Inlägg: 979
Seattlegrunge Seattlegrunge är inte uppkopplad
Mycket flitig postare
Seattlegrunges avatar
 
Reg.datum: Nov 2003
Inlägg: 979
Har t ex följande url:er indexerade i bl a Google:

hxxp://www.xxxxxxxxxx.se/nyheter/blabla-blabla-bla/index.xml
hxxp://www.xxxxxxxxxx.se/nyheter/blabla-blabla-bla/index.xml?__xsl=/cms-print.xsl
hxxp://www.xxxxxxxxxx.se/nyheter/blabla-blabla-bla/index.xml?start=0

Vill så klart att endast den översta url:en ska vara indexerad. Hur kan jag exkludera de andra två med hjälp av robots.txt?

Kan man skriva som följer?

User-agent: *
Disallow: /*?

eller kanske

User-agent: *
Disallow: /*?*

Man kan väl i så fall kanske även skriva mer specifikt? Som t ex:

User-agent: *
Disallow: /*?__xsl=/cms-print.xsl

Som ni ser i url:erna ovan så är underkatalogen "nyheter".
Men om jag nu skulle ha en uppsättning exakt samma länkar förutom att "nyheter" är utbytt till "arkiv", skulle det då finnas en smidigt sätt att kombinera disallow-funktionen?
Seattlegrunge är inte uppkopplad   Svara med citatSvara med citat
Oläst 2007-07-18, 01:31 #2
kers kers är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 526
kers kers är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Nov 2004
Inlägg: 526
Tyvärr kan du inte använda wildcards i robots.txt. Specialtecknet '*' är inte heller ett tradtionellt wildcard utan betyder 'Alla user-agents som inte definerats ovan'

Du får lägga in noindex i metataggen på utskriftssidorna: http://www.robotstxt.org/wc/meta-user.html
kers är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 08:53.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017