WN

WN (https://www.wn.se/forum/index.php)
-   Serversidans teknologier (https://www.wn.se/forum/forumdisplay.php?f=4)
-   -   .htaccess deny domain (https://www.wn.se/forum/showthread.php?t=18134)

Seattlegrunge 2006-12-16 02:47

Har en sajt som innehåller massor av bilder. Nu idag har sajten under tre tillfällen idag fått besök av spider9.picsearch.com (identifierar sig som vanlig besökare, inte som en sökrobot) som är nån sorts spindel som letar bilder för picsearch.com. Detta är jag inte direkt intresserad av att de gör, bilderna på sajten ska vara till beskådan på sajten, ingen annanstans där man inte kan referera dem till varumärket.

Nu skrev jag följande i .htaccess, blir det rätt? Nu bör jag väl slippa få den att besöka sajten? Lär ju se det i statistiken så småningom...

Kod:

order allow,deny
deny from .picsearch.com
allow from all


citrusen 2006-12-21 01:56

Kod:

RewriteEngine on
# Options +FollowSymlinks
RewriteCond %{HTTP_REFERER} badsite\.com [NC]
RewriteRule .* - [F]

Detta skall fungera med domän. Någon som har några synpunkter?

edit: code taggar

Seattlegrunge 2006-12-21 02:20

Om jag förstår dig rätt så snackar vi inte samma problem och lösning :)

pitbull 2006-12-21 02:28

Det är helt rätt såvitt jag kan se Seattlegrunge, men du uppnår samma effekt genom robots.txt (För du har väl en sådan i roten?)

/S

Seattlegrunge 2006-12-21 02:34

Tack Pitbull... jodå, robots.txt finns, men eftersom denna spindel identifierade sig som vanlig besökare i AwStats och inte som någon spindel/robot/crawler så trodde jag att robots.txt inte skulle påverka just denna (spiderX.picsearch.com där X står för en siffra, för nu har en massa spindlar från dem förstökt nå sajten, till sist en massa pluto.picsearch.com osv med andra namn alltså)... men jag kanske har fel?

pitbull 2006-12-21 02:56

Disallow: /dittbildmappsnamn/

i robots.txt kan nog vara någonting för dig, då slipper du att sökmotorrobotarna gräver runt ibland dina bilder oavsett vilken namn de har eller antar.

Jag är ganska färsk på .htaccess och robots.txt och har aldrig haft samma problem själv. Kanske finns det någon annan som vet tvärsäkert?

Seattlegrunge 2006-12-21 02:57

Ah... Kjette, tjusigt! Den kan vara något att använda... thx

Pitbull: Den kan man också köra med ja... schysst! Men grejen är den att frågan är om robots.txt används om spindeln utger sig för att vara vanlig besökare... och dessutom skulle man väl kunna bygga en spindel som så att den skiter i att kolla robots.txt?

pitbull 2006-12-21 03:06

Ok, I see. Men då klarar du dig nog bra med din ursprungliga lösning:

Citat:

order allow,deny
deny from .picsearch.com
allow from all

Den spärrar allt från huvuddomänen picsearch.com oavsett vilket (sub)-namn som den använder.

Seattlegrunge 2006-12-21 03:14

Japp, just i det här fallet var jag ute efter det.
Men dina och Kjettes andra lösningar är guld värda... ska pilla lite med dem med!

Tack så här mitt i natten :)


Alla tider är GMT +2. Klockan är nu 05:23.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson