WN

WN (https://www.wn.se/forum/index.php)
-   Serversidans teknologier (https://www.wn.se/forum/forumdisplay.php?f=4)
-   -   Olagligt att "crawla" webbsidor? (https://www.wn.se/forum/showthread.php?t=32777)

grinditwp 2008-10-24 10:37

Hej,
är det olagligt att "crawla" andra hemsidor?
Alltså är det olagligt att scanna av andra sidor med hjälp av tex ett php-script?

Google och många andra sökmotorer gör ju detta dagligen?

Ett exempel.
Jag bygger en hemsida åt en innebandyklubb, och de vill ha in tabellen för deras A-lag på första sidan.
jag gör ett script som går in på innebandy.se och hämtar tabell informationen om laget och sedan publicerar detta på klubbens hemsida. Sedan skriver vi att all tabelldata är hämtat från innebandy.se (innebandyförbundets egna sida) och länkar tillbaka.

Att man kanske inte får göra ett script som "snor" information från andra sidor och publicerar det som sitt egna det kan jag förstå, det faller inom ramarna för upphovsrätt. Men i exemplet ovan så ingår klubben i innebandy.se och klubben bidrar till innebandy.se med sina resultat osv. Genom att klubben hämtar sin aktuella tabell ger de också reklam till innebandy.se. Ser inte problematiken.
Det hade inte varit olagligt att skriva ner tabellen själv.


Några som kan upplysa mig lite mer?

vidir 2008-10-24 10:50

fråga innebandy.se om lov först, dvs om du inte har redan gjort det?

grinditwp 2008-10-24 11:05

Citat:

Originally posted by vidir@Oct 24 2008, 10:50
fråga innebandy.se om lov först, dvs om du inte har redan gjort det?


Ok. Men vet du om du det olagligt eller ej? I övrigt alltså.

Magnus_A 2008-10-24 11:15

Frågan är nog fel ställd. Det du är intresserad av är om du kan återpublicera material som du hittat på internet.
Då kommer vi in på frågor om upphovsrätt, katalogskydd och liknande som behandlats tidigare många gånger här på WN.
En viktig parameter är vad det är för data som du avser att publicera. Omfattas data av upphovsrätt, eller kanske katalogskydd? Om materialet är skyddat, kan upphovsmannen tänka sig återpublicering och i så fall på vilka villkor? Om du håller på med nyhetsförmedling, kan du i vissa fall få citera enstaka delar även av skyddat material.

En ligatabell kan mycket väl hamna under upphovsrätt alternativt katalogskydd, medan ett enskilt matchresultat kan hamna under skyddsgränsen.

Det enklaste är väl att du frågar förbundet i fråga.

grinditwp 2008-10-24 11:24

Citat:

Originally posted by Magnus_A@Oct 24 2008, 11:15
Frågan är nog fel ställd. Det du är intresserad av är om du kan återpublicera material som du hittat på internet.
Då kommer vi in på frågor om upphovsrätt, katalogskydd och liknande som behandlats tidigare många gånger här på WN.
En viktig parameter är vad det är för data som du avser att publicera. Omfattas data av upphovsrätt, eller kanske katalogskydd? Om materialet är skyddat, kan upphovsmannen tänka sig återpublicering och i så fall på vilka villkor? Om du håller på med nyhetsförmedling, kan du i vissa fall få citera enstaka delar även av skyddat material.
En ligatabell kan mycket väl hamna under upphovsrätt alternativt katalogskydd, medan ett enskilt matchresultat kan hamna under skyddsgränsen.
Det enklaste är väl att du frågar förbundet i fråga.

Ok tack.
Men om vi bortser från att återpublicera material, jag är ganska insatt i upphovsrätten och bara fokuserar på själva "crawlandet", alltså "scannadet", med t.ex. file_get_contents i php. Är detta olagligt?

vidir 2008-10-24 11:42

En sak är klar, det är fullt tilllåtet att skriva om vad andra hemsidor skriver om, dvs att nämna resultat mm utan att plagiera av uphovstexten i exakt ordning men det är även lagligt att scanna av andras sajter om man får tillåtelse... :-)

Magnus_A 2008-10-24 13:11

Citat:

Originally posted by grinditwp@Oct 24 2008, 11:24


Ok tack.
Men om vi bortser från att återpublicera material, jag är ganska insatt i upphovsrätten och bara fokuserar på själva "crawlandet", alltså "scannadet", med t.ex. file_get_contents i php. Är detta olagligt?

Det saknas bra rättsfall ännu. Frågan har varit uppe och då handlade det om huruvida det var lagligt att ignorera robots.txt och hämta information med robot.

Allmänt sett tror jag inte att det kan ses som dataintrång eftersom tabellen är publicerad öppet på sidan.

Däremot skulle det kunna vara ett brott mot den nya uphovsrättslagen, eftersom du laddar ner, innehar och kopierar upphovsrättsskyddat material som du inte har tillstånd till. (Att det skapas temporära kopior i en webbläsarcache är inget argument, dessa kopior är temporära och används endast till att underlätta visning av materialet under surfning. Det här handlar om kopior avsedda att stå för sig själva och visas i andra sammanhang.)

Om materialet inte är upphovsrättsskyddat så ser jag inga hinder.

grinditwp 2008-10-24 14:30

Tack låter förnuftigt!

Anders Larsson 2008-10-25 11:47

Troligen är själva scannandet inte olagligt, däremot är en publicering av materialet förmodligen brott mot katalogskyddet. Men det hänger lite på hur scannandet utförs också.

Sitter ni och bevakar förändringar 1 gång per sekund, så att ni orsakar skada på deras tjänst, så blir det givetvis mer känsligt än om ni hämtar det 1 gång om dagen.

I just det här fallet är det ju solklart, fråga innebandy.se, det är ju tom troligt att de har informationen i ett lämpligare format (xml, kommasep etc).

grinditwp 2008-10-29 13:59

Citat:

Ursprungligen postat av Anders Larsson
I just det här fallet är det ju solklart, fråga innebandy.se, det är ju tom troligt att de har informationen i ett lämpligare format (xml, kommasep etc).


Det har dem inte, jag har dock tipsat dem om att det skulle kunna vara bra :)

Citat:

Ursprungligen postat av Anders Larsson
Troligen är själva scannandet inte olagligt, däremot är en publicering av materialet förmodligen brott mot katalogskyddet. Men det hänger lite på hur scannandet utförs också.

Vad jag gör är att hämta in lagens namn samt aktuell poäng. Jag kopierar alltså inte änns hela tabellen, så som antalet matcher, borta/hemma, målskilnad osv. Utan enbart lagens namn samt aktuell poäng och med den informationen jag hämtar bygger jag upp en egen tabell, som alltså skiljer sig från deras. Och enbart för ett lag, jag kopierar inte alla serier osv. Utan detta är ju för den enskilda klubbens intresse.

Det är inte olagligt om jag hade skrivit ihop listan själv utifrån informationen jag fått från sidan. Det enda vi gör här är att göra processen automatiserad. Eller?


Alla tider är GMT +2. Klockan är nu 03:47.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson