WN

WN (https://www.wn.se/forum/index.php)
-   Allmänt (https://www.wn.se/forum/forumdisplay.php?f=2)
-   -   Är web-scraping lagligt? (https://www.wn.se/forum/showthread.php?t=1041320)

linusoleander 2010-04-05 14:17

Är web-scraping lagligt?
 
Äger i dag siten radiofy.se där jag plockar spellistor direkt från respektive radiokanals siter, vilket är helt okej. Jag har fått OK från alla radiobolag.

När Spotify råkade (det var inte alls meningen att den skulle läcka ut så snabbt) hitta siten den 12:e Jan så fick jag dagen där på två samtal från företagen jag plockar spellistor i från. Båda ägarna var lite irriterade över att jag hade "snott" data från dem. Men eftersom jag inte tjänade pengar på siten och för att dom gillade idéen så lät dom den vara. Meningen var givetvis att jag skulle fråga om lov, men jag han inte riktigt de eftersom Spotify twittrade om projektet...

Jag var i detta fallet alltså tungen att få godkänt av företaget för att läsa deras siter.

Det finns ett företag som jag inte minns namnet på som gör exakt samma sak som mig, fast dom läser av radiokanalerna över FM-bandet och jämför sedan informationen med någon refferensdabas. Detta företag säljer sedan vidare inforamtionen till tredjepart, vilket radiobolagen inte gillar, men dom har inte så mycket val. Min fråga är nu varför?

Vad är skillnaden mellan att läsa av internet, genom en koppar/fiber-kabel gentemot att läsa av FM-bandet? Varför skulle det ena vara okej och inte de andra?

KristianE 2010-04-05 14:40

Därför att luften är helt fri att avlyssna.

Dock vet jag inte hur OK det är att vidarebefodra det man hör?

Fredrik-s 2010-04-05 15:20

Jag tror inte det ska vara någon fara. Tror inte ens du behöver fråga om lov.

Det var ju en dom som föll får 1-1,5 år sedan gällande allaannonser.se som plockar information från massa annonssidor och sedan publicerar på deras sida, från b la Blocket och Tradera.

Vad jag läste mig till fick allaannonser.se rätt mot Blocket i domstol. Och det var det första fallet så det borde blivit lite av en vägledning (vad det nu kallas) för kommande domar.

Magnus_A 2010-04-05 16:00

Citat:

Ursprungligen postat av Fredrik-s (Inlägg 20349706)
Jag tror inte det ska vara någon fara. Tror inte ens du behöver fråga om lov.

Det var ju en dom som föll får 1-1,5 år sedan gällande allaannonser.se som plockar information från massa annonssidor och sedan publicerar på deras sida, från b la Blocket och Tradera.

Vad jag läste mig till fick allaannonser.se rätt mot Blocket i domstol. Och det var det första fallet så det borde blivit lite av en vägledning (vad det nu kallas) för kommande domar.

Fel, Blocket och Allaannonser gjorde upp i godo.
http://internetworld.idg.se/2.1006/1.54385

Fredrik-s 2010-04-05 17:35

Citat:

Ursprungligen postat av Magnus_A (Inlägg 20349712)
Fel, Blocket och Allaannonser gjorde upp i godo.
http://internetworld.idg.se/2.1006/1.54385

Jaha så var det. Då är mitt påstående fel.

Wackerberg 2010-04-05 18:23

Det framgår en viss skillnad som gör att det är mer ok att läsa av FM-bandet än att läsa direkt från webben.

Jag kan inte säga ifall det du gör är lagligt eller inte, men jag kan kanske peka dig i rätt riktning. Det finns / fanns något som kallas katalogskydd i Sverige vilket hade viss inverkan på hur man fick kopiera data från andra. Eftersom katalogskyddet varierade mellan länder (även inom Norden) kom EU in med ett nytt direktiv, "databasdirektivet". Huruvida det är implementerat i Sverige vet jag ej.

Du kan läsa mer om databasdirektivet: http://en.wikipedia.org/wiki/Database_Directive. skydd

Om katalogskyddet går följande att läsa på wikipedia:

"
Katalogskydd
I 49 § stadgas följande (i dess formulering som har gällt från och med 1995). [24]
Den som har framställt en katalog, en tabell eller ett annat dylikt arbete i vilket ett stort antal uppgifter har sammanställts eller vilket är resultatet av en väsentlig investering har uteslutande rätt att framställa exemplar av arbetet och göra det tillgängligt för allmänheten.
Rätten enligt första stycket gäller till dess femton år har förflutit efter det år då arbetet framställdes. Om arbetet har gjorts tillgängligt för allmänheten inom femton år från framställningen, gäller dock rätten till dess femton år har förflutit efter det år då arbetet först gjordes tillgängligt för allmänheten. [...]
Avtalsvillkor som utvidgar framställarens rätt enligt första stycket till ett offentliggjort arbete är ogiltiga.
Genom katalogskyddet kan alltså ett arbete, som saknar upphovsrättsligt skydd (då det inte når verkshöjd), ändå vara skyddat." http://sv.wikipedia.org/wiki/Upphovsr%C3%A4tt_i_Sverige

Alternativt söker du upp en jurist som är duktig på immaterialrätt =)

Det tråkiga med många fall som berör immaterialrätt, som t.ex. blocket vs. allaannonser, är att de nästan alltid görs upp i godo ='(

jonny 2010-04-05 18:35

Min högst personliga åsikt som lekman är att det borde vara helt ok att göra det du gör.

linusoleander 2010-04-05 19:35

Citat:

Ursprungligen postat av KristianE (Inlägg 20349697)
Därför att luften är helt fri att avlyssna.

Dock vet jag inte hur OK det är att vidarebefodra det man hör?

Håller de argumentet verkligen?
Är inte ljuset fritt? Jag menar, ja kör ju fiber.
Eller strömmen, för det är ju trots allt bara en spänning i kopparkablarna.

Jag ser ingen skillnad mellan FM och Internet....

Det är ju även så att jag inte sparar ner informationen från radiokanalerna.
Jag jämför endast informationen mot Spotify, och sedan slänger jag iväg informationen.

Någon som vet vem det är som har hand om sådant här, alltså en jurist.
Gärna någon som är gratis... :)

Magnus_A 2010-04-05 20:50

Scraping är sällan fel eller förbjudet, det som kan bli problem är att man publicerar den info man skrapar.

Conny Westh 2010-04-05 21:19

Citat:

Ursprungligen postat av linusoleander (Inlägg 20349693)
Äger i dag siten radiofy.se där jag plockar spellistor direkt från respektive radiokanals siter, vilket är helt okej. Jag har fått OK från alla radiobolag.

När Spotify råkade (det var inte alls meningen att den skulle läcka ut så snabbt) hitta siten den 12:e Jan så fick jag dagen där på två samtal från företagen jag plockar spellistor i från. Båda ägarna var lite irriterade över att jag hade "snott" data från dem. Men eftersom jag inte tjänade pengar på siten och för att dom gillade idéen så lät dom den vara. Meningen var givetvis att jag skulle fråga om lov, men jag han inte riktigt de eftersom Spotify twittrade om projektet...

Jag var i detta fallet alltså tungen att få godkänt av företaget för att läsa deras siter.

Det finns ett företag som jag inte minns namnet på som gör exakt samma sak som mig, fast dom läser av radiokanalerna över FM-bandet och jämför sedan informationen med någon refferensdabas. Detta företag säljer sedan vidare inforamtionen till tredjepart, vilket radiobolagen inte gillar, men dom har inte så mycket val. Min fråga är nu varför?

Vad är skillnaden mellan att läsa av internet, genom en koppar/fiber-kabel gentemot att läsa av FM-bandet? Varför skulle det ena vara okej och inte de andra?

Se till att få SKRIFTLIGT tillstånd att använda topplistorna på din webbplats i första hand.

I andra hand kan du väl förhandla om att de får en viss procentsats av de intäkter du får om du får vidaresälja topplistorna?

Se till att du får skriftligt avtal bara, det är det som är det viktiga så de inte kan ta tillbakls sitt tillstånd hur som helst.

Sätt dig in i verksamhetsområdet ordenligt så att du vet hur andra brukar göra och avtalen ser ut innan du börjar förhandla.

http://en.wikipedia.org/wiki/Swedish...ry_Association

http://www.hitlistan.se/
http://www.grammotex.com/
http://en.wikipedia.org/wiki/Sverigetopplistan

linusoleander 2010-04-06 00:55

Citat:

Ursprungligen postat av ConnyWesth (Inlägg 20349751)
Se till att få SKRIFTLIGT tillstånd att använda topplistorna på din webbplats i första hand.

I andra hand kan du väl förhandla om att de får en viss procentsats av de intäkter du får om du får vidaresälja topplistorna?

Se till att du får skriftligt avtal bara, det är det som är det viktiga så de inte kan ta tillbakls sitt tillstånd hur som helst.

Sätt dig in i verksamhetsområdet ordenligt så att du vet hur andra brukar göra och avtalen ser ut innan du börjar förhandla.

http://en.wikipedia.org/wiki/Swedish...ry_Association

http://www.hitlistan.se/
http://www.grammotex.com/
http://en.wikipedia.org/wiki/Sverigetopplistan

Jag hämtar inga topplistor från dem, utan deras spellistor, alltså låtar som spelas just nu. Ska läsa på lite inom ämnet.

Jag vet inte riktigt vad sådan här data brukar kosta, om man skulle betala för den. Men en realistisk summa på kanske 10k i månaden har jag inte råd att betala. Jag förstår att radiobolagen inte vill slänga ut som data från höger och till vänster, speciellt inte om dom inte själva tjänar pengar på de.

Så att få en skriftlig OK från alla radiobolag kan jag bara drömma om. När det väl kommer till kritan så vill alla ha betalt.

Citat:

Ursprungligen postat av Magnus_A (Inlägg 20349745)
Scraping är sällan fel eller förbjudet, det som kan bli problem är att man publicerar den info man skrapar.

Vad räknas som data från radiokanalerna siter i mitt fall?
För idag så hämtar jag data från te.x NRJ, jämför informationen med Spotify och lägger i sin tur upp informationen från Spotify. Spotify har ett eget licensavtal för detta, som säger att jag får göra vad jag vill. (ungefär :))

Så frågan är, publicerar jag radiokanalernas data, eller Spotifys?

kw_wasabi 2010-04-06 03:54

Skulle det göra någon skillnad om man gjorde det manuellt? Anställde 10 pers som lyssnade på varsin radiosation och manuellt skrev in låttitel m.m. på en sajt. Jag vet att det är ett fruktansvärt kostsamt exempel, men det är själva automatiseringen jag vill komma till. Jag har för mig att jag läst eller hört något om det tidigare.

Wackerberg 2010-04-06 07:03

Varför tar du dig inte tid att läsa på katalogskyddet??

Tror du får ett ganska bra svar. Det som uppkommer är då frågor som om spellistan kan anses uppfylla vissa krav vilket du kommer behöva en jurist för att diskutera.

Skillnaden mellan att lyssna av "luften" och skapa en spellista är att du gör en sammanställning vilken kan åtnjuta upphovsrättsligt skydd. Låttitlarna i sig är troligtvis att anse som fakta. Nu är det istället så att radiobolagen gör sammanställningen vilken kan erhålla upphovsrättsligt skydd. Frågan i ditt fall är ifall man kan anse att en sådan relativt simpel sammanställning av fakta kan erhålla skydd.

toxicstone 2010-04-06 07:28

Citat:

Ursprungligen postat av Wackerberg (Inlägg 20349786)
Varför tar du dig inte tid att läsa på katalogskyddet??

Tror du får ett ganska bra svar. Det som uppkommer är då frågor som om spellistan kan anses uppfylla vissa krav vilket du kommer behöva en jurist för att diskutera.

Skillnaden mellan att lyssna av "luften" och skapa en spellista är att du gör en sammanställning vilken kan åtnjuta upphovsrättsligt skydd. Låttitlarna i sig är troligtvis att anse som fakta. Nu är det istället så att radiobolagen gör sammanställningen vilken kan erhålla upphovsrättsligt skydd. Frågan i ditt fall är ifall man kan anse att en sådan relativt simpel sammanställning av fakta kan erhålla skydd.

Tror han blir mer förvirrad av ditt prat Wackerberg :p

Det Wackerberg försöker säga är att du ska googla, finns säkerligen någon som kan svara på dina frågor på något forum för jurister osv.

Glöm bara inte för guds skull om du börjar tjäna pengar t ex 1000kr/mån, hör då av dig till alla som du plockar ifrån och skriv ett massmail angående uppdelning av te x 23 externa så räknar du 24 personer med dig själv.
Troligtvis kommer 23 iallafall att säga det är lungt ta du pengarna, se bara till att inte råka skriva 1 eller 2 nollor för mycket:D

linusoleander 2010-04-06 11:43

Citat:

Ursprungligen postat av Wackerberg (Inlägg 20349786)
[...]Skillnaden mellan att lyssna av "luften" och skapa en spellista är att du gör en sammanställning vilken kan åtnjuta upphovsrättsligt skydd. [...]

Skillnaden mellan vadå och vadå?
Det är ju exakt det de andra företaget gör, dom läser av luften och gör en sammanställning av informationen. Jag läser av internet och gör en sammanställning. Vi gör med andra ord exakt samma sak med vår data, enda skillnaden är att mediet skickat m.h.a två olika tekniker.

Wackerberg 2010-04-06 14:14

Jag uppfattade det som om du tog låtlistan från radioföretaget. D.v.s. att låtlistan presenteras av radioföretaget och att du scrappar den med jämna mellanrum.

För det är väl inte så att du sitter och lyssnar på varje låt och tar reda på namnet? (Alt. har ett program som sitter och lyssnar på varje låt och avgör vad det är för låt)

Om du tar ett låtnamn i taget tror jag inte du ska oroa dig. Vad de spelar är fakta och kan inte skyddas av upphovsrätten. Om man nu inte påstar att sammanställningen av låtar som sig, till en kompilation, är ett verk.

linusoleander 2010-04-06 15:07

Citat:

Ursprungligen postat av Wackerberg (Inlägg 20349864)
Jag uppfattade det som om du tog låtlistan från radioföretaget. D.v.s. att låtlistan presenteras av radioföretaget och att du scrappar den med jämna mellanrum.

För det är väl inte så att du sitter och lyssnar på varje låt och tar reda på namnet? (Alt. har ett program som sitter och lyssnar på varje låt och avgör vad det är för låt)

Om du tar ett låtnamn i taget tror jag inte du ska oroa dig. Vad de spelar är fakta och kan inte skyddas av upphovsrätten. Om man nu inte påstar att sammanställningen av låtar som sig, till en kompilation, är ett verk.

Jag har automatiserade skript som en gång i minuten läser av alla siter.
Jag läser med andra ord inte i någon komplett lista, utan läser bara in nuvarande låt.

linusoleander 2010-04-06 15:16

Ringde precis juristjouren på 0771 333 444 och frågade hur det hela låg till.

Enligt damen jag pratade med så får jag läsa av datan från radiokanalerna, men jag får inte publicera den, vilket jag inte gör. Jag jämför endast upphittad data med Spotify, det är allt. Vilket enligt dom är helt okej.

Någon som kan bekräfta detta?

ric 2010-04-06 20:26

Citat:

Ursprungligen postat av linusoleander (Inlägg 20349879)
Ringde precis juristjouren på 0771 333 444 och frågade hur det hela låg till.

Enligt damen jag pratade med så får jag läsa av datan från radiokanalerna, men jag får inte publicera den, vilket jag inte gör. Jag jämför endast upphittad data med Spotify, det är allt. Vilket enligt dom är helt okej.

Någon som kan bekräfta detta?

Vad är det för data du får från radiokanalerna och vad är skillnaden på det du senare publicerar?

linusoleander 2010-04-06 20:49

Citat:

Ursprungligen postat av ric (Inlägg 20349921)
Vad är det för data du får från radiokanalerna och vad är skillnaden på det du senare publicerar?

Datan jag hämtar från radiokanalerna är aktuell låt.
Te.x "Lady Gaga - Bad Romance"
Denna information jämför jag sedan med Spotify, som jag i sin tur visar på siten. Jag använder alltså bara strängen från radiokanalerna för att jämföra data med Spotify.

http://ws.spotify.com/search/1/track...ga+bad+romance

coredev 2010-04-06 21:25

Jag skulle nog skriva och fråga radiokanalerna om det är ok för dem att du ger dem lite gratis-reklam på din hemsida i utbyte mot att du får spindla deras "spelas just nu". :) Vem tackar nej till lite seriös gratisreklam?

linusoleander 2010-04-06 23:26

Citat:

Ursprungligen postat av coredev (Inlägg 20349925)
Jag skulle nog skriva och fråga radiokanalerna om det är ok för dem att du ger dem lite gratis-reklam på din hemsida i utbyte mot att du får spindla deras "spelas just nu". :) Vem tackar nej till lite seriös gratisreklam?

Radiokanalerna har som sagt givit mig OK, så det behöver jag inte bekymra mig över.

Reklam tar jag ett stort avstånd från (möjligt att jag får äta upp de senare). Alla intäkter på siten måste i något fall gynna användaren, te.x genom beta-funktioner, reklam gör det inte.

Sedan så tror jag inte att kanalerna tjänar så mycket på eventuell reklam från min site, då siten inte är tillräckligt stor.
Jag har idag förvisso direktlänkar till varje radiokanal, vilket jag tycker borde räcka.

sbgm 2010-04-11 13:47

Är det lagligt att använda sig av web-scraping inom backend, dvs ta webbplats info i ett script och aldrig publicera informationen?

Westman 2010-04-11 15:31

Citat:

Ursprungligen postat av sbgm (Inlägg 20350722)
Är det lagligt att använda sig av web-scraping inom backend, dvs ta webbplats info i ett script och aldrig publicera informationen?

Tja, om du inte heller säljer den så blir det svårt för upphovsrättsinnehavaren att göra något.

patrikweb 2010-04-11 15:47

Finns ju olika sätt att komma förbi vissa lagar genom att använda flera lagar emot varandra för komma ifrån alla.

Exempelvis kan du ju låta en bekant hämta alla data från alla sidor du vill genom ett oskyddat wlan. Som du själv sedan lyssnar av trafiken.

Då har du fått läsa av all data helt lagligt.

Men stora frågan är om ens en låttitel kan uppfylla ett katalogskydd, kanske om det är en komplett lista men inte en lista med enstaka låtar.

Linuus 2010-04-16 12:56

Tjena!

Lånar denna tråden lite då jag har en fråga som är liknande denna.

Säg att man plockar artiklar från RSS feeds från någon nyhets-site, publicerar en kortare version på sin egen sida och därefter en direktlänk till denna artikel där användaren får klicka för att läsa hela artikeln.

Är detta OK? Måste man fråga om lov först? Vet ju att det finns siter som pysslar med detta idag men är det bara för att ingen egentligen bryr sig? Det gynnar ju faktiskt den site man plockar infon från. Och om man dessutom inte publicerar _hela_ artikeln så borde det ju vara ännu mer OK.

Någon som vet?

gfors 2010-04-16 16:15

Citat:

Ursprungligen postat av Linuus (Inlägg 20351483)
Tjena!

Lånar denna tråden lite då jag har en fråga som är liknande denna.

Säg att man plockar artiklar från RSS feeds från någon nyhets-site, publicerar en kortare version på sin egen sida och därefter en direktlänk till denna artikel där användaren får klicka för att läsa hela artikeln.

Är detta OK? Måste man fråga om lov först? Vet ju att det finns siter som pysslar med detta idag men är det bara för att ingen egentligen bryr sig? Det gynnar ju faktiskt den site man plockar infon från. Och om man dessutom inte publicerar _hela_ artikeln så borde det ju vara ännu mer OK.

Någon som vet?

Driver http://newly.se som är precis det du beskriver. Hämtar RSS flöden från andra sajter, och publicerar länkar tillbaka till ursprungssajterna tillsammans med den korta beskrivningen från RSS-artiklarna (ej innehållet i artiklarna).

Alla jag pratat med av "källorna" (vissa behagar inte svara, detta har jag tagit som "tyst accept" ;-)) ser det precis som du säger, att det gynnar dom mer än någon annan och har varit positiva eller likgiltiga inför det.

Det finns ganska många sidor som gör just detta, både Europeiska och Amerikanska, och jag har inte hört om några problem. Det är ju trots allt inte olagligt att skriva ett blogginlägg där man exempelvis länkar till en artikel på Aftonbladet och citerar dom 3 rader ur artikeln. Detta är i princip exakt samma sak, en länk med ett kort utdrag/citat.

Så länge man är duktig på att ge cred till källorna och vara tydlig med var artiklarna lever och härstammar ifrån så är det nog helt ok, ibland t.o.m. uppskattat!

Det man får akta sig för är att publicera hela artiklar rakt av, att inte skriva källor, att publicera bilder, att lägga på egna ramar eller iframes (ej olagligt men lär irritera källorna). Det bör vara helt tydligt för besökarna vem som "äger" artikeln, upplever besökaren att det är en artikel från din site så är du nog ute på väldigt tunn is.

http://newly.se blir ju faktiskt en källa för trafik till alla som finns med där, så länge man inte trampar på tår eller är rent av fräck så är det nog ok.

Tobab 2010-04-16 19:40

Oftast är det nog OK, men Sveriges Radio skriver uttrycklingen att det inte är tillåtet:

"Materialet som tillhandahålls via RSS är enbart för personligt och icke-kommersiellt bruk."


Alla tider är GMT +2. Klockan är nu 12:29.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson