WN

WN (https://www.wn.se/forum/index.php)
-   Företagsamhet, juridik och ekonomi (https://www.wn.se/forum/forumdisplay.php?f=8)
-   -   Screen scraping (https://www.wn.se/forum/showthread.php?t=16254)

princip 2006-09-15 14:30

Jag har för mig att jag läst ett inlägg om screen scraping här för länge sen, men kan inte hitta det nu(?)

Vilka regler gäller för att hämta information på det sätt som används till tv-tablåer, sista-minuten resor etc. Är det tillstånd från "leverantören" som gäller, eller plockas det bara ner?

Jag är intresserad av att hämta ner en del text från ett par sidor en gång per dygn, egentligen mest för egen räkning men jag kommer att lägga det på en webbsida som även andra kan hitta till... Finns det några färdiga script i ASP/PHP, eller blir det till att skriva något själv?

/P

Westman 2006-09-15 19:46

Upphovsrättsbrott kallas det nog för i 99,9% av fallen.

Hofvet 2006-09-15 23:49

Om det är upphovsrättsbrott eller inte beror på om det du kopierar betraktas uppnå verkshöjd.

Så får du ju citera utan att det är upphovsrättsbrott. Du måste nog beskriva mer noggrannt vad du vill kopiera för att få ett bra svar.

Tv-tablåer och sista miuntern resor tror jag är helt lugnt att kopiera utan tillstånd.

Thomas 2006-09-16 00:12

Citat:

Originally posted by Hofvet@Sep 15 2006, 23:49
TV-tablåer och sista miuntern resor tror jag är helt lugnt att kopiera utan tillstånd.
För privat bruk bör tilläggas. En tv-tablå likt en sammanställning av sistaminutenresor är katalogskyddade som allt annat någon annan lagt tid på att skapa.

Hofvet 2006-09-16 01:42

Citat:

Ursprungligen postat av Thomas
Citat:

Ursprungligen postat av Hofvet
TV-tablåer och sista miuntern resor tror jag är helt lugnt att kopiera utan tillstånd.

För privat bruk bör tilläggas. En tv-tablå likt en sammanställning av sistaminutenresor är katalogskyddade som allt annat någon annan lagt tid på att skapa.

Fick inte allaannonser.se grönt ljus för att visa bla blocket.se's annonser på sin sida? Vad är skillnaden rent juridiskt mellan att kopiera sista minuten resor mot att kopiera annonser från webben?

Vill bara tillägga att frågan inte är det minsta retorisk.

grazzy 2006-09-16 01:48

Jag har pratat en del med allaannonser .. och jag tror i slutändan att de vann eftersom blocket insåg att de inte skulle kunna vinna mot allaannonser hur de än gjorde. Jag vet att de i princip hade en färdig lösning som skulle använda proxies för att hämta blockets data om de började blocka allaannonsers ipn. Blocket samarbetar väl numera med dem istället..

Med sistaminuten-resor är det ju lite annan historia eftersom där tjänar resebolagen aktivt på att man gör det (jag scrapar själv resor på tex badresor.se).

Däremot om ni skulle kopiera från badresor.se skulle jag bli upprörd eftersom jag lagt mycket tid och jobb på att sammanställa den datan med hjälp av kod. Att kopiera från leverantörerna däremot är ok om man gör det med sans och reson enligt dem jag har pratat med (några av dem har ringt upp mig). De är väl rätt glada om man skickar besökare till dem.

princip 2006-09-16 11:54

Tackar för svaren.

Grazzy m.fl som hämtar data, ni har alltså inte generellt tagit kontakt med "leverantören" innan?

Det låter också som att de flesta skriver sina script själva? Vilken teknik använder ni?

jonny 2006-09-16 12:18

Jag har mycket svårt att förstå varför tablåinformationen inte är gratis från respektive tvbolag. Det ligger ju ändå i deras intresse att få gratisreklam för vad de visar. Nu är det inte så, men det är underligt.

WizKid 2006-09-16 13:59

Anledningen att tablåinformation inte är gratis är väl att tvbolagen märkt att de kan ta betalt för informationen.

Johan H 2006-09-16 15:46

Som jag förstår det då det gäller screen scraping så kan du göra det på exakt vad som helst så länge du skickar vidare besökaren till rätta aktören.

T.ex. allaannonser tar annonser ifrån blocket men om man sen klickar på deras annonser på allaannonser.se så kommer man till blocket.se

Samma sak blir då med tablåerna, klickar man t.ex. på Scrubs så kommer man till tv3s hemsida, det är exakt samma sak.

Gäller även på resorna!

grazzy 2006-09-16 16:05

princip, nej.. :P

Folk fattar inte vad det är man håller på med, eller så är jag dålig på att förklara. Om det nu vore så att nån leverantör ville ut så tar jag bort dem i efterhand istället.

Som Johan säger så är de flesta nöjda så länge man skickar besökare till "rätt" ställe, däremot så vet jag att allaannonser.se hade en obligatorisk mellansida för _alla_ besökare där de ett tag visade en hel del reklam. Det var inte så poppis. Nu vet jag inte om den finns kvar eller inte, men sånna hyss skall man nog akta sig för.

Thomas 2006-09-16 16:39

Citat:

Originally posted by jonny@Sep 16 2006, 12:18
Jag har mycket svårt att förstå varför tablåinformationen inte är gratis från respektive tvbolag.
Dom har presstjänst, den är gratis.

Om vi skall gå tillbaks till topic och sluta gissa så är det katalogskydd på sammanställda verk. Finns inga undantag, period! Vill man vara säker på att man inte gör något olagligt bör man kontakta upphovsmannen och be om tillåtelse. I de fall där upphovsmannen vinner pengar/besökare på att bli länkad till får man säkert ett ja. Även om det är idiotiskt och kortsiktigt. Är man upphovsman till information som en stor mängd människor vill ta del av, varför inte endast vara enda källan? I Blockets fall var ju besökarna villiga att kämpa för att hitta info'n. Att folk vänjer sig att informationen finns hos någon annan är i mina ögon kortsiktigt.

Blocket har gjort bort sig anser jag, självklart skall dom kunna lösa så inte allaannonser kan få tag på informationen!

grazzy 2006-09-16 17:19

Nu är jag ute och snurrar på OT, men det Thomas pratar om är samma princip som RIAA och MPAA använder som argument. Dvs att finns det ett värde i nånting så skall upphovsmannen ha betalt för det - enligt denna metoden vill de ta betalt för att man skall betala per visning av ett media, per nedladdning, per antal som tittar, per bränd kopia på cd etc.

Det Thomas säger är i princip samma sak och i fallet med blocket anser jag det vara totalt felaktigt eftersom blocket i princip gör INGENTING. Det enda blocket tillför är deras kritiska massa av besökare, det är besökaren som skriver annonsen, det är besökarna som läser dem. Om man frågade varje besökare på blocket om vad de tyckte så är väl svaret självklart att de vill att så många som möjligt ser deras annons.

Sen har vi det tekniska problemet, oavsett hur mycket blocket stretar emot så kan de i princip aldrig hindra allaannonser från att indexera dem / gömma sig bakom falska företag på konstiga öar etc. Vill man så går det, det blocket gjorde var nog smart eftersom allaannonser knappast bara hade lagt sig på ryggen och gett upp.

Jag förespråkar inte att man skall scrapa sidor mot deras vilja (det är inte något som jag gör och jag scrapar rätt mycket :P) och inte heller att man skall bryta några regler, men det här är väldigt obruten mark och det finns inga vettiga domslut som klart och tydligt säger vad som är rätt och riktigt. Jämför med google, yahoo och msn - de scrapar och indexerar _ALLAS_ sidor med optout som enda alternativ att slippa, de frågar ingen. Se tex www.tv.nu/+site:tv.nu&hl=sv&gl=se&ct=clnk&cd=1&client=firefo x-a]TV.nu's google-cache[/url], är inte det en redig kopia på ditt katalogskyddade material så det stänker om det Thomas. Varför är det ok att google indexerar dig men inte att jag gör det?

(Ta nu inte detta som en provokation, för det är det inte.. jag tittar inte ens på tv personligen).

Thomas 2006-09-16 23:45

Citat:

Originally posted by grazzy@Sep 16 2006, 17:19
Se tex www.tv.nu/+site:tv.nu&hl=sv&gl=se&ct=clnk&cd=1&client=firefo x-a]TV.nu's google-cache[/url], är inte det en redig kopia på ditt katalogskyddade material så det stänker om det Thomas. Varför är det ok att google indexerar dig men inte att jag gör det?
Jag är inte upphovsman och äger inte informationen, jag betalar pengar för att få ta del av samt publicera den i kommersiellt syfte. De som äger informationen jobbar aktivt för att stämma de som kopierar den. Det är dom bundna till enligt avtal. Jag gissar på att de som säljer datan till oss har kundintäkter på några miljoner i månaden. Dessa pengar skulle dom inte kunna ta betalt om dom inte stämde skiten ur de som snor den och publicerar den utan att betala.

Ang google kan jag välja att inte vara med enkelt med en meta tagg, tjuven ger mej inte samma möjlighet.

För att göra det lite mer komplext köper tv3 mfl. sina tablå av Tidningarnas Telegrambyrå vi ger TT upphovsrätten. Man kan tro att alla blir glada om man publicerar info'n men så enkelt är det inte.

Citat:

oavsett hur mycket blocket stretar emot så kan de i princip aldrig hindra allaannonser från att indexera dem
Jag tror i min enfald att det vore ganska enkelt. Pool.com har en ganska bra lösning, dom är inte scannade än vad jag vet. En enkelt form-metod post på varje länk skulle ju fixa grejen. Sedan öppnar man med IP-range för giltiga botar.

princip 2006-09-17 08:23

Thomas: Men köper ni informationen från respektive bolag, eller allt samlat från tredje part?

Att t.ex TV3 köper en tablå från TT är väl en sak, men sina egna kanaler måste de ju kunna ta betalt för i gengäld?

Just tv-tablåer verkar vara rena djungeln. Hur många sidor finns det inte med det?

Thomas 2006-09-17 10:57

Citat:

Originally posted by princip@Sep 17 2006, 08:23
Thomas: Men köper ni informationen från respektive bolag, eller allt samlat från tredje part?
En tredjepart. TT-Spectra.

Citat:

Att t.ex TV3 köper en tablå från TT är väl en sak, men sina egna kanaler måste de ju kunna ta betalt för i gengäld?
Det är inte tv3 som kollar vad exempelvis alla filmer handlar om, vilka skådepelarare som är med hur lång filmen är osv. Det är den tjänsten som köps in. Jag tror det gäller hela VIASAT.

Citat:

Just tv-tablåer verkar vara rena djungeln. Hur många sidor finns det inte med det?
Ett 20-tal kanske varav 10 stabila resten kommer och går.

nicclas 2006-09-17 13:07

Att sidor som info_ligo_.com/cached?Kvickare-bild-i-dagens-kamera&aid=beehdejcfhpxcahgihdhce
(tag bort _-tecken) kan ligga kvar på nätet under täckmanteln att det är en sökmotor, tycker jag tydligt visar att material som en gång lagts ut på internet hamnar i någon form av "laglöst" tillstånd.

När det gäller Thomas kallar att de "stämde skiten ur de som snor" har, vad jag känner till, inte hänt i Sverige förutom i fallet Blocket/Allaannonser. (I fallet Blocket/Allaannonser så kom stämningen först efter det att Blocket försökt stoppa Allaannonser utan att lyckas, som jag uppfattat det - dessutom drogs den tillbaka efter förhandlingar.) Vanligare är att IP stärras eller att mail skickas med "krav"/önskemål om att material tas bort.

InternetWorld hade en artikel om detta: http://66.249.93.104/search?q=cache:w38oun...en&ct=clnk&cd=1
även om artikeln tyvärr inte tar upp TV-tablåer.

Thomas 2006-09-17 14:53

Citat:

Originally posted by nicclas@Sep 17 2006, 13:07
När det gäller Thomas kallar att de "stämde skiten ur de som snor" har, vad jag känner till, inte hänt i Sverige förutom i fallet Blocket/Allaannonser.
Jag är ett levande bevis på att det hänt. Och många fler med mej. Du kan inte jämföra detta med allaannonser, alla annonser länkar till källan. Dom citerar titeln och hänvisar till vart den finns på internet som en sökmotor. Finns inte en enda likhet med det jag snackar om. Stjäls en tvtablå så stjäls all information och den som köper informationen tappar en besökare.

Citat:

InternetWorld hade en artikel om detta: http://66.249.93.104/search?q=cache:...n&ct=clnk&cd=1
även om artikeln tyvärr inte tar upp TV-tablåer.

En mycket bra artikel! Killen sammanfattar precis vad jag menar men han använder lite tuffare ord! Jag har skrivit om det massor av ggr här på WN.

- De medier som inte anser att Google, Yahoo och andra sökmotorer är allvarliga hot har bara inte märkt vad som håller på att hända.

nicclas 2006-09-17 15:01

Citat:


Jag är ett levande bevis på att det hänt. Och många fler med mej. Du kan inte jämföra detta med allaannonser, alla annonser länkar till källan. Det gör inte nyhets och tablå-tjuvar normalt.

Du menar att du fått betala ersättning i efterhand (skadestånd) för att du hämtat material från andra hemsidor?

Thomas 2006-09-17 15:02

Citat:

Originally posted by nicclas@Sep 17 2006, 15:01
Du menar att du fått betala ersättning i efterhand (skadestånd) för att du hämtat material från andra hemsidor?
Precis, blivit stämd.

Xamda 2006-09-17 15:05

Lagstiftning är luddig i detta fall, den ger skydd för hur en katalog sätts upp, men inte för själva innehållet.

Katalogskyddet omfattar exempelvis försäljningskataloger, adresskalendrar, tidtabeller och speciella räknetabeller och gäller i 10 år efter utgivningsdagen.

Skyddet gäller alltså själva uppställningen av uppgifterna, inte uppgifterna i sig.

Det borde således i princip vara fritt fram att knycka all sorts info från tabeller och liknande, så,länge som man inte publicerar dem på likadant sätt och så länge som innehållet inte uppnår verksstatus.

Thomas 2006-09-17 15:11

Citat:

Originally posted by Xamda@Sep 17 2006, 15:05
Lagstiftning är luddig i detta fall, den ger skydd för hur en katalog sätts upp, men inte för själva innehållet.
Innehållet är ju givetvis också upphovsrättskyddat om en person har författat det. Även katalogen som sådan om strukturen är unik. Ett register med personnummer kan således inte ha copyright på innehåll men en tvtablå blir skyddad fullt ut.

Citat:

Det borde således i princip vara fritt fram att knycka all sorts info från tabeller och liknande, så,länge som man inte publicerar dem på likadant sätt och så länge som innehållet inte uppnår verksstatus.
Absolut inte.

Magnus_A 2006-09-19 12:56

Det finns ett intressant avgörande i marknadsdomstolen,
http://www.marknadsdomstolen.se/avgo...6/Dom06-13.pdf
som berör en tvist mellan Blocket och Metro. Där finner MD att skrapningen och länkningen från Metro/Allaannonser till blocket är tillåten enligt marknadsföringslagen, men prövar inte den upphovsrättsliga frågan.

Xamda 2006-09-19 14:09

Thomas - jo, hur kan man uppnå verksstatus (som är kravet för att det skall skyddas av Upphovsrättslagen) genom en tv-tablå? Det kan man troligen inte. Alltså är det förmodligen fritt fram så länge som man inte kopierar både innehåll och utseende (utseendet kan man enklare nå en skyddsnivå på).

Elprisguiden - ungefär så, ja... Det är högst otroligt att en annons kan nå verksnivå, eller en temperaturangivelse, eller en valutakurs...

Det må vara oetiskt, men mycket svårt att komma åt...

Magnus_A 2006-09-22 13:59

Nu har jag kollat i boka..
och så här ligger det till:
Upphovsrätts lagens verkshöjd uppnås rätt snabbt. Redan själva annonstexten, beskrivningen av varan som annonsören totat ihop, borde nå verkshöjd i de flesta fall. En bild gör det alltid. Obervera att upphovsrätten stannar kvar hos annonsförfatten som alltså skulle kunna föra talan mot den som kopierar hans annonstext.



Kataloger är skyddade dels via regeln om katalogskydd i upphovsrättslagen som ger 10 års skydd, dels genom EU:s databasdirektiv som ger skydd i 15 år. Där kommer aktiekurserna och tv-tabåerna in.

Även skyddade verk (kataloginnehåll, annonser med mera) får citeras om det sker i enlighet med god sed. Vad som är god sed avgörs i förhållande till vad som är brukligt inom det området. Citaten måste dessutom vara korta i i förhållande till den egna framställningen.

slutsatser: Beskrivande text i Tv-tablåer eller annonser uppnår verkshöjd i de allra flesta fall och är sålunda skyddade redan där.
Eventuella fotografier är alltid skyddade.
TV-tablån, listan på annonser, telefonkatalogen, börskurserna är dessutom skyddade av katalogskyddet eller databasdirektivet, antagligen båda två.

Man får citera enstaka tv-recensioner, börskurser, annonser, telefonnummer om det är en mindre del av sammanhanget och det överenstämmer med vad som är brukligt. Rippar jag en tv-tablå rakt av, eller plockar jag ihop en sida med Tv-tablåer från olika håll så kommer jag ha svårt att klara en upphovsrättstvist.
Men om jag skriver en filmrecension och nämner att filmen ifråga kommer på TV då och då är det ett riktigt sätt att citera en upphovsrättsskyddad uppgift.


Alla tider är GMT +2. Klockan är nu 08:52.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson