![]() |
Är det någon som vet vilket språk och hur dom gör för att scanna aftonbladet och dagens nyheter mm?
|
Citat:
beror på, finns en del scripter färdiga på nätet, kolla hotscripts.com men du måste redigera och anpassa för varje nyhetssajt |
PHP är enkelt att göra site scanners med. Metoden jag använder tänker jag däremot behålla för mig själv men borde inte vara så svårt att klura ut själv med lite programmering/script kunskaper...
|
Hehe ok, tack båda. :)
|
Hämta sidan till en variabel, strippa htmltags etc, splitta & inserta därefter till en db. Med php.net's funktionslista & lite logiskt tänkande går det kvickt :)
Mvh, Tobias |
Citat:
|
Det brukar kallas syndication, sök på det kanske i kombination med parsing så kan du nog hitta en del, har själv cådat sånna i ASP och PHP, kan säga att PHP är överlägset enklare och snabbare än ASP på den biten (iof på alla bitar), med ASP va jag tvungen att installera en komponent som heter ASP-tear för kunna hämta data från andra websiter. I PHP finns dock funktioner för allt sånt, kolla socket-funktionerna, krävs inte många rader kod.
En jag känner cådade ett system i Java för att få det multitrådat, går ännu snabbare, han hämtar o andra sidan nyheter från 193 st nyhetssiter, se http://www.newzer.com :) |
Nyckeln heter reguljära uttryck, eller regular expressions. Lär dig det så är det en barnlek att parsa data.
|
Tack allihopa. Ska sätta mig ner på en gång och börja lära mig lite "regular expressions" och sånt. Ska bara tanka PHP först. :)
|
Föredrar Perl, modern till "regular expressions" och starkast i alla lägen :)
Give it a try! WN |
Kan man få perl att fungera tillsammans med IIS (PWS)?? Har tankat mod_perl men behöver hjälp att få den installerad med PWS som sagt, nån som vet??
|
Japp, visst går det att köra Perl med PWS. Titta på http://home.ubalt.edu/abento/752/Pws/perliniis.html, där finns en bra beskrivning på hur du konfigurerar din PWS för Perl.
|
Tack så mycket. :)
|
Vad är det som gäller för användande av sådan här teknik. Måste man ha tillstånd från sidan man hämtar informationen ifrån?
Känns ju annars som att man kan "stjäla" besökare från en sida om man bara scannar och publicerar deras material... |
Självklart behöver man tillstånd.
Mvh, Tobias |
Ja, man får göra upp en deal med sidan som äger materialet man ska scanna. Ge dom lite reklam osv.
|
Citat:
ps. Kolla in frisim.com Lite mer avancerad "scanning" av nyheter! .. diggar den hårt! |
Sajter som publicerar rubriker lär knappast stängas av två skäl:
1) De drar trafik till nyhetssajterna. 2) Upphovsrättslagen är inte helt lätttolkad med tanke på rätten att citera. |
Jag pratade med en jurist på Dagens Nyheter angående detta och han sa att så länge man klart och tydligt anger vart nyheterna kommer från så är det helt lagligt.
|
Du Memox (om du fortfarande finns kvar här?) du bör nog ta ett nytt snack med din jurist på DN om hur man får länka till dem, och de flesta andra nyhetssajter.
På DN.se:s sida "Vanliga frågor om upphovsrätt" finns följande: Får jag länka från min hemsida till material på DN.se? Ja, om du gör fullständiga länkar, det vill säga länkar som "förflyttar" läsaren helt till DN.se. Det är inte tillåtet att länka in DN:s material i ett så kallat framesystem. http://www.dn.se/DNet/jsp/polopoly.jsp?d=602&a=6579 Din hemsida Newzer.com uppfyller inte dessa önskemål/krav. Fixa kanske!? ;-) |
Jag är rätt säker på att texten du refererar till är en generalisering för att inte riskera att bli feltolkade samt att det mot newzer.com, om DN skulle vilja ta lagliga åtgärder, inte ens skulle finnas en giltig åtalspunkt. Ta gärna googles image search som ett exempel, eller varför inte googles cache? Summan är att länkningen inte skadar DN, utan gör dem nytta.
|
cerebus: Jag tror inte att det är en "generalisering". Jag minns hur det var med Agent25 tidigare. De har nu tagit bort sin "frame:ning". Newzer.com gör naturligtvis som de vill, det var bara ett tips i all välmening. Jag tror heller inte att DN gör någon rättslig sak av det hela, om de inte vill statuera exempel.
Vad gäller Google så har de ingen cache på Google news. När det gäller bilder, så är det inte riktigt samma sak som nyheter. |
Citat:
skulle vara intressant att höra och det lär ju inte vara någon större hemlighet? =) |
Citat:
|
Citat:
|
Citat:
|
Citat:
|
Citat:
$url = "http://www.aftonbladet.se/telegram/nyhetsbevakaren/"; $file = fopen ($url, "r"); Det verkar som PHP inte tillåter att externa filer öppnas. Använder ni något annat sätt? |
Citat:
...bör funka fint... |
Citat:
Warning: file("http://www.aftonbladet.se/telegram/nyhetsbevakaren/") - No such file or directory in /customers/mindoman.se/mindoman.se/httpd.www/test.php on line 37 Om jag däremot hämtar en lokal fil, t ex samma som jag testar med, så går det: file("test.php"); :( ?? |
Citat:
funkar då fint för mig, som du kan se här, med koden enligt nedan. Kod:
<?php |
Vissa webbhotell ställer in PHP så att det inte går att plocka data från andra servrar.
|
Citat:
marcuss, jome och andra, vilka webbhotell ligger ni på som tillåter det? Om det möjligen är känsligt, skicka ett PM! :) |
Du hittar mer information på http://se2.php.net/manual/sv/ref.filesyste...allow-url-fopen
Jag tror att det flesta webbhotell stödjer allow_url_fopen. Jag testade det på Fs-Data, Aleborg och mitt eget (standout.se) och det fungerar fint. På vilket webbhotell ligger du? |
b-one...
Supporten svarade snabbt, och bekräftade att det inte går. De sa också att webbhotell inte brukar tillåta det! Vill väl inte att man byter.. Nämn gärna fler som stödjer det. Hur är det med box.se och 99kronor? Jag står i begrepp att byta hotell ändå. |
Det enklaste är nog att skriva till webbhotellen och fråga.
|
Citat:
Jag har det webhotellet till ett flertal domäner, och det fungerar kanonbra. Årskostnad 250 kr för bronsabonnemagnet. /Peter |
Tackar för alla svar. Oderland ser verkligen bra ut. Men det är lite av en djungel. Är rätt ny på att veta lite bättre vad jag vill ha (b-one blev det bara på reklamen... :wacko: ), och skulle behöva en bra översikt över alla webhotell med samlad info om vad de stödjer och inte stödjer, kostar, och förstås kundernas omdömen.
Nu börjar vi lämna ämnet och jag kan fråga vidare på annan plats. |
Någon som vet om det finns några färdiga script att tanka ner för detta som det bara är att modifiera?
|
box.se stödjer INTE det.
|
Alla tider är GMT +2. Klockan är nu 12:57. |
Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson