Är det någon som vet vilket språk och hur dom gör för att scanna aftonbladet och dagens nyheter mm?
|
Citat:
beror på, finns en del scripter färdiga på nätet, kolla hotscripts.com men du måste redigera och anpassa för varje nyhetssajt |
PHP är enkelt att göra site scanners med. Metoden jag använder tänker jag däremot behålla för mig själv men borde inte vara så svårt att klura ut själv med lite programmering/script kunskaper...
|
Hehe ok, tack båda. :)
|
Hämta sidan till en variabel, strippa htmltags etc, splitta & inserta därefter till en db. Med php.net's funktionslista & lite logiskt tänkande går det kvickt :)
Mvh, Tobias |
Citat:
|
Det brukar kallas syndication, sök på det kanske i kombination med parsing så kan du nog hitta en del, har själv cådat sånna i ASP och PHP, kan säga att PHP är överlägset enklare och snabbare än ASP på den biten (iof på alla bitar), med ASP va jag tvungen att installera en komponent som heter ASP-tear för kunna hämta data från andra websiter. I PHP finns dock funktioner för allt sånt, kolla socket-funktionerna, krävs inte många rader kod.
En jag känner cådade ett system i Java för att få det multitrådat, går ännu snabbare, han hämtar o andra sidan nyheter från 193 st nyhetssiter, se http://www.newzer.com :) |
Nyckeln heter reguljära uttryck, eller regular expressions. Lär dig det så är det en barnlek att parsa data.
|
Tack allihopa. Ska sätta mig ner på en gång och börja lära mig lite "regular expressions" och sånt. Ska bara tanka PHP först. :)
|
Föredrar Perl, modern till "regular expressions" och starkast i alla lägen :)
Give it a try! WN |
Alla tider är GMT +2. Klockan är nu 09:33. |
Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson