WN

WN (https://www.wn.se/forum/index.php)
-   Serversidans teknologier (https://www.wn.se/forum/forumdisplay.php?f=4)
-   -   Scanning Teknik (https://www.wn.se/forum/showthread.php?t=207)

Kim Torvanger 2003-07-06 18:12

Är det någon som vet vilket språk och hur dom gör för att scanna aftonbladet och dagens nyheter mm?

Pekay 2003-07-06 19:48

Citat:

Originally posted by KimTorvanger@Jul 6 2003, 04:12 PM
Är det någon som vet vilket språk och hur dom gör för att scanna aftonbladet och dagens nyheter mm?
http://www.news.nu använder php

beror på, finns en del scripter färdiga på nätet, kolla hotscripts.com men du måste redigera och anpassa för varje nyhetssajt

Jens 2003-07-06 20:48

PHP är enkelt att göra site scanners med. Metoden jag använder tänker jag däremot behålla för mig själv men borde inte vara så svårt att klura ut själv med lite programmering/script kunskaper...

Kim Torvanger 2003-07-06 21:55

Hehe ok, tack båda. :)

Tobbe 2003-07-06 22:43

Hämta sidan till en variabel, strippa htmltags etc, splitta & inserta därefter till en db. Med php.net's funktionslista & lite logiskt tänkande går det kvickt :)

Mvh, Tobias

Kim Torvanger 2003-07-06 23:43

Citat:

Originally posted by dm.se@Jul 6 2003, 08:43 PM
Hämta sidan till en variabel, strippa htmltags etc, splitta & inserta därefter till en db. Med php.net's funktionslista & lite logiskt tänkande går det kvickt :)

Mvh, Tobias

:o Ok. :blink:

ZN 2003-07-07 13:38

Det brukar kallas syndication, sök på det kanske i kombination med parsing så kan du nog hitta en del, har själv cådat sånna i ASP och PHP, kan säga att PHP är överlägset enklare och snabbare än ASP på den biten (iof på alla bitar), med ASP va jag tvungen att installera en komponent som heter ASP-tear för kunna hämta data från andra websiter. I PHP finns dock funktioner för allt sånt, kolla socket-funktionerna, krävs inte många rader kod.

En jag känner cådade ett system i Java för att få det multitrådat, går ännu snabbare, han hämtar o andra sidan nyheter från 193 st nyhetssiter, se http://www.newzer.com :)

Per 2003-07-08 23:11

Nyckeln heter reguljära uttryck, eller regular expressions. Lär dig det så är det en barnlek att parsa data.

Kim Torvanger 2003-07-11 00:05

Tack allihopa. Ska sätta mig ner på en gång och börja lära mig lite "regular expressions" och sånt. Ska bara tanka PHP först. :)

Thomas 2003-07-11 00:35

Föredrar Perl, modern till "regular expressions" och starkast i alla lägen :)

Give it a try!

WN


Alla tider är GMT +2. Klockan är nu 09:33.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson