![]() |
1.Ja man ska enligt reglerna googla först och fråga sen.
2. Jag har googlat. 3. Problemet är att jag inte vet vad jag ska googla på. 4. Det jag vill lära mig är följande: 1. Du har en hemsida med 10 länkar. Klickar du på varje länk så finns det under den lite text och en 3 siffrig kod som ser snarlik ut på varje sida. Jag vill slippa klicka på alla 10 länkar och kopiera koden manuellt. 2. Reguljära uttryck kanske, men sen då. Vad kallas tekniken, inte rippa, inte spindla.. ja ni fattar.. Vad kallas det? /Med reservation för att låta dum. |
Rippa, spindla, crawla m.m??
|
Det kallas ju knappast för alla tre?
|
Vad skall du med koderna till? Jag förstår inte riktigt nyttan i det hela, och utan det kan jag inte tänka ut en bra lösning...
Det du vill göra går att antingen göra på klientsidan via javascript eller serversidan, via något serverspråk. |
okej en hemsida presenterar följande: http://www..se/node103?Kod=XXXX
Där varje XXXX representerar varje kod jag vill åt. På en annan sida finns 100 länkar och någonstans i texten när man klickar på varje länk finns denna kod. Så med reguljära uttryck kan man ju hitta koden i varje html fil. Vad kallas tekniken exakt? Om ni undrar hur jag kan vara så vag, outbildad och liknande är det p.g.a att jag som uppdragsgivare endast vill ha ett hum av tekniken. Jag ska inte utföra det själv, men tycker det är kul att läsa på om så mycket som möjligt av om mitt projekt ändå. PHP kodas sidan i. p.s När jag väl fått koderna ska jag hämta information från varje sida. Totalt 200 sidor alltså.. http://www..se/node103?Kod=1S2H eller 3GH4 osv. |
scraping?
|
Citat:
När jag googlade på scraping hittade jag precis jättemycket om det jag ville läsa på om. Ursäkta mig till er andra för min dåliga förklaring. |
Tänk på att det inte är säkert att det är lagligt för dig att göra på detta sätt. Fråga upphovsrättshavaren innan du gör detta.
|
Som coredev skriver så är det inte så poppis att scrap:a sajter.
T.ex har Google och andra sökmotorer ett välutvecklat skydd mot scraping. |
Alla tider är GMT +2. Klockan är nu 22:22. |
Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson