WN

WN (https://www.wn.se/forum/index.php)
-   Serversidans teknologier (https://www.wn.se/forum/forumdisplay.php?f=4)
-   -   Schemalägga en spindel (https://www.wn.se/forum/showthread.php?t=30027)

emilv 2008-06-20 11:26

Citat:

Ursprungligen postat av Daniel.st
Citat:

Ursprungligen postat av emilv
För datainsamling rekommenderar jag att du håller dig till PHP då du har både smidiga reguljära uttryck och API:er för XML-tolkning. Möjligen kan Ruby eller Perl vara värt att lära sig i sammanhanget men ASP.NET känns som ett steg tillbaka.

Låter inte riktigt som att du jobbat så mycket med .NET

Det har du förstås rätt i. Jag har ingen Microsoft-dator så för mig skulle det säkerligen kosta mig en månadslön att ens få ihop till mjukvaran som behövs. =)

Man kan använda samma klasser och metoder i sina fristående program även i PHP. Det är i princip ingen skillnad alls. Man använder till och med start- och sluttaggarna <?php och ?> på samma sätt.
PHP har inte stöd för trådar, tyvärr, men klarar av att forka sig vilket gör att man kan implementera trådliknande funktionalitet (men med sämre prestanda och stabilitet).

Jag menade mer att om man kan PHP så kanske det är lättare att göra det där än att man ska lära sig helt nya tankebanor. Och ska man väl lära sig nya tankebanor är, i mitt tycke, Perl vettigare att lära sig i sammanhanget då Perls hantering av reguljära uttryck är lika mycket inbyggd i språket som vanlig stränghantering. Perl klarar förstås trådning.

Men för all del, ASP.NET kan säkert vara vettigt att lära sig ändå.

Daniel.st 2008-06-21 18:10

Citat:

Originally posted by emilv@Jun 20 2008, 11:26
Man kan använda samma klasser och metoder i sina fristående program även i PHP. Det är i princip ingen skillnad alls. Man använder till och med start- och sluttaggarna ?php och ? på samma sätt.
PHP har inte stöd för trådar, tyvärr, men klarar av att forka sig vilket gör att man kan implementera trådliknande funktionalitet (men med sämre prestanda och stabilitet).

Visste inte att man kunde skriva fristående program även i PHP, man lär sig något nytt varje dag :)

Vimp 2008-06-21 23:51

Har du lust att lära dig .NET så är en windows service ett förbannat smidigt sätt att lösa det på.

majkball 2008-06-22 13:21

Tack för alla bra svar och tips.

Det lutar åt att jag skriver ihop ett litet Java-program som jag kör på en burk som jag vet är påslagen jämnt. Pollar all data, plockar ut det relevanta och uppdaterar sedan databasen på webbhotellet.

Finns det något sätt man kan köra Java-program som en automatisk windows service? Burken jag tänker köra programet på används nämligen för kontors sysslor dagtid, och det vore störande för dom att ha ett fönster att ha koll på.

Mikael

majkball 2008-06-22 13:35

En till liten sak...

Jag har ju aldrig tidigare sysslat med denna typ av programmering... finns det någon sida som grundligt tar upp saker man bör tänka på vid utveckling av spindlar? Annars lär jag ju säkert göra typiska fel och bara förlora massa tid.

Mikael

majkball 2008-06-22 14:03

Någon som testat följande för att köra java program som en windows service?

http://wrapper.tanukisoftware.org/do...h/download.jsp

tartareandesire 2008-06-22 16:02

Citat:

Ursprungligen postat av emilv
För datainsamling rekommenderar jag att du håller dig till PHP då du har både smidiga reguljära uttryck och API:er för XML-tolkning. Möjligen kan Ruby eller Perl vara värt att lära sig i sammanhanget men ASP.NET känns som ett steg tillbaka.
Citat:

Ursprungligen postat av Daniel.st
I ditt fall handlar det inte om så mycket information men generellt tycker inte jag att man ska lasta webbservern med jobb som ska/kan köras i bakgrunden. Den typen av jobb ska rulla på en applikations eller job server.

På Levonline kör vi kunders cronjob (och SSH) på andra maskiner än webbservrarna. Jag tvivlar på att det finns särskilt många delade webbhotell som tillåter SSH-inloggning till webbservermaskinerna.

Reguljära uttryck har ju inte direkt något med programmeringsspråket att göra..., XML-tolkning finns ju i både PHP, ASP(.NET) och t.o.m. Javascript. Kör på det språk som du känner dig bäst hemma i helt enkelt, något annat är bara onödigt om du nu inte vill lära dig ett nytt på vägen.

majkball 2008-06-24 15:40

Hej,

Har kommit en bit på vägen. Snickrat ihop en spindel i Java som hämtar den data jag behöver. Nu måste jag dock uppdatera databaserna på webbhotellet, för tillfället kör jag med ett webbhotell som inte tillåter extern databas access (http://www.one.com). Ska dock flytta mig till binero.se som verkar bra... alternativt surftown.se om någon tycker det är bättre?

Min tanke är att ha ett PHP-script på webbservern, som vid en POST tar emot all data, bygger upp en SQL fråga med vilken den senare uppdaterar databasen på webbhotellet.

Några kommentarer kring detta upplägg mottages tacksamt? Är ju lite osäker på hur jag ska göra med verifieringen, endast godta uppdateringar från ett visst IP är ju ett sätt, annars? Räcker enbart lösenord som skickas med i POSTen... det är ju dock bara http, avlysningsbart så att säga, så hur mycket hjälper ett lösenord egentligen.

Mikael

Vimp 2008-06-24 22:18

En SOAP-baserad web service över https?

Erik Stenman 2008-06-24 23:21

Om du crawlar sidorna för ofta lär det upptäckas och det kan ofta ta mycket kraft om du tar mycket information. Kan i värsta fall leda till att de blockar din ip.


Alla tider är GMT +2. Klockan är nu 18:52.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson