Visa ett inlägg
Oläst 2009-09-30, 06:50 #3
emilvs avatar
emilv emilv är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Feb 2004
Inlägg: 1 564
emilv emilv är inte uppkopplad
Bara ett inlägg till!
emilvs avatar
 
Reg.datum: Feb 2004
Inlägg: 1 564
Edit: wget hade inga riktigt bra flaggor för att göra detta per default, men jag gör något liknande i två körningar för att spara ner Metros PDF-tidning:

wget -a log -nv -nc -nd --user-agent="" -O - http://www.metro.se/se/pdf/ | grep -o "[^\"]*SE\(RIK\|STO\|TEK\)[^\"]*\.pdf" >> urls

följt av:

wget -a log -nv -nH --cut-dirs=3 -nc -w 400 --random-wait -P ~/public_html/metro/archive/ --user-agent="" -x -A pdf -B http://www.metro.se/se/pdf/ -i urls

Senast redigerad av emilv den 2009-09-30 klockan 07:02
emilv är inte uppkopplad   Svara med citatSvara med citat