Kom ihåg mig?
Home Menu

Menu


Söker feedback för site crawler jag byggt

Ämnesverktyg Visningsalternativ
Oläst 2015-04-14, 21:37 #1
Jim_Westergrens avatar
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: May 2005
Inlägg: 1 058
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
Jim_Westergrens avatar
 
Reg.datum: May 2005
Inlägg: 1 058
Standard Söker feedback för site crawler jag byggt

Hej!

Jag byggde ytterligare ett verktyg:
http://seocalc.net/site-crawler.php

Det är ungefär som screaming frog fast ger en bättre överblick med vad som är viktigt gällande SEO.

Vill gärna höra er feedback och önskemål.
Jim_Westergren är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-14, 22:10 #2
x264 x264 är inte uppkopplad
Flitig postare
 
Reg.datum: Dec 2013
Inlägg: 342
x264 x264 är inte uppkopplad
Flitig postare
 
Reg.datum: Dec 2013
Inlägg: 342
Du borde stödja https också

Sedan verkar den inte stödja åäö är det korrekt?

Tog wn som exempel.


Lite väl vit kanske också

Annars trevlig tjänst

EDIT:

Tar väldigt lång tid, crawlar du med PHP eller? (med tanke på site-crawler.php)

Senast redigerad av x264 den 2015-04-14 klockan 22:21
x264 är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-14, 22:48 #3
Jim_Westergrens avatar
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: May 2005
Inlägg: 1 058
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
Jim_Westergrens avatar
 
Reg.datum: May 2005
Inlägg: 1 058
Tack!

https funkar för det mesta. wegot.se funkar till exempel. Men ibland inte (todaysweb.se). Håller på att undersöka orsaken.

åäö ska inte vara problem. Kan du ge exempel?

Ja, alltså designen är bara temporär.

PHP är det språk jag kan så det jag har byggt det i. Det var svårt att lösa paralellkörning men jag löste det genom att skapa iframes. Vet att det finns bättre språk men tyvärr inget jag behärskar (ännu).
Jim_Westergren är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-15, 03:51 #4
x264 x264 är inte uppkopplad
Flitig postare
 
Reg.datum: Dec 2013
Inlägg: 342
x264 x264 är inte uppkopplad
Flitig postare
 
Reg.datum: Dec 2013
Inlägg: 342
Ta WN t.ex.

"Mtesplatsen fr svenska webmasters"

"Allmnt - WN"

"Eget domn mail Allmnt"
x264 är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-15, 14:52 #5
Jim_Westergrens avatar
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: May 2005
Inlägg: 1 058
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
Jim_Westergrens avatar
 
Reg.datum: May 2005
Inlägg: 1 058
Måste bero på att WN använder ISO-8859-1, åäö brukar funka.
Felet måste ligga i dessa 2 rader:

$dom = new DOMDocument('1.0');
@$dom->loadHTML(mb_convert_encoding($html, 'HTML-ENTITIES', 'UTF-8'));

Någon som vet lösningen?
Jim_Westergren är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-15, 15:00 #6
Johnny Viking Johnny Viking är inte uppkopplad
Medlem
 
Reg.datum: Aug 2011
Inlägg: 273
Johnny Viking Johnny Viking är inte uppkopplad
Medlem
 
Reg.datum: Aug 2011
Inlägg: 273
Du behöver väl detecta encoding först, sen konvertera till UTF-8 därifrån?
Johnny Viking är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-15, 20:55 #7
Jim_Westergrens avatar
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: May 2005
Inlägg: 1 058
Jim_Westergren Jim_Westergren är inte uppkopplad
Har WN som tidsfördriv
Jim_Westergrens avatar
 
Reg.datum: May 2005
Inlägg: 1 058
Jag verkar ha löst encoding.

Gällande att wn.se var seg berodde på avsaknad av robots.txt och att jag missade att cacha det faktum.

Tack för feedback än så länge, fortsätt gärna
Jim_Westergren är inte uppkopplad   Svara med citatSvara med citat
Oläst 2015-04-15, 21:01 #8
Clarence Clarence är inte uppkopplad
Administratör
 
Reg.datum: Jan 2003
Inlägg: 1 974
Clarence Clarence är inte uppkopplad
Administratör
 
Reg.datum: Jan 2003
Inlägg: 1 974
Du behöver läsa eventuell encoding från headers innan du vet hur du ska tolka datan du fått. WN skickar "Content-Type: text/html; charset=ISO-8859-1".

Det kan även finnas encoding i meta taggar, ofantligt dumt påhitt att stödja att man först ska behöva läsa dokumentet och sen försöka tyda det, men det existerar och "funkar" i browsers likt förbannat.
Clarence är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 21:56.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017