FAQ |
Kalender |
|
![]() |
#1 | |||
|
||||
Medlem
|
Citat:
![]() Citat:
Vad jag kunnat konstatera är att InArchive varit duktiga på att hitta stora sajter med mycket text (dvs det som är relevant för att attrahera sökmotorerna). Men de har även lagt ut många sajter med väldigt få sidor. Min gissning, för det är allt vad jag kan ge på denna fråga, är att InArchive sållat ut de flesta större sajter och koncentrerat sig på dessa, och sedan har de "lindat in" dessa större sajter i en massa små sajter så att man inte så enkelt ska kunna se att prioriteten legat på större sajter. Citat:
Emellertid, när jag kollade för några dagar sedan så upptäckte jag i alla fall en sajt som inte fanns kvar. Kanske någon annan som läser detta, och som drabbats av InArchive, kan berätta om InArchive respkterat deras önskan om borttag? Skulle vara intressant att veta. Innan jag kontaktade dem så gjorde de med hundra procents säkerhet inte detta (eftersom det var tekniskt omöjligt). Efter att jag ifrågasatt deras agerande hävdade de att namnet på deras bot var "inarchive", och att de respekterade en blockering av denna bot. Ehuruvida det är sant vet jag inte, men med tanke på alla lögner de presterat kanske man inte ska ta deras påstående på allvar? |
|||
![]() |
![]() |
![]() |
#2 | |||
|
||||
Klarade millennium-buggen
|
Citat:
Jag kan ju känna att om de faktiskt tar bort sajter när man ber om det så, även om det fortfarande inte är ett okej betende, så blir det åtminstone ett mycket mindre problem. (Ang robots.txt) Citat:
Ny fråga Återindexerar/uppdaterar de sajterna som de har sparat kontinuerligt? |
|||
![]() |
![]() |
![]() |
#3 | ||||
|
|||||
Medlem
|
Citat:
Citat:
Citat:
Citat:
Emellertid, under den tid jag kontrollerade kopieringen så kunde jag inledningsvis vid något tillfälle se några sajter där kopiorna utökats med kopierad text. Däremot kunde i alla fall inte jag se att någon kopia uppdaterats efter ursprungssajtens uppdateringar. Senast redigerad av Bosse007 den 2012-07-31 klockan 18:54 |
||||
![]() |
![]() |
![]() |
#4 | |||
|
||||
Klarade millennium-buggen
|
Ursprungligen postat av Anders Larsson
Kan vi verifiera på något sätt att det är fler sajter som har begärt borttagning och att de inte blivit borttagna? Citat:
För att kunna hålla denna diskussion på en rimlig nivå bör vi fastställa fakta - inte spekulationer. Hur åstadkommer vi detta så att vi vet vilka punkter diskussionen ska handla om? Har Bosse007 begärt att få någon sajt borttagen? Har någon annan i tråden begärt att få en sajt borttagen? I så fall, har denna sajt blivit borttagen? |
|||
![]() |
![]() |
![]() |
#5 | |||
|
||||
Klarade millennium-buggen
|
Citat:
Jag vet svaret på två av dina frågor. 1. Ja. 2. Inten aning. Trots att Bosse visat på stor skada och har granskat inArchive under en tid kan han inte ge något exempel varken för eller emot. 3. Ja. Bosse har fått sin sajt borttagen. [källa] |
|||
![]() |
![]() |
![]() |
#6 | ||||
|
|||||
Medlem
|
Citat:
Nej. Citat:
Och du hoppar över precis varje ord som är av vikt, T.ex. det i fetstil i mitt senaste svar till kw_wasabi. Mer behöver egentligen inte fastställas, men naturligtvis är den som vill bistå med mer arbete i denna undersökning, i det som jag finner av midre intresse, varmt välkommen att göra detta. Citat:
Själv är jag mest intresserad av att diskutera det som kan leda till något konstruktivt, så som t ex hur man ska förhindra att scamsajter som InArchive lyckas i sitt uppsåt att lura sökmotorerna. Ja, det har jag. Citat:
Om jag får svara för mig; Nej, i alla fall inte när jag kollade senast. Men för din skull ska jag vid lämpligt tillfälle undersöka detta. |
||||
![]() |
![]() |
![]() |
#7 | |||
|
||||
Klarade millennium-buggen
|
Ursprungligen postat av Anders Larsson
(Ang robots.txt) Hur menar du med tekniskt omöjligt? Var det de som påstod det eller är det ditt påstående? Citat:
User-agent: * Noarchive: / Är det någon, Bosse inkluderat, som har använt följande i robots.txt och trots det fått sin sajt sparad av InArchive? |
|||
![]() |
![]() |
Svara |
|
|