Kom ihåg mig?
Home Menu

Menu


inArchive.com

 
Ämnesverktyg Visningsalternativ
Oläst 2012-07-31, 17:06 #1
Bosse007 Bosse007 är inte uppkopplad
Medlem
 
Reg.datum: Apr 2005
Inlägg: 97
Bosse007 Bosse007 är inte uppkopplad
Medlem
 
Reg.datum: Apr 2005
Inlägg: 97
Exclamation Om InArchive.com !!!

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Bosse, det underlättar inte av att du upprepar samma inlägg med envishet, det gör bara att det blir jobbigt att läsa.
Du har säkert rätt, men det finns ju ändå inte så mycket annat i denna tråd än påhopp på mig o dyl, så det kanske inte spelar någon större roll.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Hur väljer IA ut vilka sajter som ska "indexeras/kopieras"?
Det finns ju inget dokumenterat om detta så det är inte helt lätt att veta, och InArhive skulle naturligtvis inte svara (ärligt) på en dylik fråga.
Vad jag kunnat konstatera är att InArchive varit duktiga på att hitta stora sajter med mycket text (dvs det som är relevant för att attrahera sökmotorerna). Men de har även lagt ut många sajter med väldigt få sidor.
Min gissning, för det är allt vad jag kan ge på denna fråga, är att InArchive sållat ut de flesta större sajter och koncentrerat sig på dessa, och sedan har de "lindat in" dessa större sajter i en massa små sajter så att man inte så enkelt ska kunna se att prioriteten legat på större sajter.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Respekterar de en begäran om att exkluderas i efterhand?
Jag har fått ett antal mejl från upprörda sajtägare om att InArchive inte brytt sig om att ta bort deras sajter trots att de begärt detta, men ännu ingen som svarat mig att deras sajt tagits bort.

Emellertid, när jag kollade för några dagar sedan så upptäckte jag i alla fall en sajt som inte fanns kvar.

Kanske någon annan som läser detta, och som drabbats av InArchive, kan berätta om InArchive respkterat deras önskan om borttag? Skulle vara intressant att veta.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Respekterar de robots.txt?
Innan jag kontaktade dem så gjorde de med hundra procents säkerhet inte detta (eftersom det var tekniskt omöjligt).
Efter att jag ifrågasatt deras agerande hävdade de att namnet på deras bot var "inarchive", och att de respekterade en blockering av denna bot.
Ehuruvida det är sant vet jag inte, men med tanke på alla lögner de presterat kanske man inte ska ta deras påstående på allvar?
Bosse007 är inte uppkopplad   Svara med citatSvara med citat
Oläst 2012-07-31, 18:00 #2
Anders Larssons avatar
Anders Larsson Anders Larsson är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Jan 2004
Inlägg: 3 205
Anders Larsson Anders Larsson är inte uppkopplad
Klarade millennium-buggen
Anders Larssons avatar
 
Reg.datum: Jan 2004
Inlägg: 3 205
Citat:
Ursprungligen postat av Bosse007 Visa inlägg
Jag har fått ett antal mejl från upprörda sajtägare om att InArchive inte brytt sig om att ta bort deras sajter trots att de begärt detta, men ännu ingen som svarat mig att deras sajt tagits bort.

Emellertid, när jag kollade för några dagar sedan så upptäckte jag i alla fall en sajt som inte fanns kvar.

Kanske någon annan som läser detta, och som drabbats av InArchive, kan berätta om InArchive respkterat deras önskan om borttag? Skulle vara intressant att veta.
Så vi vet iaf att de kan ta bort sajter. Kan vi verifiera på något sätt att det är fler sajter som har begärt borttagning och att de inte blivit borttagna?

Jag kan ju känna att om de faktiskt tar bort sajter när man ber om det så, även om det fortfarande inte är ett okej betende, så blir det åtminstone ett mycket mindre problem.

(Ang robots.txt)
Citat:
Ursprungligen postat av Bosse007 Visa inlägg
Innan jag kontaktade dem så gjorde de med hundra procents säkerhet inte detta (eftersom det var tekniskt omöjligt).
Efter att jag ifrågasatt deras agerande hävdade de att namnet på deras bot var "inarchive", och att de respekterade en blockering av denna bot.
Ehuruvida det är sant vet jag inte, men med tanke på alla lögner de presterat kanske man inte ska ta deras påstående på allvar?
Hur menar du med tekniskt omöjligt? Var det de som påstod det eller är det ditt påstående?


Ny fråga
Återindexerar/uppdaterar de sajterna som de har sparat kontinuerligt?
Anders Larsson är inte uppkopplad   Svara med citatSvara med citat
Oläst 2012-07-31, 18:48 #3
Bosse007 Bosse007 är inte uppkopplad
Medlem
 
Reg.datum: Apr 2005
Inlägg: 97
Bosse007 Bosse007 är inte uppkopplad
Medlem
 
Reg.datum: Apr 2005
Inlägg: 97
Exclamation Om InArchive !!!

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Kan vi verifiera på något sätt att det är fler sajter som har begärt borttagning och att de inte blivit borttagna?
Kanske enligt det förslag jag redan givit? För det måste väl vara någon som skrivit i denna tråd som har fått sin sajt kopierad... annars blir det om möjligt ännu mer oförklarligt varför de skriver här, utanför ämnet.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Jag kan ju känna att om de faktiskt tar bort sajter när man ber om det så, även om det fortfarande inte är ett okej betende, så blir det åtminstone ett mycket mindre problem.
Tja, det kanske man kan tycka, om man bortser från det mesta annat som jag tagit upp, och som jag kommer att ta upp om bara strömmen av irrelevanta inlägg (inte detta) i alla fall tar en liten paus.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
(Ang robots.txt)
Hur menar du med tekniskt omöjligt? Var det de som påstod det eller är det ditt påstående?
Som jag mycket tydligt skrivit bl a på webbsidan om InArchive (http://hotpot.se/inarchive.htm) fanns det - innan jag engagerade mig i frågan - ingen information om namnet på InArchives bot, och då finns det heller ingen möjlighet att blockera den. Och som jag skrev i mitt svar till dig för en stund sedan så påstår InArchive nu att namnet på deras bot är "inarchive". Men hur kan man bekräfta att det är sant, om det nu skulle vara så?

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Återindexerar/uppdaterar de sajterna som de har sparat kontinuerligt?
En bra fråga. Det är inget de uppger, men jag vill minnas att de skrev till mig personligen vid ett tillfälle att de gjorde detta (kan dock inte gå ed på detta även om jag är ganska säker... och sedan spelar det kanske inte så stor roll vad InArchive säger, eftersom det inte går att lita på dem).

Emellertid, under den tid jag kontrollerade kopieringen så kunde jag inledningsvis vid något tillfälle se några sajter där kopiorna utökats med kopierad text. Däremot kunde i alla fall inte jag se att någon kopia uppdaterats efter ursprungssajtens uppdateringar.

Senast redigerad av Bosse007 den 2012-07-31 klockan 18:54
Bosse007 är inte uppkopplad   Svara med citatSvara med citat
Oläst 2012-07-31, 21:28 #4
Anders Larssons avatar
Anders Larsson Anders Larsson är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Jan 2004
Inlägg: 3 205
Anders Larsson Anders Larsson är inte uppkopplad
Klarade millennium-buggen
Anders Larssons avatar
 
Reg.datum: Jan 2004
Inlägg: 3 205
Ursprungligen postat av Anders Larsson
Kan vi verifiera på något sätt att det är fler sajter som har begärt borttagning och att de inte blivit borttagna?

Citat:
Ursprungligen postat av Bosse007 Visa inlägg
Kanske enligt det förslag jag redan givit? För det måste väl vara någon som skrivit i denna tråd som har fått sin sajt kopierad... annars blir det om möjligt ännu mer oförklarligt varför de skriver här, utanför ämnet.


Tja, det kanske man kan tycka, om man bortser från det mesta annat som jag tagit upp, och som jag kommer att ta upp om bara strömmen av irrelevanta inlägg (inte detta) i alla fall tar en liten paus.
Då måste jag få fråga: Dhar inga bevis för ditt påstående att de inte tar bort sajter när man ber dem? Du bara gissar att de inte gör det?

För att kunna hålla denna diskussion på en rimlig nivå bör vi fastställa fakta - inte spekulationer. Hur åstadkommer vi detta så att vi vet vilka punkter diskussionen ska handla om?

Har Bosse007 begärt att få någon sajt borttagen?
Har någon annan i tråden begärt att få en sajt borttagen?
I så fall, har denna sajt blivit borttagen?
Anders Larsson är inte uppkopplad   Svara med citatSvara med citat
Oläst 2012-07-31, 23:24 #5
kw_wasabis avatar
kw_wasabi kw_wasabi är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Feb 2008
Inlägg: 2 134
kw_wasabi kw_wasabi är inte uppkopplad
Klarade millennium-buggen
kw_wasabis avatar
 
Reg.datum: Feb 2008
Inlägg: 2 134
Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
1. Har Bosse007 begärt att få någon sajt borttagen?
2. Har någon annan i tråden begärt att få en sajt borttagen?
3. I så fall, har denna sajt blivit borttagen?
Gör ett tillfälligt återbesök trots att jag låtit Bosse gå hem med vinsten i denna duell.

Jag vet svaret på två av dina frågor.

1. Ja.

2. Inten aning. Trots att Bosse visat på stor skada och har granskat inArchive under en tid kan han inte ge något exempel varken för eller emot.

3. Ja. Bosse har fått sin sajt borttagen. [källa]
kw_wasabi är inte uppkopplad   Svara med citatSvara med citat
Oläst 2012-07-31, 23:27 #6
Bosse007 Bosse007 är inte uppkopplad
Medlem
 
Reg.datum: Apr 2005
Inlägg: 97
Bosse007 Bosse007 är inte uppkopplad
Medlem
 
Reg.datum: Apr 2005
Inlägg: 97
Exclamation Om InArchive !!!

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Dhar inga bevis för ditt påstående att de inte tar bort sajter när man ber dem?
Jo, det har jag.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Du bara gissar att de inte gör det?
Nej.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
För att kunna hålla denna diskussion på en rimlig nivå bör vi fastställa fakta - inte spekulationer.
Tillfredsställande fakta är redan fastställda, enligt min personliga mening, vad gäller vad som hänt (och ev. händer). Däremot saknar jag en diskussion om framtiden och vad som eventuellt kan göras för att förbättra situationen, såväl vad gäller bristerna i sökmotorerna som sajternas egna säkerhetssystem mot scamsajter som InArchive.
Och du hoppar över precis varje ord som är av vikt, T.ex. det i fetstil i mitt senaste svar till kw_wasabi.
Mer behöver egentligen inte fastställas, men naturligtvis är den som vill bistå med mer arbete i denna undersökning, i det som jag finner av midre intresse, varmt välkommen att göra detta.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Hur åstadkommer vi detta så att vi vet vilka punkter diskussionen ska handla om?
Ja du, Anders, säg det.
Själv är jag mest intresserad av att diskutera det som kan leda till något konstruktivt, så som t ex hur man ska förhindra att scamsajter som InArchive lyckas i sitt uppsåt att lura sökmotorerna.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Har Bosse007 begärt att få någon sajt borttagen?
Ja, det har jag.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
Har någon annan i tråden begärt att få en sajt borttagen?
Högst relevant fråga.

Citat:
Ursprungligen postat av Anders Larsson Visa inlägg
I så fall, har denna sajt blivit borttagen?
Om jag får svara för mig;
Nej, i alla fall inte när jag kollade senast. Men för din skull ska jag vid lämpligt tillfälle undersöka detta.
Bosse007 är inte uppkopplad   Svara med citatSvara med citat
Oläst 2012-07-31, 21:33 #7
Anders Larssons avatar
Anders Larsson Anders Larsson är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Jan 2004
Inlägg: 3 205
Anders Larsson Anders Larsson är inte uppkopplad
Klarade millennium-buggen
Anders Larssons avatar
 
Reg.datum: Jan 2004
Inlägg: 3 205
Ursprungligen postat av Anders Larsson
(Ang robots.txt)
Hur menar du med tekniskt omöjligt? Var det de som påstod det eller är det ditt påstående?

Citat:
Ursprungligen postat av Bosse007 Visa inlägg
Som jag mycket tydligt skrivit bl a på webbsidan om InArchive (http://hotpot.se/inarchive.htm) fanns det - innan jag engagerade mig i frågan - ingen information om namnet på InArchives bot, och då finns det heller ingen möjlighet att blockera den. Och som jag skrev i mitt svar till dig för en stund sedan så påstår InArchive nu att namnet på deras bot är "inarchive". Men hur kan man bekräfta att det är sant, om det nu skulle vara så?
Oavsett vilken UserAgent som deras bot har, om de följer riktlinjerna för robots.txt som de påstår, så ska följande respekteras av alla som scrapar sidor för att spara/cacha dem:

User-agent: *
Noarchive: /

Är det någon, Bosse inkluderat, som har använt följande i robots.txt och trots det fått sin sajt sparad av InArchive?
Anders Larsson är inte uppkopplad   Svara med citatSvara med citat
Svara

Taggar
bottar, copyright, inarchive.com


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 01:06.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017