Citat:
Ursprungligen postat av johan1234
Hej alla! Försöker svara lite mer generellt än att svara alla individuellt här. Tack för engagemanget även om det är runt problem denna gången.
Ett antal saker verkar ha hänt där jag känner vi borde varit mer uppmärksamma. Det som har skett under veckan handlar inte om för många kunder eller underprovisionering av hårdvara (även om vi denna vecka lägger på än mer hårdvara för att säkra tillväxten). Vi har under någon dryg veckas tid kört en synkronisering av data mellan ett stort antal diskar (vi kör stora storage noder med hundratals diskar) och denna blev klar först nu klockan 08:40. Denna synkronisering skulle inte påverka oss nämnvärt och därför ansågs den inte utgöra ett problem. Som jag förstår det har dock ett antal servrar kört IO på onormalt sätt mot noden samtidigt (hängda processer mm) som från och till gjort att IO gått till en nivå som uppenbart påverkat ett flertal för att inte säga alla som går mot den noden. Vi hade samtidigt skrivit om hur vår statistik hämtas och processas och även där har vi hittat saker som gör att kombinationen lade onödigt hög last som i sin tur lades på hög för att skapa situationen som ni har upplevt. Hursom - dessa jobbades med i helgen och under natten och som jag förstår det skall det nu vara en klar förbättring. Hör gärna av er om ni inte känner att så är fallet.
Lite andra tankar från generella frågor som kom upp... det nämndes bland annat att vårt pris är för lågt för att kunna leverera en kvalitetstjänst. Så är inte fallet. Dock är det utan tvekan så att vår modell bygger på volymer för att det skall gå ihop sig. Vi köper väldigt stora system och behöver tusentals kunder. Precis som många av våra konkurrenter. Känner inte till någon form av delad hosting som inte har i alla fall delar av dessa byggklossar i sin modell.
En jämförelse med banker gjordes - marmoth nämde att där felar det aldrig. Två fel gör inte ett rätt men oj vad det har felat där marmoth. Nordea har fortfarande mycket att förklara för olika statligar nämnder bara för senaste månadens nertider. Absolut är det en morot att förbättra. Tror dock vi har viljan och hungern att alltid vara bra så det är lite tråkigt att det ska behöva dyka upp öht. Fel kommer alltid uppstå men det gäller att vara extremt aktiv och rätta snabbt. Men som du säger - sporrar ytterligare att vi måste bli bättre.
Vet som sagt att det sker en hel del uppgraderingar denna veckan. Det är sista fasen av våra många uppgraderingar denna och förra månaden. Detta skall ge ytterligare kraft och rejält med överkraft för att ge oss möjlighet att aldrig sätta oss i en prestandasits igen. Det innebär inte att fel inte kan ske igen som drar ner prestandan. Men det skall aldrig vara pga underdimensionering som vi tyvärr åkte på för någon månad eller två sedan.
Tack för tålamodet... och som sagt tack för engagemanget och drivet här både bland kunder och vänner.
|
Mycket bättre nu! Håll det såhär tack.
Bra jobbat!