WN

WN (https://www.wn.se/forum/index.php)
-   Webbhotell (https://www.wn.se/forum/forumdisplay.php?f=13)
-   -   City nere? (https://www.wn.se/forum/showthread.php?t=1056534)

johan1234 2013-01-24 09:05

JonasN - Blev lite förvånad när jag läste ditt inlägg. Vi började tidigt med cloud computing. 2009 öppnade portarna för City Cloud och utan tvekan har vi lärt oss en del saker på vägen om storskalig drift med väldigt många virtuella maskiner. Upptid kan alltid diskuteras och är många gånger individuellt då vi oftast inte ansvarar för OS eller applikationer. Men om man tittar på lite oberoende företag som jobbar med att mäta upptid och prestanda så kör tex Cloud Harmony en hel del tester mot de större leverantörerna. En del är upptiden som mäts - och den dök självklart för oss igår - men ger en indikation i alla fall: http://cloudharmony.com/status - förra kvartalet låg vi på 99.991%. Man skall också veta att få sådana här tjänster tar i beaktning planerat underhåll så i de siffror du ser är även underhållen med. City Cloud är en relativt stor miljö idag dock så det är samtidigt väldigt sällan som alla påverkas samtidigt - så en kund kan ha en bättre upplevelse än en annan tex. Likadant i större bolag - Amazon har varit nere två gånger sedan jul - men det påverkade långt från alla.

Krasher händer - och kan vara många anledningar. Backup är ett ansvar kunden har för sin VPS i City Cloud. Vi tillhandahåller lösningar för det samt att vi tar backup dagligen för vår egen del i lägen som igår. Vi kan sålunda återställa alla maskiner och kör backup till två skilda hallar (Stockholm och Karlskrona). Saker kan självklart gå fel men där har du lite av vår process - och därav min förvåning när jag läste ditt inlägg.

Skulle vara bra om du kan PMa mig lite konto uppgifter så skall jag försöka ta reda på vad som har gått så fel i ditt fall... Tack.

FredrikNas 2013-01-24 09:43

jag har själv en box i City Cloud och har haft under flera år nu, och känner inte igen det Jonas snackar om, det enda problemet som har varit var att ett filträd rasade på en disk för en stund sedan, något som knappast CN kan belastas för.

Då vår backup var äldre än den snapshot CN hade av disken så fick vi utomordentligt bra hjälp av supporten att A: Lägga in data från diskbilden så att sidan kom upp på få minuter igen, B: felsöka och reparera filträdet från den disken som var i realtid: C: återställa data från den rasade disken till drift igen. Allt med 0% dataförlust, och väldigt väldigt nöjda kunder.

Bra support är alltid guld värd!

lazat 2013-01-24 12:07

Citat:

Ursprungligen postat av johan1234 (Inlägg 20460535)
Onekligen inte en bra dag för oss på City. Lite möten här idag med de bolag som jobbar med hallen - dvs elektriker och bolaget som nya UPS-systemet kommer ifrån m. fl. - för att få mer klarhet i exakt vad som hände.

Jag har bara en fråga. Hade servrarna som gick sönder dubbla nätagg?
Om så spikade strömmen i båda nätaggen eller gick dom ner ändå?

patrikweb 2013-01-24 12:16

Citat:

Ursprungligen postat av lazat (Inlägg 20460556)
Jag har bara en fråga. Hade servrarna som gick sönder dubbla nätagg?
Om så spikade strömmen i båda nätaggen eller gick dom ner ändå?

Väldig intressant fråga faktiskt. Dubbla nätagg som bara har en A matning bör risken vara extremt stor att båda agg poffar.

Dubbla nätagg på A + B där bara ena fick strömspik bör inte skadat mer än ena nätagg max om det inte var extrem strömspik.

Men extrem strömspik är väldigt svårt att få, ofta är det då att åska slår ner nästan direkt i utrustning eller UPS exploderar eller någon har kopplat väldigt fel.

johan1234 2013-01-24 12:39

Citat:

Ursprungligen postat av lazat (Inlägg 20460556)
Jag har bara en fråga. Hade servrarna som gick sönder dubbla nätagg?
Om så spikade strömmen i båda nätaggen eller gick dom ner ändå?

Jag vet inte faktiskt. Vet att det mesta vi köper idag och de senaste åren är dubbelt men vissa kunder väljer enkla och vi säljer en hel del dedikerat med enkelt också. Ett val som inte alltid vi gör. Vet att de kommer gås igenom och se om vi så här efteråt kan återanvända dem på något sätt. Tror även att några "troddes" vara sönder men där bland annat mindre delar inte fungerade - som tex nätverkskort som av någon anledning lagt av eller bara agerade konstigt och det funkade helt enkel inte.

tartareandesire 2013-01-24 13:09

Citat:

Ursprungligen postat av patrikweb (Inlägg 20460559)
Väldig intressant fråga faktiskt. Dubbla nätagg som bara har en A matning bör risken vara extremt stor att båda agg poffar.

Dubbla nätagg på A + B där bara ena fick strömspik bör inte skadat mer än ena nätagg max om det inte var extrem strömspik.

Men extrem strömspik är väldigt svårt att få, ofta är det då att åska slår ner nästan direkt i utrustning eller UPS exploderar eller någon har kopplat väldigt fel.

Åska kan vi nog ganska säkert räkna bort i det här fallet :)

lazat 2013-01-24 13:11

Citat:

Ursprungligen postat av johan1234 (Inlägg 20460563)
Jag vet inte faktiskt. Vet att det mesta vi köper idag och de senaste åren är dubbelt men vissa kunder väljer enkla och vi säljer en hel del dedikerat med enkelt också. Ett val som inte alltid vi gör. Vet att de kommer gås igenom och se om vi så här efteråt kan återanvända dem på något sätt. Tror även att några "troddes" vara sönder men där bland annat mindre delar inte fungerade - som tex nätverkskort som av någon anledning lagt av eller bara agerade konstigt och det funkade helt enkel inte.

ok men du kanske vet om ni har A+B ström till de som har dubbla agg? Eller kommer det från samma UPS men med 2 faser?

johan1234 2013-01-24 14:11

Citat:

Ursprungligen postat av lazat (Inlägg 20460570)
ok men du kanske vet om ni har A+B ström till de som har dubbla agg? Eller kommer det från samma UPS men med 2 faser?

Samma UPS men olika faser för dessa.

johan1234 2013-01-25 14:27

Här kommer lite utvecklad information för de som kan tänkas vara intresserade. Strömspik, som det talades friskt om hos elektrikerna minutrarna efter haveriet, var absolut inte enda problemet. Här finns full incidentrapport:

https://www.citynetwork.se/city-netw...cidentrapport/

Finns även på engelska om någon hellre läser det: https://www.citynetworkhosting.com/c...n/post-mortem/

Ha en bra helg!

tartareandesire 2013-01-25 14:42

Är inte det normala att man gör större arbeten som omfattar hela driftsmiljön under de timmar på dygnet då det är lägst belastning, det vill säga typ vid 2-4 på natten?


Alla tider är GMT +2. Klockan är nu 04:34.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson