![]() |
Har tittat på några övervakningstjänster för att veta om någon av mina burkar går ner och tänkt på vad man skall välja:
1. en tjänst som ligger utanför datahallen, typ pingdom 2. en tjänst som levereras av datahallen själv. Jag tror att de flesta övervakar sina servrar enligt alternativ 1. Dock tjänst det som för min del att jag egentligen vill bara ha larm, om servern går ner och inte om det händer något som slår ut hela datahallen eller linan de har, vilket en händer ju alla hallar, linor någon gång. Då borde alt. 2 vara att föredra. Vilka tjänster använder ni? Får ni larmmeddelanden per SMS eller mail (någon extern, typ hotmail, gmal, yahoo...)? |
Citat:
Vi får larm via mail och/eller SMS beroende på vad det gäller. |
Tack för ditt svar.
Men med alternativ 1 får jag även larm då datahallen är nere, vilket inte har med min server att göra. Kommer datahallen upp så kommer ju servern upp. Känns som sådana larm är onödiga och bara stressar upp en, då man ändå inte kan göra något åt det. Så förutom att jag får veta hur upptiden är för datahallen, vad är då meningen? |
Citat:
Nu kanske inte Sajthotellet är serverägare på det sätt du tänkt dig, men vi använder primärt en lösning med Servers Alive som övervakar från flera externa platser och skickar mail och sms vid problem. |
Hej,
Min övervakningslösning är följande: En server placerad i datahallen som övervakar min utrustning, skickar e-post och/eller SMS vid givna värden. Har en "garderobsserver" som övervakar den primära övervakningsservern, ifall den går ner får jag ett e-post och/eller SMS. Allt körs på servrar med CentOS och Nagios för övervakning. |
Monit kan du köra på egen burk och få mail när något händer. Övervakar driftstatus på många olika sätt och kan starta om apache m fl utifrån vissa kriterier. Kan även övervaka vissa tjänster på andra burkar. Monit går under *nix, finns säkert liknande för *soft.
|
Tack. Jag vill dock inte köra något eget program, men inte bli stressad av SMS om någon strular med hallen. Endast om det är någon av mina burkar som klyddar. Så kanske alternativ 2 är bäst, samt man kan kanske köpa en extern tjänst som ger mig bra rapporter per mail (och inte SMS) om allmänna upptider för datahallen .... känns som man får nog köra båda två .....
|
Citat:
Du skriver "burkar" vilket alltså är fler än en, kan de inte övervaka varandra då? Du slipper bli larmad om kopplingen till hallen bryts plus att du har en fin liten lösning, A larmar om B är nere och tvärt om. |
Terabyte - Om du ligger i en vettig hall lär du sannolikt inte få larm på grund av att hallen ligger nere. Det har hittills aldrig hänt oss i vår primära hall (där t.ex. webservrarna finns), under 4 år. Det har varit strömavbrott och nätstörningar, men redundansen har löst det utan ett enda stopp.
Vi övervakar från två, ibland tre, olika externa övervakningsservrar (våra egna) som använder olika lösningar för att övervaka alla delar i våra system, men primärt använder vi Servers Alive. Pingdom saknar jag förtroende för då den rapporterar nedtid på flera sajter när vi vet att dessa inte haft en sekunds nedtid (både hos oss och andra). Pingdom är bra på att ge en fingervisning, men är långt ifrån tillförlitlig. Tycker som Jonny, om din hall går ned vill du sannolikt veta det, om det händer ofta är det ju läge att byta leverantör. |
Xamda och wooper - det har ni helt rätt i. Något att fundera över.
Om ni använder Servers Alive, hur får ni till SMS? Ser att programmet annars larmar med t.ex. mail. Andra förslag på bra program för Windows? |
Vi har löst det genom att använda olika mailservrar för att sända mail till våra mobilabonnemang som omvadlas till sms genom vår teleoperatör (mail till sms). Vi använder Telenor och har haft ett avbrott i den tjänsten på åtta år (avbrottet var i ett par timmar under vilka de ej kunde leverera sms).
|
Som jag tidigare nämnde är vår lösning baserad på http://www.nagios.org samt CentOS 5 i botten. Varje server kör sin egen mailserver vilket löser larmen via e-post. För att skicka SMS använder vi oss av 42IT, för att skicka SMS besöker man en spciell URL (t.ex. sms.42it.se/send.php?phone=7311111&msg=blablab) vilket är mycket simpelt och går riktigt fort.
|
Pingdom används här, vilket är bland det smidigaste anser jag.
|
Om du inte vill få larm när "hela hallen går ner" kan du säkert ställa in det.
I Servers Alive kan du lägga till ett test som avbryter andra test om det är nere och larm ställs för varje test. |
Jag kör med Pingdom och har satt upp övervakning även på servern med IP bredvid min. Om den också är nere så vet jag att det inte är mina server som bråkar.
Inte den snyggaste lösningen kanske men det funkar tillräckligt bra. |
Känner till en man som körde BigBrother http://bb4.com/ under Windows för övervakning. Men efter att ha sätt Nagios hoppade han raskt över till det.
BB fungerar i alla fall på Windows. |
Jag använder mig också av Nagios och Munin för att övervaka och larma. För att få larm till mobilen så använder jag push-mail, dyker upp i mobilen lika snabbt som ett sms men mycket flexiblare och billigare.
|
Citat:
Låt mig först säga att det är smickrande att så många på WN valt att använda våra tjänster. Det förekommer att kunder till oss ibland tycker att vi upptäcker korta nertider som dem inte tycker förekommer, men i samtliga fall så har vi lyckats förklara för kunden vad detta kan beror på. Iom. att jag saknar bakgrund till din upplevelse så ska jag istället generalisera mitt svar.
För att slipa larm där en check ligger nere enbart en kort period (säg 30s och 1min) så rekommenderar vi våra kunder att ställa in larmutskicken så att dem skickas efter ex: 3 minuter av sammanhängande nertid. Om det är en sida som ligger på ett webbhotell där ni som kund inte kan göra mer än att underrätta webbhotellet så är det rekommenderat att ställa in larm på mellan 10-20 min +. Jag hoppas att jag även om svaret var generellt lyckades förklara några av anledningarna bakom dessa kort nertider som ibland förekommer samt hur man kan konfigurera sina larm för att slippa situationer där man får larm strax innan eller efter att problemet som uppstått inte längre är ett problem. Jag vill även tillägga att majoriteten av våra tusentals kunder inte drabbas av korta nertider, så även dessa bör iakttas om dem förekommer regelbundet. Kanske är det början till ett större problem. Med vänlig hälsning Sam Nurmi Pingdom.com Edit: Stavning |
Alla tider är GMT +2. Klockan är nu 16:05. |
Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson