13 Paskaita - VGTU

2y ago
5 Views
2 Downloads
611.58 KB
32 Pages
Last View : 1m ago
Last Download : 3m ago
Upload by : Ellie Forte
Transcription

Aukšto pasiekiamumo (HA) sistemos13 paskaitaApsauga nuo gedimų (fault tolerance)HA sistemos

Pagrindinės sąvokosPatikimumas – tai objekto, dirbančio nustatytu režimu irnustatytomis darbo, techninio aptarnavimo sąlygomis savybėnustatytą laiką atlikti savo funkcijas, išlaikant nustatytaseksploatacines charakteristikas.Patikimumas - kompleksinė objekto savybė, įvertinamatokiomis dalinėmis jo savybėmis: negendamumu, pataisomumu, ilgaamžiškumu išsilaikymu.

Patikimumo sudėtinės dalysNegendamumas – tai objekto gebėjimas nepertraukiamai išlaikytisavo darbingumą tam tikrą laiką.Darbingumas – tai objekto būsena, kai jis gali atlikti savo funkcijas.Darbingumo praradimas vadinamas gedimu.Pataisomumas – tai objekto savybė, leidžianti numatyti, aptikti irpašalinti jo gedimus, palaikyti ir atkurti darbingumą, atliekant remontąarba techninį aptarnavimą.Ilgaamžiškumas – tai objekto savybė išlikti darbingam ikisusidėvėjimo su pertraukomis remontams ir techninei priežiūrai.Išsilaikymas – tai objekto savybė išlaikyti savo darbingumą tam tikrąlaiką jo nenaudojant.

Gedimai, sutrikimai (faults)Gedimas – tai sistemos nukrypimas nuo darbinės būsenos, kaisistema tam tikrą laiko dalį yra neveiksni arba nepilnai atliekasavo funkcijas. Kompiuterių sistemų gedimus įtakoja tokie faktoriai: Aparatūrinė įranga (hardware)Programinė įranga (software)TinklasŽmogiškasis faktorius (vartotojai, sistemos administratoriai)Gedimai gali būti suskirstyti į tokias kategorijas: Trumpalaikiai gedimaiTrumpalaikiai pasikartojantys gedimaiIlgalaikis arba nepataisomas gedimas

Gedimų greitisKuo didesnis sistemospatikimumas, tuo rečiau ji genda.Vienas iš gedimus apibūdinantisstatistinis rodiklis yra gedimųintensyvumas (greitis) λ.Jis apskaičiuojamas dalijantsuminį gedimų skaičių perstebėjimo laiką iš suminio išdirbioper tą patį laiką.Skaičiuojant, daroma prielaida,kad vidutinis gedimųintensyvumas yra pastovus pervisą stebėjimų laiką.

Apsisaugojimas nuo gedimų(fault tolerence)Norint apsisaugoti nuo gedimo padarinių reikia taikyti pertekliškumoprincipą, kuris sako, kad sugedus sistemai ar jos komponentui turijo darbą perimti perteklinis to pačio funcionalumo komponentas.Pertekliškumas (redundancy) gali būti trijų lygių: Informacijos pertekliškumas Hamming kodai (atmintis, HDD), paritetinė ir ECC tipo atmintisLaiko pertekliškumas Užlaikymai (timeout), pakartotinės užklausos, siuntimai(retransmit)Fizinis pertekliškumas N-modulinis pertekliškumas, RAID diskai, rezervinio kopijavimoserveriai, replikuojantys serveriai, aukšto patikimumo serveriai

Kokio lygio apsauga galima?100 % apsisaugoti nuo gedimų neįmanoma. Kuo sistemos negendamumo lygmuo artimesnis 100%, tuoji brangesnė.Sakoma, kad sistema yra apsaugota nuo k gedimų (k-faulttolerant), jei ji: Turi k 1 komponentų iš kurių k gali sugesti, bet likęsvienas palaikys sistemos funkcionalumą; Turi 2k 1 komponentą su Byzantine tipo gedimais, kaik komponentų gali sugedę, o k 1 komponentas palaikysfunkcionalumą.

“Devintukų” eveiksnumasper metusNeveiksnumasper savaitę98 %2%7,3 dienos3 val., 22 min.99 %1%3,65 dienos1 val., 41 min.99,8 %0,2 %17 val., 30 min20 min., 10 sek.99,9 %0,1 %8 val., 45 min.10 min., 5 sek.99,99 %0,01 %52 min., 30 sek.1 min.99,999 %0,001 %5,25 min.6 sek.99,9999 %0,0001 %31,5 sek0,6 sek.Sistemos pasiekiamumui matuoti panaudojant devintukų (NINES) metodą, kurisparodo, kiek laiko procentais sistema buvo pasiekiama ir veiksni.

Pasiekiamumas/patikimumasSistemos pasiekiamumą taip pat galima įvertinti žinant jos: vidutinį laiką tarp gedimų (MTBF – Mean Time Between Failures) vidutinį gedimų šalinimo laiką (MTTR -– Maximum Time To Repair).Skaičiavimui naudojama Marcuso – Sterno formulė:A MTBF.MTBF MTTRIš formulės matome, kad mažėjant gedimų šalinimo laikui, bendraspatikimumas artėja prie 100 %. Ir gedimų šalinimo laiko įtaka sistemospatikimumui mažėja, didėjant vidutiniam laikui tarp gedimų.

IT sistemų patikimumasIT sistema – tai sluoksninė struktūra, kurios pasiekiamumas/patikimumas priklauso nuo atskirų jos sluoksnių patikimumo irsistemos komponentų sujungimo būdų.Išskiriami tokie IT sistemos sluoksniai: Aparatūrinis Tinklo Operacinės sistemos Programų sistemų - servisų Aplikacijų/paslaugų

Patikimumo skaičiavimasRezervuota sistemaNerezervuota �R2’Rn’ab

Klasterių tipaiSiekiant užtikrinti fizinį sistemų patikimumą, kai iš kart apimaivisi sistemų sluoskniai, naudojamos klasteriai irreplikavimo serveriai.Kompiuterių klasteriai pagal naudojimo sritį skirstomi į: Didelio našumo klasterius (angl. High-PerformanceComputing clusters – HPC).Apkrovos balanso klasterius (angl. Load-Balancing clusters –LB).Didelio patikimumo/pasiekiamumo klasterius (angl. HighAvailabilty clusters – HA).

HPCDidelio našumo klasteriai – tai brandžiausia ir dažniausiainaudojama klasterių grupė, skirta labai didelių skaičiavimoišteklių reikalaujančių uždavinių sprendimui.HPC klasteriuose naudojama: unifikuoti kompiuteriai, turintys vienodas operacines sistemas didelio pralaidumo komunikacijų tinklas.HPC paskirtis: Uždaviniai su dideliais duomenų kiekiais Uždaviniai reikalaujantys daug skaičiavimo laiko Lygiagretaus tipo uždaviniai

LB klasterisApkrovos balanso (LB) klasterį sudaro: vidiniai (back-end) išoriniai mazgai (front-end).Išoriniai LB klasterio serveriaikomunikuoja su naudotojais, stebividinių mazgų apkrovimą ir būsenąrealiuoju laiku ir pagal iš ankstonustatytas taisykles paskirsto vartotojųužduotis mažiausiai užimtiemsvidiniams klasterio mazgams. Šispirminis LB sistemos elementas darkitaip vadinamas apkrovos balansotarnybine stotimi arba tarpininku.Vidinius klasterio mazgus sudaro serveriai su programine įranga klientųužklausoms apdoroti.

Apkrovos balansavimo būdaiBalansavimo būdai Peradresavimas (redirect) Persiuntimai (forward) Balansavimas pagal apkrovąBalansavimo algoritmai: Pasirenkamas serveris su mažiausiu TCP sujungimųskaičiumi Svorio koeficientų principas Parinkimas atliekamas round-robin principu. Pasirenkamas geriausią ryšį turintis serveris (SYN/ACK time)

Apkrovos balansavimasFunkcionalumas Suriša vieną/kelis virtualius adresus (IP, MAC) su fiziniaisadresais t.y. Įeinančios užklausos surišama su konkrečiu fiziniu adresu, parinkimasatliekamas pagal vieną iš balansavimo algoritmų.Priskirimai gali būti atliekami diferencijuojant pagal sąsajosnumerius, pvz. visas FTP srautas gali būti priskiriamas vienai mašinai.

Apkrovos balansavimasApkrovos balansavimo programinė įrangaBALANCE – tai atviro kodo TCP proxy programa, naudojantiround-robin apkrovos skirstymo princip1 ir palaikanti failover. Jiskirta TCP/IP sesijų srautams paskirstyti tarp tarnybinių stočių.(www.inlab.de)ZEUS Load balancer – komercinė apkrovos balansavimo įranga,galinti dirbti su SSL protokolu. Apkrovos balansavimas gali remtistaisyklių principu. (www.zeus.com)

HA klasterisAukšto patikimumo klasterio (HA) paskirtis – užtikrinti sistemospaslaugų nenutrūkstamą pasiekiamumą. Pasiekiamumo lygmuoapibrėžiamas SLA ir svyruoja nuo 99% iki 99.999 %.Visi HA sprendimai paremti pertekliškumo principu, t.y. naudojamaperteklinė įranga (mazgai, tinklo įranga, saugyklos), siekiantišvengti klasteryje SPOF (single points of failure) ir užtikrintisistemos pasiekiamumą. Perteklinių komponentų jungimas –lygiagretus.HA veikimo algoritmas gedimo atveju: Detektuojamas gedimas ir izoliuojamas sugedęs mazgas Perimami sugedusio mazgo tinkliniai nustatymai (IP adresas,vardas, maršrutizavimo lentelė ir t.t.) Apkrova perskirstoma likusiems mazgams

HA klasterio užduotys Kaip detektuoti gedimą ir užtikrinti automatinį jo šalinimą(failover)? Per kiek laiko bus detektuotas gedimas? Kaip ir kur neveikianti aplikacija bus atstatoma?

Gedimo detektavimas (Heartbeat) Gedimo detektavimo būdas: “ping” mechanizmas t.y. UDP paketų periodinis siuntimas visamtinklui ir programų scenarijų vykdymas klaidų atveju (heartbeat).Siekiant išvengti tinklo komponentų įtakos detektuojant gedimą,reikia dubliuoti tinklo įrangą (arba naudoti atskirą tinklą – privatenetwork) arba naudoti tiesioginį serverių tinklo plokščiųsujungimą laidu.

HA sistemos modeliaiPatikimos (rezervuotosios) sistemos atveju elementai yra jungiamilygiagrečiai ir sistema veikia tol, kol veikia bent vienas sistemoselementas.Egzistuoja du rezervuotų sistemų modeliai (failover configurationmodels):Aktyvus/Pasyvus lygiagrečiai sujungtų elementų sistemoje veikia tik pagrindiniselementas ir tik jam sugedus yra įjungiamas rezervinis.Aktyvus/Aktyvus lygiagrečiai sujungtų elementų sistemoje veikia visi elementaivienu metu, o sugedus vienam iš sistemos elementų, kitielementai perima sugedusio apkrovą ir sistema veikia tol, kolveikia bent vienas elementas.

HA sistemos modeliaiAktyvus/Pasyvus HA sistemos patikimumas, kai sistemasudaryta iš dviejų elementų, kurių gedimai nepriklauso vienasnuo kito, yra apskaičiuojamas:R1(t).R2(t)-sistemos patikimumas;- atitinkamai pirmo ir antroelemento patikimumas;- laikas nuo kurio yra aktyvuotasantras pasyvus elementas

HA sistemos modeliaiAktyvus/Aktyvus HA sistemos patikimumas, kai elementų gedimainepriklausomi vienas nuo kito, randami:R1(t).R2(t)

Komponentinis patikimumo modelisPapildomai išskiriami tokie patikimumo (rezervavimo) atvejai: bendrasis sistemos rezervavimas (aukšto lygio rezervavimas) dalinis (žemo lygio arba komponentinis) rezervavimas.Bendrojo rezervavimo atveju visa sistema yra dubliuojama. Tuotarpu dalinio rezervavimo atveju yra dubliuojamos sistemosatskiros posistemės ar n’ab

PavyzdysSistema sudaryta iš n 10 vienodo patikimumo elementų. Kiekvienoelemento patikimumas Ri 0,9. Kiek reikia rezervinių elementų abiemrezervavimo būdais, kad gautume sistemos patikimumą 0,95?SprendimasRezervinių grandžių skaičių bendrojo rezervavimo atveju galimeapskaičiuoti naudodamiesi formule:Įstatę reikšmes ir apskaičiavę, gauname, kad m 6 t.y. reikės 6 papildomųrezervinių grandžių po 10 elementų – iš viso 60 elementų.

TęsinysApskaičiuojame rezervinių elementų skaičių dalinio rezervavimo atveju,pasinaudodami formule:Įstatę reikšmes ir apskaičiavę, gauname, kad m 1 t.y. reikės papildomos 1rezervinės grandies iš 10 elementų.

m/N Aktyvus modelisTegul sistema turi N lygiagrečiai sujungtų elementų. Kad jireikiamai funkcionuotų, m iš N elementų turi būti nesugedę.Tokia sistema vadinama m/N aktyviuoju rezervavimu.Esant identiškiems komponentams, tokios m/N aktyviairezervuotosios sistemos patikimumą galima apskaičiuotinaudojantis formule:kur

Gedimų šalinimo tipaiŠaltasis (Cold failover) Aplikacija perstartuoja įvykus gedimui, dingstaneišsaugota informacijaŠiltasis (Warm failover) Aplikacija periodiškai naudoja kontrolinius taškus (checkpoints) Aplikacija perstartuoja į paskutinę kontrolinio taškobūsenąKarštasis (Hot failover) Aplikacijos būsena sinchronizuojama su jos kopija pokiekvieno pakeitimo. Gedimo atveju veikia aplikacijoskopija. Neveiksnumo laikas artimas 0.

HA sistemų komponentai Karšto keitimo įrenginiai Minimizuojamas prastovos laikas keičiant įrenginį.Pertekliniai, dubliuoti įrenginiai Maitinimo blokai, ventiliatoriai Atmintis su paritetu ir ECC RAID diskų masyvai Automatiškai persijungiantys komponentai (elektros tiekimolinijos, interneto tiekėjai ir t.t.)Bendro naudojimo saugyklos Serveriai jungiami prie vienos saugyklos. Užtikrinamagalimybė prisijungti kito failines sistemas, LUN, kuriuosnaudoja kitas serveris.

HA sistemos pavyzdysSwitch Aheartbeatswitch BLocal AreaNetworksServer AEthernetswitch A’heartbeat 2Server Bheartbeat 3Ethernetswitch B’ethernetAethernetBLocal AreaNetworks(for iSCSI)

HA sistema su VM

Virtualizacija HA klasteriuoseĮvykus „Mazgo1" gedimui, tampanepasiekiamos x0 ir x1 VM,kurias „Heartbeat“ PĮnusprendžiaperkelti įVirtualios mašinos„Mazgą2“.perkeltos iš„Mazgo1"Virtualios mašinosx1x0“Heartbeat”PĮx2Nėra signalo“Heartbeat”PĮMazgas2Mazgas2: „Aš gyvas.Pas mane veikia x0, x1, x2."Mazgas1Nėra signaloMazgas3: „Aš gyvas.Pas mane veikia x3, x4, x5."“Heartbeat”PĮVirtualios mašinosSaugyklaMazgas3x3x4x5

ZEUS Load balancer – komercin ėapkrovos balansavimo įranga, galinti dirbti su SSL protokolu. Apkrovos balansavimas gali remtis taisykli ųprincipu. ( www.zeus.com ) HA klasteris Aukšto patikimumo klasterio (HA) paskirtis – užtikrinti sistemos p

Related Documents:

ZEUS Load balancer – komercinė apkrovos balansavimo įranga, galinti dirbti su SSL protokolu. Apkrovos balansavimas gali remtis taisyklių principu. (www.zeus.com) Apkrovos balansavimas VMware ESX serverio apkrovos balansavimo metodai.

1094 TESTING OF PHYSICAL-MECHANICAL PROPERTIES OF COARSE AGGREGATE, USED FOR PRODUCING ASPHALT MIXTURES, AND ANALYSIS OF TEST RESULTS Matas Bulevi ius1, Kazys Petkevi ius2, Daiva Žilionien 3, Karina Drozdova4 1SE "Problematika", Galves str. 2, LT-2028 Vilnius, Lithuania.E-mail: matas.bulevicius@vgtu.lt

Figure 4. Components of FEM models of load-bearing shear walls panels: a) - final element of the panel's framework; b) - final element of outer sheets; c) - finite element of the fasteners (Ansys Inc., 2013) The FEM models of load-bearing shear walls panels was developed with the using of software ANSYS 15.0. The

sustainability Review Sustainable Decision-Making in Civil Engineering, Construction and Building Technology Edmundas Kazimieras Zavadskas 1,2,* ID, Jurgita Antucheviciene 1 ID, Tatjana Vilutiene 1 and Hojjat Adeli 3 1 Department of Construction Management and Real Estate, Vilnius Gediminas Technical University, Sauletekio al. 11, LT-10223 Vilnius, Lithuania; jurgita.antucheviciene@vgtu.lt (J.A.);

National Animal – the tsuru is designated as a Japanese national treasure and is an animal symbol of Japan – like the kangaroo for Australia, . and many more people could now learn to fold paper, including paper cranes. These pictures show two pages from the book, and two ladies with a child folding paper cranes – you can see the small scissors to cut the paper. 4 千羽鶴 Senbazuru .

Integrity inspection, American Petroleum Institute (API), Steel Tank Institute (STI), Magnetic Flux Leakage (MFL), Ultrasonic Testing (UT), National Fire Protection Association (NFPA). WHAT IS AN INTEGRITY INSPECTION An integrity inspection of a container(s) is a system designed to be sure that a container would not fail under normal operating conditions. In this application, it generally .

Archaeological Investigations and Recording 1994-2011 by David James Etheridge with scientific analysis by Dr David Dungworth Avon Archaeological Unit Limited Avondale Business Centre, Woodland Way, Kingswood, Bristol, BS15 1AW Bristol 2012 Illustration taken from the ‘Annales des Mines” Vol 10, dated 1825 . William Champion’s Warmley Brass and Zinc works, Warmley, South Gloucestershire .

System as the Army’s personnel accountability automation system with the electronic Military Personnel Office (throughout). o Deletes Personnel Transaction Register (AAC-P01) (throughout). Headquarters Department of the Army Washington, DC 1 April 2015 Personnel-General Personnel Accounting and Strength Reporting *Army Regulation 600–8–6 Effective 1 May 2015 H i s t o r y . T h i s p u b .