Инжењеринг поузданости сајта - курс 65.000 руб. из Слурма, обука, 01.01.2024.
мисцеланеа / / November 29, 2023
ЗА ЉУДЕ
СРЕ инжењер може бити или оперативни инжењер или програмер. Током интензивног курса много ћете вежбати, а вештине и знања која стекнете могу се прилагодити и применити у било којој области.
БИЗНИС
СРЕ решава исте проблеме као и ДевОпс: повећава брзину објављивања нових функција и побољшава процесе унутар тима. Али главни задатак СРЕ-а је да обезбеди стабилност и поузданост услуга, искључујући ситуације у којима се корисници жале на кварове, а инжењери имају зелене распореде.
Градимо:
Наш сајт за обуку састоји се од неколико микросервиса. Обједињује податке о представама, ценама и расположивим местима из свих биоскопа, приказује најаве филмова, омогућава вам да изаберете биоскоп, представу, салу и место, резервишете и платите карте.
Формулисаћемо СЛО, СЛИ, СЛА индикаторе за ову локацију, развити архитектуру и инфраструктуру која ће их подржавати, поставити праћење и упозорење.
Грешке програмера, кварови на инфраструктури, прилив посетилаца и ДоС напади доводе до погоршања СЛО-а.
Анализирамо стабилност, буџет грешке, праксу тестирања, управљање прекидима и оперативно оптерећење.
Десила се несрећа. Услуга обраде плаћања не ради. Како поступити да бисте вратили функционалност у најкраћем могућем року?
Организујемо рад тима за хитне случајеве: укључујемо колеге, обавештавамо заинтересоване стране, постављамо приоритете. Тренирамо се за рад под притиском у изузетно ограниченим временским условима.
Хајде да погледамо приступ сајту са СРЕ тачке гледишта. Анализирамо инциденте (узроци настанка, напредак елиминације). Доносимо одлуке да их даље спречимо: унапређујемо праћење, мењамо архитектуру, приступ развоју и раду и прописе. Ми аутоматизујемо процесе.
— Имамо десетине изграђене инфраструктуре и стотине писаних ЦИ/ЦД цевовода,
— Сертификовани Кубернетес администратор,
— Аутор неколико курсева о Кубернетес-у и ДевОпс-у,
— Редовни говорник на руским и међународним ИТ конференцијама.
1. ДАН: Почетна сесија АМА
Разговараћемо о циљевима и циљевима курса, а такође ћемо вам рећи шта је СРЕ и поделити га у тимове.
Отварање 2 теоријске теме:
Тема 1: Мониторинг
- Зашто је потребно праћење?
- Перцентили
- Алертинг
- Опсервабилити
Тема 2: СРЕ теорија
- СЛО, СЛИ, СЛА
- Трајност
- Грешка буџета
2. ДАН: анализа пракси и случајева
Вежбање: Израда основне контролне табле и подешавање потребних упозорења
Вежбање: Додавање СЛО/СЛИ + упозорења на контролну таблу
Вежбање: Прво оптерећење система
Решење случаја 1: зависност низводно.
У великом систему постоји много међузависних услуга и оне не раде увек једнако добро. Посебно је неугодно када вам је услуга у реду, али суседна, од које зависите, повремено опада.
Образовни пројекат ће се наћи управо у таквим условима, а ви ћете осигурати да и даље производи квалитет на највишем могућем нивоу.
ДАН 3: АМА сесија, одговори на питања
Отвара се приступ 2. теоријском модулу:
Решавање проблема са окружењем и архитектуром
Други модул је изграђен око решавања два случаја: узводне зависности и архитектонских проблема. Говорници ће говорити о управљању инцидентима, правилима за ватрогасну бригаду и раду са обдукцијама и пружити шаблоне које можете користити у свом тиму.
Тема 3: Управљање инцидентима
- Инжењеринг отпорности
- Како се формира ватрогасна јединица
- Колико је ваш тим ефикасан у инциденту?
- 7 правила за вођу инцидента
- 5 правила за ватрогасца
- ХиППО - мишљење најбоље плаћене особе. Цоммуницатионс Леадер
ТТема 4: Варрум алати и управљање упозорењима.
Најбоља пракса других компанија у организовању управљања инцидентима.
4. ДАН: анализа пракси и случајева
Решење за случај 2: зависност узводно.
Једно је када зависите од услуге са ниским СЛО. Друга је ствар када је ваша услуга иста за друге делове система. Ово се дешава ако критеријуми оцењивања нису доследни: на пример, одговорите на захтев у року од једне секунде и сматрате га успешним, али зависна служба чека само 500 московског времена и одлази са грешком.
У том случају ћемо разговарати о важности хармонизације метрика и научити да гледамо на квалитет очима клијента.
Решење за случај 3: проблеми са базом података.
База података такође може бити извор проблема. На пример, ако не надгледате релеј репликације, реплика ће постати застарела и апликација ће вратити старе податке. Штавише, отклањање грешака у таквим случајевима је посебно тешко: сада су подаци недоследни, али након неколико секунди више нису доследни и није јасно шта је узрок проблема.
Кроз случај ћете осетити сву бол отклањања грешака и научити како да спречите такве проблеме.
Вежбање: Пишемо обдукцију о претходном случају и разговарамо о томе са говорницима.
5. ДАН: АМА сесија, одговори на питања
АМА сесија и одговори на питања о претходним темама.
Отвара се приступ 3. теоријском модулу:
Заштита саобраћаја и испуштање канаринца
У трећем модулу анализираћемо случај посвећен проблему животне средине (биће детаљна анализа здравља Провера), а такође ћемо корак по корак анализирати како имплементирати СРЕ у компаније и научити искуства компанија у којима раде говорници интензиван
Тема 5: Провера здравља
- Провера здравља у Кубернетесу
- Да ли је наша служба још увек жива?
- Екец сонде
- ИнитиалДелаиСецондс
- Секундарна здравствена лука
- Бочни здравствени сервер
- Хеадлесс Пробе
- Хардверска сонда
Тема 6: Методе примене
Тема 7: Укључивање у СРЕ пројекат
Велике компаније често формирају посебан СРЕ тим, који преузима услуге других одељења за подршку. Али није свака услуга спремна да буде прихваћена за подршку. Рећи ћемо вам које захтеве мора да испуни. Говорници ће такође поделити своја искуства, како су имплементирали СРЕ и које грешке су направили.
6. ДАН: анализа пракси и случајева
Решење за случај 4: постоји проблем са околином, немогуће је купити карте.
Задатак Хеалтхцхецк-а је да открије покварену услугу и блокира саобраћај ка њој. А ако мислите да је за ово довољно да поднесете захтев сервису са роот-ом и добијете одговор, онда ви грешите: чак и ако услуга одговори, то не гарантује њен рад - могу настати проблеми околина.
Кроз овај случај ћете научити како да конфигуришете исправну проверу здравља и не дозволите да саобраћај иде тамо где се не може обрадити.
Резимирајући