Съдържание:
Въпреки най-големите ни усилия да ги избегнем, ИТ инцидентите са неизбежна част от работата - а опитите да се задържим пред прекъсването на въздействието върху бизнеса става само по-сложно. Системите днес са плътно свързани и все по-сложни и с повече движещи се части идват повече възможности нещата да се объркат.
Това е една от причините все повече организации да се обръщат към микросервизи за по-голяма достъпност на услугите и по-добра устойчивост на отказ. Но въпреки че това са чудесни предпоставки за разбиване на монолитни приложения, те също могат потенциално да компенсират риска от отказ - освен ако не са проектирани изрично с издръжливост.
Подготовка за неуспех
Като се има предвид присъщият хаотичен характер на разпределените системи, услугите трябва да се развиват не само за да се предвиди повреда, но и автоматично да се възстановят в случай на отказ. Това означава редовно подстрекаване на грешки, за да се гарантира, че системите ви могат да се справят с хаоса, без да нарушават обслужването на крайните клиенти. И за да постигнете това, се нуждаете от способността да симулирате производствен трафик в тестови среди.