Problém s Azure Active Directory způsobil v pondělí večer výpadek celé řady cloudových služeb Microsoftu. V Česku uživatelé zaznamenávali zejména nefunkčnost komunikační platformy Microsoft Teams či nemožnost přihlášení do Microsoft 365, nicméně s potížemi se potýkaly i další služby.
Oficiální stránka Stav Azure signalizovala problémy v rámci online kancelářské sady Office 365, Dynamics, Xbox Live, Intune, PowerBI, Outlook.com, Exchange Online, Microsoft Forms, SharePoint Online a Azure Portal. K celosvětovému výpadku došlo v pondělí 15. března přibližně v osm hodin večer našeho času a jeho příčinou byly problémy s autentizací.
Výpadek cloudových služeb Microsoftu
Microsoft uvádí, že se zákazníci mohli setkat s nejrůznějšími chybami „při provádění ověřovacích operací pro všechny aplikace Microsoft i třetích stran, které jsou při ověřování závislé na Azure Active Directory (AAD).“
Výpadek ovlivnil také další weby Microsoftu – uživatelé například hlásili nemožnost přihlásit se na stránky Tech Community. Na dalších službách se uživatelům po přihlášení zobrazovaly nejrůznější chyby, případně se jim nedařilo přihlásit vůbec.
Jako první byly zprovozněny aplikace Azure Portal, Microsoft Teams, Exchange, Azure Key Vault a SharePoint. Některé další služby však byly ještě v úterý ráno v procesu obnovy a postižení zákazníci by měli být informováni po zajištění jejich dostupnosti.
Chyba spočívala ve smazaném klíči
Předběžná analýza incidentu ukazuje, že došlo k chybě při rotaci klíčů používaných k podpoře otevřeného standardu autentizace OpenID v rámci Azure AD a „dalších standardních protokolů pro ověření identity v kryptografických podpisových operacích“.
Automatizovaný systém v rámci tohoto procesu v určitém intervalu odstraňuje klíče, které se již nepoužívají. Bohužel došlo k tomu, že jeden z klíčů, který měl zůstat aktivní, byl tímto procesem odebrán. Následně aplikace, využívající tyto protokoly ve službě Azure AD, přestaly důvěřovat tokenům podepsaným odstraněným klíčem.
Ve 22:05 našeho času došlo k odhalení příčiny a navrácení klíčových metadat do předchozího stavu. Následně s tím, jak aplikace znovu prováděly ověření, docházelo k jejich postupnému zprovozňování. Zbývající aplikace, jako jsou Účty úložiště, byly ještě v úterý dopoledne v procesu obnovy.