AWS Well-Architected 플레이북 및 런북 자동화를 통한 운영 우수성 확보 방법
AWS Well-Architected 플레이북 및 런북 자동화를 통한 운영 우수성 확보 방법 IT 분야에서 서비스 운영을 준비하는 과정 중에 중요한 부분 중에 하나는 다양한 시나리오에 대해서 신속하게 대응하고 정확하게 작업을 실행하기 위해 미리 정의된 프로세스를 갖추는 것입니다. 운영 중에 발생하는 문제를 관리하고 대응하기 위해 AWS Well-architected 플레이북(Playbook)과 런북(Runbook)을 활용 할 수 있습니다. 플레이북은 장애에 영향을 미친 원인을 조사하고 식별하기 위해 수행되는 프로세스를 문서화한 것이고, 런북은 문제 해결하기 위해 필요한 조치들을 정의한 것입니다. 이들 플레이북과 런북은 간단하게 수동으로 수행할 수도 있습니다. 예를 들어, 장애가 발생하면 엔지니어가 알림을 받고 문제 해결을 위해 애플리케이션의 로그와 여러 지표들을 분석합니다. 시간이 지남에 따라 엔지니어는 문제에 대해 더 잘 이해하게 되고 문제 해결을 위해 보다 효율적인 조사 경로를 만들어낼 수 있습니다. 하지만, 관리해야할 환경의 규모가 커진다면 수동으로 플레이북과 런북을 지속적으로 수행하는 것은 쉽지 않습니다. 다음은 플레이북 및 런북을 수동으로 수행할 때의 몇 가지 단점들입니다. 단일 장애점 (SPoF, Single [ more… ]