AWS 활용한 Amazon Prime Day 2017 성공 사례
올해로 세번째 맞는 지난 7월 11일 프라임 데이(Prime Day) 매출은 블랙 프라이데이(Black Friday)와 사이버 먼데이(Cyber Monday)를 앞지르는 또 다른 신기록을 세웠으며, 아마존 소매 역사상 기념비적인 행사가 되었습니다. 30시간 행사 기간 동안 Prime 회원 수천만명이 Echo Dots, Fire 태블릿, 압력 쿠커, 에스프레소 머신, 충전식 배터리 등 다양한 제품들을 구입했습니다. 당일 수십만개의 저렴한 상품을 구매를 이용하기 위해 가입한 새로운 Prime 멤버십 회원수에 대한 기록도 세웠습니다. 아마존 고객은 주문을 위해 웹 사이트 뿐만 아니라 모바일 앱을 많이 사용했으며, 지난 프라임 데이 2배 이상의 모바일 주문이 있었습니다.
Powered by AWS
작년에 AWS가 Amazon의 가장 큰 이벤트를 어떻게 운영했는지에 대해 소개하면서, AWS 팀이 서버 준비, 자동화, 모니터링 등에 배웠던 것을 공유했습니다. 작년에 공유한 내용 모두 올해에도 해당되지만, 이번에 새로운 우수 사례 몇 가지를 소개하겠습니다.
작년 프라임데이가 끝나고 며칠만에 모범 사례를 수집 공유할 뿐만 아니라, 개선을 위한 부분을 확인하고 미리 프로세스 감사 및 게임 데이를 통한 테스트를 준비하였습니다.
- 프로세스 감사 – 프로세스 감사는 큰 이벤트에 앞서 준비 사항을 추적하고, 위험을 식별하고, 목표에 대한 진행 상황을 추적 할 수있는 공식적인 방법입니다. 각 서비스 팀은 준비 상태를 결정하는 데 도움이되는 일련의 상세한 기술 및 운영 질문에 응답해야 합니다. 기술 측면에서는 CNAME의 TTL(Time to Live)에 대한 중요한 검사를 포함하여 데이터베이스 장애가 발생한 후 복구 시간에 대한 질문도 있습니다. 운영 측면에서는 현장 담당 통화 직원, 비상 연락망 및 서비스 및 인스턴스 소유권에 대한 확인 등을 포함합니다.
- 게임 데이 (GameDay) – 전 아마존 직원 제시 로빈스(Jesse Robbins)가 처음 시작한 이 모범 사례는 컴퓨팅 용량 계획 및 준비를 검증하고 필요한 모든 운영 방식이 예상대로 작동하는지 확인하기 위한 테스트 이벤트입니다. 시뮬레이션 중 이슈가 있는 경우, 팀이 문제를 빨리 식별하고 신속하게 해결하고 과정에서 문제 해결을 훈련시키는 데 도움이됩니다. 또한, 장애 조치 및 복구 기능을 테스트하고 숨어있는 잠재된 결함을 노출 할 수 있습니다. 게임 데이는 각 서비스팀이 확장 과정(페이지 뷰, 주문 등)를 이해하도록 돕고 테스트 할 수있는 기회를 제공합니다. 좀 더 자세한 사항은 Resilience Engineering: Learning to Embrace Failure 문서나 GameDay: Creating Resiliency Through Destruction 동영상을 참고하시기 바랍니다.
2017 프라임 데이 통계
올해의 운영 결과에 대해 아마존닷컴을 담당하는 AWS 팀이 대시 보드 및 로그 파일을 확인하고, 주목할 만한 통계치를 공유해 주었으며, 아래는 몇 가지 흥미로운 지표입니다 :
- 블록 스토리지 – Amazon Elastic Block Store (EBS)의 사용량은 전년 대비 40 % 증가했으며 데이터 전송량은 52 페타 바이트 (50 % 증가)로 증가했으며 총 I/O 요청은 8 억 3500 만 개로 증가했습니다. (30 % 증가). 빠른 EBS의 탄력성 덕분에 프라임 데이 (Prime Day)가 끝나고 나서도 용량이 줄어들지 않았습니다.
- NoSQL 데이터베이스 – Alexa, Amazon.com 사이트 및 Amazon Fulfillment 센터의 Amazon DynamoDB 요청은 총 3 조 3400 억회로서, 피크 타임 초당 1290 만 건에 이릅니다. 서비스 팀에 따르면 DynamoDB의 빠른 확장성, 일관된 성능 및 고 가용성으로 인해 어렵지 않게 프라임 데이의 요구 사항을 충족 할 수있었습니다.
- 스택 생성 – AWS 리소스를 추가로 가져 오기 위해 Prime Day를 위해 약 31,000 개의 AWS CloudFormation 스택이 생성되었습니다.
- API 사용 횟수 – AWS CloudTrail은 5 백억 개 이상의 이벤트를 처리하고 Prime Day를 지원하는 다양한 AWS API에 대한 4190 억 회 이상의 호출을 추적했습니다.
- 구성 추적 – AWS Config는 AWS 리소스를위한 1 천 4 백만 개 이상의 구성 항목을 생성했습니다.
여러분도 할 수 있습니다!
프라임 데이 (Prime Day)만큼 크고 복잡한 중요한 이벤트를 진행하는 데는 많은 계획이 필요합니다. 이러한 유형의 이벤트를 염두에 두고 계시면, 대형 이벤트를 위한 인프라 준비하기에 대한 한국어 기술 백서를 살펴보십시오. 내부에서는 제품 출시 또는 계절적 트래픽 급증과 같은 계획된 확장성 높은 이벤트, 자동화, 탄력성, 비용 최적화, 이벤트 관리 등의 섹션을 원활하게 처리 할 수 있도록 애플리케이션을 디자인하고 프로비저닝하는 방법을 배울수있습니다.
— Jeff;
이 글은 Prime Day 2017 – Powered by AWS의 한국어 번역입니다.
Leave a Reply