Amazon Kinesis 비디오 스트림 및 Amazon SageMaker를 사용한 실시간 대규모 영상 분석
오늘은 Amazon Kinesis Video Streams Inference Template(KIT) for Amazon SageMaker의 기능에 대해 소개합니다. 이 기능은 고객이 Kinesis 비디오 스트림을 Amazon SageMaker 엔드포인트에 몇 분 만에 연결할 수 있습니다. 따라서 서비스를 통합하기 위해 다른 라이브러리를 사용하거나 맞춤형 소프트웨어를 작성하지 않고도 실시간 추론이 가능합니다.
KIT는 Docker 컨테이너로 패키징된 Kinesis Video Client Library 소프트웨어와 필요한 모든 AWS 리소스의 배포를 자동화하는 AWS CloudFormation 템플릿으로 구성됩니다. Amazon Kinesis Video Streams는 오디오, 비디오 및 관련 메타데이터를 분석, ML(기계 학습), 재생 및 기타 처리를 목적으로 연결된 디바이스에서 AWS로 쉽고 안전하게 스트리밍해 줍니다. Amazon SageMaker는 개발자와 데이터 과학자가 ML 모델을 쉽고 빠르게 구축하고 학습시키고 배포할 수 있게 해 주는 관리형 플랫폼입니다.
고객은 주택 보안 카메라, 엔터프라이즈 IP 카메라, 교통 카메라, AWS DeepLens, 휴대폰 등의 소스로부터 오디오 및 비디오 피드를 Kinesis Video Streams로 수집합니다. 스마트 홈부터 스마트 시티에 이르기까지, 지능형 제조업부터 소매업에 이르기까지, 다양한 업종에 걸쳐 개발자와 데이터 과학자는 AWS 클라우드에서 이러한 비디오 피드를 분석하기 위해 자신의 기계 학습 알고리즘을 배포하려고 합니다.
이러한 고객들은 Kinesis Video Streams를 최소한의 운영 오버헤드로 확장 가능한 실시간 ML 기반 비디오 분석 파이프라인을 구축할 수 있도록 Amazon SageMaker 엔드포인트에 안정적으로 연결할 수 있는 솔루션을 원합니다.
이 블로그 게시물에서는 이 새로운 기능을 소개하고 Kinesis Video Streams Client Library와 CloudFormation 템플릿의 기능을 설명합니다. 또한 Kinesis Video Streams를 Amazon SageMaker using KIT에 통합하는 과정을 단계별로 보여 주는 예제를 제공합니다.
Kinesis Video Streams와 기계 학습 기반 분석
Amazon Kinesis Video Streams는 re:Invent 2017에서 출시되었습니다. 출시 당시 이미 Amazon Rekognition Video와 통합되어 안면 메타데이터의 프라이빗 데이터베이스를 사용한 실시간 안면 인식을 손쉽게 수행할 수 있는 기능을 지원했습니다. 이 이전 블로그 게시물에서는 안면 인식 기능을 사용하여 Amazon Kinesis Video Streams와 Amazon Rekognition Video를 사용한 하이엔드 소비자 환경을 제공하는 방법을 자세히 설명했습니다.
고객이 Kinesis Video Streams를 사용하여 다양한 비디오 피드를 수집함에 따라 사용 사례, 학습 데이터 세트, 수행하는 추론 유형도 다양해집니다. 일례로 한 유수의 주택 보안 업체는 Kinesis Video Streams를 사용하여 주택 보안 카메라에서 오디오와 비디오를 수집하고자 했습니다. 그런 다음 Amazon SageMaker에서 실행 중인 자체적인 맞춤형 ML 모델을 연결하여 반려동물과 물체를 탐지하여 더 풍부한 사용자 경험을 만들어냅니다. 한 매장 내 물리적 소매에 대한 인텔리전스를 제공하는 업체는 매장 내에 설치된 카메라에서 비디오를 스트리밍하여 Amazon SageMaker를 사용한 맞춤형 사람 수 세기 모델을 학습시키고자 했습니다. 이를 통해 매장의 쇼핑객 수를 추정하는 실시간 추론을 수행하여 매장 운영에 필요한 정보를 얻을 수 있습니다.
KIT를 사용하여 Amazon SageMaker와 Kinesis 비디오 스트림 통합
이제 Amazon SageMaker의 KIT를 구성하는 두 가지 구성 요소에 대해서 설명하겠습니다.
이 소프트웨어는 실시간 Kinesis Video Streams GetMedia API 작업을 사용하여 스트림에서 미디어 조각을 가져오고 미디어 조각을 구문 분석하여 H264 청크를 추출하며 디코딩이 필요한 프레임을 샘플링한 후 Amazon SageMaker 엔드포인트를 호출하기 전에 I-프레임을 디코딩하여 JPEG/PNG와 같은 이미지 형식으로 변환합니다. Amazon SageMaker에서 호스팅되는 모델이 추론을 반환하면 KIT는 그 결과를 캡처하여 Kinesis 데이터 스트림에 게시합니다. 그러면 고객이 그 결과를 AWS Lambda와 같은 유용한 서비스에 활용할 수 있습니다. 마지막으로, 이 라이브러리는 고객이 대시보드를 구축하고 프로덕션 환경에 배포되는 임계값을 모니터링하고 경보를 발생시킬 수 있도록 다양한 지표를 Amazon CloudWatch에 게시합니다.
CloudFormation 템플릿은 먼저, Docker 컨테이너에서 호스팅되는 라이브러리 소프트웨어를 실행하는 AWS Fargate 컴퓨팅 엔진을 사용하여 Amazon Elastic Container Services(ECS) 클러스터를 생성합니다.
또한 Fargate Tasks 및 Amazon Kinesis Data Streams에서 실행되며 Amazon SageMaker에서 생성된 추론 출력을 캡처하는 여러 작업자에 걸쳐 체크포인트와 관련 상태를 유지 관리하기 위해 Amazon DynamoDB 테이블을 스핀업합니다. 그 뿐만 아니라 전체 인프라를 모니터링하기 위한 필수 AWS Identity and Access Management(IAM) 정책과 Amazon CloudWatch 리소스도 생성합니다. KIT for Amazon SageMaker는 이미지 데이터를 받는 모든 Amazon SageMaker 엔드포인트와 호환됩니다. 고객은 필요에 따라 구체적인 사용 사례에 맞게 템플릿을 수정할 수 있습니다.
KIT 설정 방법
사전 조건
- AWS CLI(명령줄 인터페이스) 설치 및 구성
- CLI 액세스 권한과 Kinesis Video Streams로 비디오를 스트리밍할 권한이 부여된 IAM 사용자 생성
- Kinesis 비디오 스트림 생성
- Kinesis Video Producer 설정
- Amazon SageMaker 추론 엔드포인트 생성
KIT는 객체 탐지 알고리즘을 사용하여 Amazon SageMaker 예제 중 하나의 예측 출력을 처리하도록 작성된 맞춤형 Lambda 함수가 사전에 번들로 구성된 상태로 제공됩니다. https://github.com/awslabs/amazon-sagemaker-examples/blob/master/introduction_to_amazon_algorithms/object_detection_pascalvoc_coco/object_detection_image_json_format.ipynb
KIT 배포를 위한 단계별 지침
- CloudFormation을 통해 웹 사이트 구축
- CloudFormation은 템플릿으로부터 반복해서 인프라 리소스를 구축할 수 있게 해 주는 강력한 Infrastructure-as-Code 도구입니다.
- 이 도구가 없는 경우 AWS 계정에 로그인하십시오. 이미 로그인되어 있는 경우 다음 URL을 통해 2단계를 진행하십시오.
https://xxxxxxxxxxxx.signin.aws.amazon.com/console 앞부분의x는 12자리 숫자로 된 여러분의 계정ID로 대체합니다. - AWS Services 검색 표시줄에서 CloudFormation을 선택합니다.
- 이 위치에서 대상 리전에 대한 [CloudFormation Template]을 선택합니다.
- 스택의 이름을 지정하고 파라미터를 채운 후 Next를 선택합니다.
- AppName – 모든 리소스를 생성하는 데 사용되는 고유한 애플리케이션 이름
- DockerImageRepository – Kinesis Video Streams 및 SageMaker 드라이버용 Docker 이미지
- EndPointAcceptContentType – 현재 SageMaker 엔드포인트를 호출하는 데 지원되는 image/jPEG 또는 image/png 이미지 형식
- LambdaFunctionBucket – 맞춤형 Lambda 함수의 Amazon S3 버킷 위치
- LambdaFunctionKey – 맞춤형 Lambda 함수 코드 zip 파일의 Amazon S3 객체 키
- SageMaker Endpoint – 기계 학습 모델을 호스팅하는 Amazon SageMaker 엔드포인트
- StreamNames – 스트림 이름을 지정하는 문자열의 CSV 목록
- TagFilters – 태그 필터의 JSON 문자열
- Options 페이지의 파라미터를 기본값으로 두고 Next를 선택합니다.
- Review의 구성 정보를 검토하고 IAM 역할 생성을 확인하는 Acknowledge 확인란을 선택한 후 Create를 선택합니다.
- 이 도구가 없는 경우 AWS 계정에 로그인하십시오. 이미 로그인되어 있는 경우 다음 URL을 통해 2단계를 진행하십시오.
솔루션 확장
사용 사례에 맞춰 Lambda 함수를 업데이트하고 다른 AWS 서비스와 통합하는 방식으로 이 솔루션을 확장할 수 있습니다.
이 예에서는 Kinesis 비디오 조각을 검색하여 탐지 데이터와 함께 Amazon S3 버킷에 저장합니다.
- Amazon S3 버킷을 생성합니다.
- 올바른 버킷 이름과 Kinesis 비디오 스트림 ARN으로 바꾸어 다음 추가 권한을 AWS Lambda Execution 역할에 추가합니다. 이 추가 권한은 AWS Lambda가 Kinesis 비디오 스트림에서 조각을 검색하여 S3 버킷에 쓸 수 있도록 합니다.
- 다음 코드에서 <<YOUR BUCKET>>을 Lambda 함수 코드로 바꾸십시오.
비디오 조각과 탐지 세부 정보가 있는 S3 버킷
다음 스크린샷에는 Amazon S3 버킷으로 탐지된 비디오 조각과 해당 추론을 내보내는 KIT for Amazon SageMaker가 나와 있습니다.
처리된 출력을 보여 주는 AWS Lambda 함수 로그
이 솔루션은 다양한 사용 사례에 맞추어 확장할 수 있습니다. 예를 들어 Computer Vision OpenCV 라이브러리와 Amazon SageMaker 예측 세부 정보를 결합하여 경계 상자를 비디오 프레임의 탐지된 객체에 추가하고 실시간 알림 포털에 공급할 수 있습니다.
KIT에서 관리되는 인프라스트럭처 모니터링
이 라이브러리 소프트웨어는 고객이 개별 스트림을 처리하는 작업의 진행률을 모니터링할 수 있는 다양한 CloudWatch 지표를 기본적으로 제공합니다. 여기에는 클러스터에서 작업자의 리소스 소비량, Amazon SageMaker 엔드포인트가 호출되는 속도, Kinesis Data Stream에 추론 결과가 게시되는 방식을 결정하는 지표가 포함됩니다. CloudFormation 템플릿은 고객이 바로 사용할 수 있는 CloudWatch 대시보드를 생성하여 솔루션의 용도를 확장할 수 있도록 합니다. 기본적으로 이 대시보드는 KIT의 기반 서비스에 대한 주요 지표와 지연 시간, 안정성 및 확장성 특성에 대한 맞춤형 지표를 캡처합니다.
CloudWatch 대시보드 – KIT 지표
마치면서
이제 여러분은 KIT for Amazon SageMaker를 사용하여 실시간 ML 기반 미디어 스트림 처리를 높은 안정성과 확장성을 지니면서도 구현은 단순화 할 수 있습니다. 고객은 모든 Kinesis 비디오 스트림을 Amazon SageMaker 엔드포인트에 연결하여 최소한의 운영 오버헤드로 ML 기반 사용 사례를 지원할 수 있습니다. 이 기능에 대한 자세한 내용은 설명서를 참조하십시오. 앞으로 모든 개발자가 사용 사례에 맞추어 더 효과적으로 맞춤화할 수 있도록 고객 피드백에 따라 향상된 기본 Kinesis Video Client Library 소프트웨어를 꾸준히 발표할 예정입니다.
이 글은 AWS Machine Learning Blog의 Analyze live video at scale in real time using Amazon Kinesis Video Streams and Amazon SageMaker의 한국어 번역으로 정도현 AWS 테크니컬 트레이너가 감수하였습니다.
Source: Amazon Kinesis 비디오 스트림 및 Amazon SageMaker를 사용한 실시간 대규모 영상 분석