Amazon Transcribe를 이용한 자동 자막 생성하기

2018-05-10 KENNETH 0

Amazon Transcribe를 이용한 자동 자막 생성하기 Amazon Transcribe는 딥러닝을 통한 자동 음성 인식(Automatic Speech Recognition, ASR)위한 기계 학습 애플리케이션 서비스로서, 지난 4월에 일반 사용자들에게 정식 출시하였습니다. 현재는 영어와 스페인어의 음성 파일에 대한 인식을 지원하며, 최대 2시간까지 동시에 2개의 작업을 지원합니다. 가능한 한 빠르게 추가 언어에 대한 지원을 제공할 예정입니다. 이 글에서는 Amazon Transcribe를 이용하여 서버리스 기반으로 자동으로 자막을 생성하는 애플리케이션을 구성하는 방법을 소개 드립니다. 자동 자막 생성 애플리케이션의 서비스 구성 요소 및 샘플 아키텍처는 다음과 같습니다. Amazon S3 – 정적 홈페이지를 호스팅 하여, 간단한 파일 업로드를 수행합니다. AWS Lambda 함수 – 인식 요청 및 작업 상태 및 자막 변환을 수행합니다. Transcribe Request Check Job Status Convert to Caption Amazon Transcribe – 음성 파일에서 원하는 언어로 인식을 진행합니다. Amazon Simple Notification Service (SNS) – 작업 상태 및 완료 여부를 알려줍니다. Job in Progress Job Completed 위의 구성 요소를 통해 다음과 같은 [ more… ]

이상 탐지를 위한 Amazon SageMaker 의 Random Cut Forest 빌트인 알고리즘

2018-05-10 KENNETH 0

이상 탐지를 위한 Amazon SageMaker 의 Random Cut Forest 빌트인 알고리즘 Amazon SageMaker에서 새로운 빌트인 알고리즘으로 Random Cut Forest(RCF)를 사용하실 수 있습니다. RCF는 데이터셋에서 이상치(outlier)를 탐지하는 비지도 학습 알고리즘입니다. 이번 블로그에서는 이상 탐지(anomaly detection) 문제에 대해 설명하고, Amazon SageMaker의 RCF 알고리즘에 대해서도 함께 알아보겠습니다. 아울러, 실제 데이터셋을 대상으로 Amazon SageMaker의 RCF 알고리즘을 어떻게 사용하는지도 소개합니다. 이상 탐지 기술의 중요성 우리가 어느 한 도시에서 여러 개의 블럭(block)을 대상으로 일정 시간 동안 교통량에 대한 데이터를 수집했다고 가정해 봅시다. 만약 교통량이 순간 급증한 경우, 이것을 추돌 사고가 일어난 것으로 볼 것인지 또는 통상 일어나는 러시 아워(rush hour) 상태로 볼 것인지 예측할 수 있을까요? 또 교통량 순간 급증 현상이 한 블럭에서만 일어난 것인지, 여러 블럭에서 일어난 것인지 여부도 중요할까요? 한편 (IT 비즈니스 영역에서 많이 다루는 문제인) 클러스터를 구성하는 서버들 간의 네트워크 트래픽에 대해서도 생각해볼 수 있습니다. 이를테면 인프라가 디도스(DDOS, 분산 서비스 거부) 공격을 받는 [ more… ]

떠오르는 인공 지능 스타트업 소개 – 뷰노, 매스프레소, 42마루, 액션파워, 엘리스

2018-05-09 KENNETH 0

떠오르는 인공 지능 스타트업 소개 – 뷰노, 매스프레소, 42마루, 액션파워, 엘리스 AWS는 스타트업을 사랑합니다! 세상을 변화시키기 위한 열정과 창의력으로 새롭고 흥미 진진한 비즈니스를 만들어 가는 스타트업을 위해 AWS는 다양한 프로그램을 제공하고 있습니다. 멋진 서비스로 국내외에서 주목 받고 있는 스타트업 서비스와 그들이 AWS를 어떻게 활용하고 있는 지에 대해 전해 드립니다. (해외의 주요 스타트업은 영문 블로그 시리즈를 참고하세요.) 이번에는 특별히 지난 AWS AI Startup Challenge에서 대상과 우수상을 수상한 미래가 기대되는 인공 지능 특화 스타트업 5곳을 소개 드립니다! 뷰노 – 딥러닝 기반의 골연령 판독 소프트웨어 및 의료기기 매스프레소(서비스명 콴다) – 자체 OCR 기술로 자동 수학문제 풀이를 제공하는 플랫폼 42마루 – 대화형 인터페이스를 위한 딥 시맨틱 Q&A 솔루션 액션파워(서비스명 리뷰와이저) – 음성파일을 텍스트로 자동변환해주는 솔루션 엘리스 – 소셜러닝과 AI 기술을 접목한 소프트웨어 교육 플랫폼 VUNO Med – BoneAge를 통해 여러분의 뼈 나이를 알아보세요! VUNO는 골연령 판독에 도움을 주는 의료기기소프트웨어로, 현재 식약처로부터 국내 최초의 AI기반 의료기기로서 [ more… ]

AWS Glue, 서울 리전 출시

2018-05-09 KENNETH 0

AWS Glue, 서울 리전 출시 AWS Glue는 고객이 분석을 위해 손쉽게 데이터를 준비하고 로드할 수 있게 지원하는 완전관리형 ETL(추출, 변환 및 로드) 서비스입니다. AWS 관리 콘솔에서 클릭 몇 번으로 ETL 작업을 생성하고 실행할 수 있습니다. 빅데이터 분석 시 다양한 데이터 소스에 대한 전처리 작업을 할 때, 별도의 데이터 처리용 서버나 인프라를 관리할 필요가 없습니다. 이번에 서울 리전에서 본 서비스를 출시하고, 데이터 분석을 위해 전처리 작업을 하시는 데이터 사이언티스트 및 개발자의 수고를 덜어드릴 수 있게 되었습니다. AWS Glue는 Amazon Aurora, Amazon RDS for Oracle, MySQL용 Amazon RDS, PostgreSQL용 Amazon RDS, SQL Server용 Amazon RDS, Amazon Redshift, Amazon S3 및 Amazon EC2의 설치한 데이터베이스 엔진에서도 데이터 소스를 받을 수 있고, Scala, Python 및 Apache Spark를 사용하여 사용자 지정 가능하고 재사용 가능하며 이동 가능한 ETL 코드를 생성할 수 있습니다. 보다 자세한 사용 방법 및 활용 사례는 아래 강연 영상이나 블로그 글을 참고하시기 바랍니다. [ more… ]

AWS 멀티 어카운트 환경을 위한 통합 로깅 방법

2018-05-09 KENNETH 0

AWS 멀티 어카운트 환경을 위한 통합 로깅 방법 중앙 집중 로깅 기능은 규정 준수와 보안 및 분석, 애플리케이션 별 필요성과 같은 다양한 이유로 일정 규모 이상의 기업에서는 반드시 고려되는 기능입니다. 단일 부서에서 관리되거나 여러 부서에서 관리되는 멀티 어카운트 환경에서는, 중앙에서 로그정보를 수집하는 로깅 전담 어카운트가 있는 것이 모범사례입니다. 이를 통해 보안팀 입장에서는 실시간으로 위험한 행위를 탐지하고 침해에 대처하는데 도움을 받을 수 있게 됩니다. 또한 로그데이터가 사고나 혹은 의도적으로 지워질 경우도 방지할 수 있습니다. 애플리케이션 운영팀 입장에서도 여러 개의 애플리케이션 티어 상에서 로그 데이터를 분석하고 연관짓는 데 도움을 받을 수 있습니다. 본 포스팅에서는 멀티 어카운트 환경에서 Amazon CloudWatch Log 데이터를 다룰 수 있는 솔루션과 구현 방법을 제공합니다. 이것은 모든 어카운트들로 부터 관련있는 Amazon CloudWatch Log 데이터 전체를 중앙의 로깅 어카운트 쪽에 모을 수 있는 환경을 구성해 주는 재활용 가능한 솔루션입니다. 솔루션 개요 본 솔루션은 Amazon Kinesis Data Streams와 로깅 어카운트 상에서 [ more… ]