Amazon Transcribe 정식 출시 – 자동 음식 인식 서비스
Amazon Transcribe 정식 출시 – 자동 음식 인식 서비스 지난 AWS re:Invent 2017에서 기계 학습 기반 자동 음성 인식 서비스인 Amazon Transcribe를 미리 보기로 발표했습니다. 오늘 모든 개발자를 위해 정식 출시합니다. Amazon Transcribe는 개발자가 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있도록 해주는 ASR(자동 음성 인식) 서비스입니다. 프리뷰에서는 고객의 피드백을 다시 한번 적용하여 Amazon Transcribe에 다양한 향상 기능을 추가했습니다. 새로운 Amazon Transcribe 기능 먼저 SampleRate 파라미터를 선택사항으로 만들었습니다. 따라서 사용자는 미디어의 파일 유형과 입력 언어만 알면 됩니다. 두 가지 새로운 기능, 즉 오디오에서 여러 명의 화자를 구분하여 이해하기 쉽게 자막을 제공(“누가 언제 말하는지 구분”)하는 기능과 제품 이름, 업계 전문 용어 또는 개인의 이름에 대한 음성 인식의 정확도를 높이기 위한 맞춤형 어휘 기능이 추가되었습니다. 간단한 예제를 통해 Amazon Transcribe의 작동 방식을 다시 한번 살펴보겠습니다. S3 버킷에서 이 오디오를 변환하겠습니다. import boto3 transcribe = boto3.client("transcribe") transcribe.start_transcription_job( TranscriptionJobName="TranscribeDemo", LanguageCode="en-US", MediaFormat="mp3", Media={"MediaFileUri": "https://s3.amazonaws.com/randhunt-transcribe-demo-us-east-1/out.mp3"} [ more… ]