amazon web service
Amazon Polly, 신경망 기반 텍스트 투 스피치 및 뉴스캐스터 스타일 도입
Amazon Polly, 신경망 기반 텍스트 투 스피치 및 뉴스캐스터 스타일 도입 Amazon Polly는 텍스트를 사실과 같은 음성으로 변환하는 관리형 서비스로, 이를 통해 고객은 말하는 애플리케이션을 생성하고 음성을 지원하는 제품의 새로운 범주를 구축할 수 있습니다. 기계 학습 전문 지식을 학습하지 않고도, API를 호출하기만 하면 작업을 마칠 수 있습니다! 이후로 Polly 팀은 정기적으로 새 음성을 추가하였고, 현재 총 29개 언어로, 59개 음성을 지원합니다. 오늘 신경망 기반 텍스트 투 스피치(TTS) 및 획기적인 뉴스캐스터 스타일과 같은 두 가지 주요 신규 기능을 소개해 드릴까 합니다. NTTS(신경망 기반 텍스트 투 스피치) 새로운 기계 학습 접근 방식을 통해 NTTS는 음성 품질에서 큰 개선을 이루었습니다. 인간 음성에 보다 가까운 사실적인 음성을 합성하는 데 중요한 두 가지 요소, 자연스러움과 감정 표현 능력이 향상되었습니다. 다음은 예상 가능한 품질에 대한 예제입니다. 현재 NTTS는 실시간 및 배치 모드 모두에서 11개 음성을 지원합니다. 모든 영국식 영어 음성 3개: Amy, Emma, Brian. 모든 미국식 [ more… ]