Amazon Comprehend IDP – PDF, 워드 문서 및 이미지를 처리 기능 출시
Amazon Comprehend IDP – PDF, 워드 문서 및 이미지를 처리 기능 출시 오늘 지능형 문서 처리(IDP)를 위한 새로운 Amazon Comprehend 기능을 발표합니다. 이 기능을 사용하면 텍스트를 먼저 추출하지 않고도 Amazon Comprehend에서 직접 PDF 문서, Microsoft Word 파일 및 이미지에서 엔터티를 분류하고 추출할 수 있습니다. 많은 고객은 스캔한 영수증 이미지나 PDF 형식의 세금 내역서와 같이 반구조화된 형식의 문서를 처리해야 합니다. 오늘날까지 이러한 고객은 우선 광학 문자 인식(OCR) 도구를 사용하여 해당 문서를 사전 처리하고 텍스트를 추출해야 했습니다. 그런 다음 Amazon Comprehend를 사용하여 사전 처리된 파일에서 항목을 분류하고 추출할 수 있었습니다. 이제 IDP용 Amazon Comprehend를 통해 고객은 단일 API 호출로 일반 텍스트 문서뿐만 아니라 PDF, docx, PNG, JPG 또는 TIFF 이미지와 같은 반구조화된 문서를 처리할 수 있습니다. 이 새로운 기능은 OCR과 Amazon Comprehend의 기존 자연어 처리(NLP) 기능을 결합하여 문서에서 항목을 분류하고 추출합니다. 사용자 지정 문서 분류 API를 사용하면 문서를 범주 또는 클래스로 구성할 [ more… ]