새로운 기능 – Amazon SageMaker Debugger 기반 기계 학습 훈련 작업 프로파일링
새로운 기능 – Amazon SageMaker Debugger 기반 기계 학습 훈련 작업 프로파일링 오늘 Amazon SageMaker Debugger가 기계 학습 모델을 프로파일링하여 하드웨어 리소스 사용으로 인한 훈련 문제를 훨씬 쉽게 식별하고 수정할 수 있음을 발표하게 되어 매우 기쁩니다. 다양한 비즈니스 문제에 대해 인상적인 성능을 발휘하고 있지만 기계 학습(ML)은 여전히 신비한 주제입니다. 이를 바로 잡는 것은 과학, 장인 정신(일부는 마법사라고 말할 것입니다), 때로는 행운의 연금술입니다. 특히 모델 훈련은 데이터 세트의 품질, 알고리즘, 파라미터 및 훈련 중인 인프라에 따라 결과가 달라지는 복잡한 프로세스입니다. 딥 러닝처럼 ML 모델이 점점 더 커지고 복잡해짐에 따라, 점점 대두되고 있는 문제는 모델을 훈련시키는 데 필요한 인프라의 양입니다. 예를 들어, 공개적으로 사용 가능한 COCO 데이터 세트에 대한 BERT 훈련은 8개의 NVIDIA V100 GPU가 있는 단일 p3dn.24xlarge 인스턴스에서 6시간 이상 걸립니다. 자율 주행 차량 회사와 같은 일부 고객은 훨씬 더 큰 데이터 세트를 처리하고 며칠 동안 물체 감지 모델을 훈련합니다. 복잡한 [ more… ]