새로운 기능 – Amazon SageMaker 관리형 데이터 병렬 처리를 통해 대규모 데이터 세트 훈련 간소화
새로운 기능 – Amazon SageMaker 관리형 데이터 병렬 처리를 통해 대규모 데이터 세트 훈련 간소화 오늘 Amazon SageMaker가 수백 또는 수천 기가바이트의 데이터 세트에 대한 모델을 더 쉽게 훈련할 수 있는 새로운 데이터 병렬 처리 라이브러리를 지원한다는 것을 발표하게 되어 기쁩니다. 데이터 세트와 모델이 점점 커지고 정교해짐에 따라 대규모 분산 훈련 작업을 수행하는 기계 학습(ML) 실무자는 Amazon Elastic Compute Cloud (EC2) p3 및 p4 인스턴스와 같은 강력한 인스턴스를 사용하는 경우에도 점점 더 긴 훈련 시간에 직면해야 합니다. 예를 들어 8개의 NVIDIA V100 GPU가 장착된 ml.p3dn.24xlarge 인스턴스를 사용하면 공개적으로 사용 가능한 COCO 데이터 세트에 대한 마스크 RCNN 및 빠른 RCNN과 같은 고급 물체 감지 모델을 훈련하는 데 6시간이 걸립니다. 마찬가지로, 최첨단 자연어 처리 모델인 BERT 훈련은 동일한 인스턴스에서 100시간 이상 걸립니다. 자율 주행 차량 회사와 같은 일부 고객은 대규모 GPU 클러스터에서 며칠 동안 실행되는 대량의 훈련 작업을 일상적으로 처리합니다. 상상할 수 [ more… ]