고성능 모델 훈련용 Amazon EC2 Trn1 인스턴스 정식 출시
고성능 모델 훈련용 Amazon EC2 Trn1 인스턴스 정식 출시 딥 러닝(DL) 모델은 지난 몇 년 동안 규모와 복잡성이 증가하면서 훈련 시간이 며칠에서 몇 주로 늘어났습니다. GPT-3 규모의 대형 언어 모델을 훈련하는 데 몇 개월이 걸리므로 훈련 비용이 기하급수적으로 증가할 수 있습니다. 모델 훈련 시간을 단축하고 기계 학습(ML) 실무자가 빠르게 반복할 수 있도록 AWS는 칩, 서버 및 데이터 센터 연결 전반을 혁신해왔습니다. AWS re:Invent 2021에서 AWS Trainium 칩으로 구동되는 Amazon EC2 Trn1 인스턴스의 미리 보기를 발표한 바 있습니다. AWS Trainium은 고성능 딥 러닝 훈련에 최적화되어 있으며, AWS Inferentia에 이어 AWS에서 개발한 2세대 ML 칩입니다. 오늘 Amazon EC2 Trn1 인스턴스를 정식 출시한다는 소식을 발표하게 되어 기쁩니다! 이러한 인스턴스는 자연어 처리, 이미지 인식 등과 같은 광범위한 애플리케이션에서 복잡한 DL 모델을 대규모로 분산하여 훈련하는 데 매우 적합합니다. Amazon EC2 P4d 인스턴스와 비교하면, Trn1 인스턴스는 BF16 데이터 형식의 경우 1.4배의 teraFLOP, TF32 데이터 형식의 경우 [ more… ]