고성능 컴퓨팅(HPC)용 Amazon EC2 Hpc6a 인스턴스 출시
고성능 컴퓨팅(HPC)를 통해 과학자와 엔지니어는 전산 유체 역학 (CFD), 일기 예보 및 유전체학과 같은 복잡하고 컴퓨팅 집약적인 문제를 해결할 수 있습니다. HPC 애플리케이션에는 일반적으로 높은 메모리 대역폭, 짧은 지연 시간, 고대역폭 네트워크 상호 연결 및 고속 병렬 파일 시스템에 대한 액세스를 갖춘 인스턴스가 필요합니다.
많은 고객이 HPC 워크로드를 실행하기 위해 AWS를 선택했습니다. 예를 들어 Descartes Labs는 AWS를 사용하여 1.93 PFLOPS를 제공하는 TOP500 LINPACK 벤치마킹(가장 강력한 상용 컴퓨터 시스템) 실행을 지원하여 2019년 6월 TOP500 목록에서 136위를 차지했습니다. 이 실행은 Amazon EC2 C5 인스턴스 클러스터에서 41,472 코어를 사용했습니다. 작년에 Descartes Labs는 LINPACK 벤치마크를 다시 실행하여 EC2 인스턴스 클러스터에 172,692개의 코어로 2021년 6월 TOP500 목록에서 상위 40위 안에 들었습니다. 이는 단 2년 만에 417%의 성능 향상을 나타냅니다.
AWS를 사용하면 클라우드에서 HPC를 실행하고 대부분의 온프레미스 환경에서는 실용적이지 않은 수만 개의 병렬 작업으로 확장하여 연구 속도를 높이고 결과 도출 시간을 단축할 수 있습니다. AWS는 CPU, GPU 및 온디맨드 FPGA 인스턴스, Elastic Fabric Adapter(EFA), 처리량을 개선하고 긴밀하게 연결된 워크로드를 확장하는 EC2 네트워크 디바이스를 제공하여 비용을 절감할 수 있도록 지원합니다. AWS ParallelCluster는 AWS에서 HPC 클러스터를 쉽게 배포하고 관리할 수 있게 해 주는 오픈 소스 클러스터 관리 도구입니다.
HPC 워크로드용 EC2 Hpc6a 인스턴스 발표
오늘날 다양한 업종의 고객은 컴퓨팅 최적화 EFA 지원 Amazon EC2 인스턴스 (예: C5n, R5n, M5n 및 M5zn)를 사용하여 다양한 HPC 워크로드의 성능을 극대화하지만 이러한 워크로드는 수만 개의 코어에서 비용 효율성이 점점 더 중요해지고 있습니다. 고객은 HPC 워크로드의 성능을 최적화하는 것뿐만 아니라 비용도 최적화하기를 원한다는 사실을 발견했습니다.
2021년 11월에 사전 발표한 바와 같이, HPC에 최적화된 새로운 EC2 인스턴스인 Hpc6a는 오늘부터 정식 출시되었습니다. 이 인스턴스는 EFA를 통해 384GB RAM의 96개의 3세대 AMD EPYC
Hpc6a 인스턴스는 오늘 미국 동부(오하이오) 및 GovCloud(미국 서부) 리전에서 온디맨드 및 전용 호스팅으로 시작하거나 Savings Plan 일부로 시작할 수 있습니다. 자세한 사양은 다음과 같습니다.
인스턴스 이름 | CPU* | RAM | EFA 네트워크 대역폭 | 연결된 스토리지 |
hpc6a.48xlarge | 96 | 384GiB | 최대 100Gbps | EBS 전용 |
*Hpc6a 인스턴스는 HPC 코드를 최적화하기 위해 동시 멀티스레딩을 비활성화합니다. 즉, 다른 EC2 인스턴스와 달리 Hpc6a vCPU는 스레드가 아니라 물리적 코어입니다.
예측 가능한 스레드 성능과 HPC 워크로드의 효율적인 스케줄링을 가능하게 하기 위해 동시 멀티스레딩이 비활성화됩니다. AWS Nitro System 덕분에 하이퍼바이저에 대한 코어가 보류되지 않아 코드에서 모든 코어를 사용할 수 있습니다.
Hpc6a 인스턴스는 높은 수준의 인스턴스 간 통신에 의존하여 긴밀하게 연결된 HPC 워크로드를 실행하는 고객을 위해 비용 및 성능 최적화를 제공하기 위해 다양한 대상 기능을 도입합니다. 이러한 인스턴스는 100Gbps의 EFA 네트워킹 대역폭을 지원하며 단일 가용 영역 내에서 긴밀하게 연결된 대규모 클러스터를 효율적으로 확장하도록 설계되었습니다.
자동차 분야와 같은 많은 엔지니어링 고객들로부터 물리적 테스트의 필요성을 줄이고 더 낮은 비용으로 점점 더 빠르게 가상 시뮬레이션 기반 제품 설계 프로세스로 나아가고 싶다는 의견을 들었습니다.
Siemens Simcenter STAR-CCM+ 자동차 CFD 시뮬레이션에 대한 벤치마킹 결과에 따르면, Hpc6a가 EFA 네트워킹을 통해 최대 400개의 노드(약 40,000코어)까지 확장할 때 약 100%의 확장 효율성을 유지할 수 있습니다. Hpc6a 인스턴스는 c5n에 비해 비용이 70% 저렴하므로 기업은 Hpc6a 인스턴스를 사용할 때 새로운 설계를 더 빠르고 저렴한 비용으로 제공할 수 있습니다. 즉, 기업은 Hpc6a 인스턴스를 사용할 때 더 저렴한 비용으로 새로운 설계를 더 빠르게 제공할 수 있습니다.
AMD EPYC 3세대(Milan) 프로세서와 함께 Hpc6a 인스턴스를 사용하여 EC2에서 가장 크고 복잡한 HPC 시뮬레이션을 실행하고 비용과 성능을 최적화할 수 있습니다. 또한 고객은 AWS Batch 및 AWS ParallelCluster와 함께 새로운 Hpc6a 인스턴스를 사용하여 워크로드 제출 및 클러스터 생성을 간소화할 수 있습니다.
자세히 알아보려면 Hpc6a 인스턴스 페이지를 방문하여 HPC 팀인 AWS re:Post for EC2에 문의하거나 일반 AWS Support 연락처를 통해 문의하십시오.
— Channy