새로운 기능 – Amazon SageMaker Debugger 기반 기계 학습 훈련 작업 프로파일링

2020-12-17 KENNETH 0

새로운 기능 – Amazon SageMaker Debugger 기반 기계 학습 훈련 작업 프로파일링 오늘 Amazon SageMaker Debugger가 기계 학습 모델을 프로파일링하여 하드웨어 리소스 사용으로 인한 훈련 문제를 훨씬 쉽게 식별하고 수정할 수 있음을 발표하게 되어 매우 기쁩니다. 다양한 비즈니스 문제에 대해 인상적인 성능을 발휘하고 있지만 기계 학습(ML)은 여전히 신비한 주제입니다. 이를 바로 잡는 것은 과학, 장인 정신(일부는 마법사라고 말할 것입니다), 때로는 행운의 연금술입니다. 특히 모델 훈련은 데이터 세트의 품질, 알고리즘, 파라미터 및 훈련 중인 인프라에 따라 결과가 달라지는 복잡한 프로세스입니다. 딥 러닝처럼 ML 모델이 점점 더 커지고 복잡해짐에 따라, 점점 대두되고 있는 문제는 모델을 훈련시키는 데 필요한 인프라의 양입니다. 예를 들어, 공개적으로 사용 가능한 COCO 데이터 세트에 대한 BERT 훈련은 8개의 NVIDIA V100 GPU가 있는 단일 p3dn.24xlarge 인스턴스에서 6시간 이상 걸립니다. 자율 주행 차량 회사와 같은 일부 고객은 훨씬 더 큰 데이터 세트를 처리하고 며칠 동안 물체 감지 모델을 훈련합니다. 복잡한 [ more… ]

No Image

카카오 크루의 일상을 더 이롭게 만드는 ‘플랫폼기술팀’ 이야기

2020-12-17 KENNETH 0

카카오 크루의 일상을 더 이롭게 만드는 ‘플랫폼기술팀’ 이야기 우리는 모두 채용을 통해 만나고 원하는 부서에 발령을 받아 일합니다. 스스로 업무시간을 결정하며 짧고 간결한 회의를 통해 의사결정을 하고, 업무를 하기 위한 비용 이상의 가치를 만들어 좋은 평가를 통해 보상받습니다.  영입 시스템을 통해 크루의 시작을 함께하고, 카카오의 문화 중 ‘신뢰’를 엿볼 수 있는 스스로 근무시간을 기록하는 근태 관리 시스템부터 인사/재무/총무/계정 시스템 등 카카오 일상의 중심에는 […] Source: 카카오 크루의 일상을 더 이롭게 만드는 ‘플랫폼기술팀’ 이야기

Amazon Managed Service for Grafana 미리보기 출시

2020-12-17 KENNETH 0

Amazon Managed Service for Grafana 미리보기 출시 오늘 Grafana Labs와의 제휴를 통해 Amazon Managed Service for Grafana(AMG)가 평가판으로 출시됩니다. AMG는 여러 소스의 데이터 시각화 및 분석을 위해 확장 가능하고 안전한 온디맨드 Grafana WorkSpace를 쉽게 생성할 수 있는 완전관리형 서비스입니다. Grafana는 애플리케이션에 대한 관찰 대시보드를 만드는 데 사용되는 가장 인기 있는 오픈 소스 기술 중 하나입니다. 플러그형 데이터 원본 모델을 갖추고 있으며 다양한 종류의 시계열 데이터베이스 및 클라우드 모니터링 공급업체를 지원합니다. Grafana는 여러 오픈 소스, 클라우드 및 서드 파티 데이터 원본의 애플리케이션 데이터를 중앙 집중화합니다. 많은 고객이 Grafana를 좋아하지만 이를 자체 호스팅하고 관리하는 데 따른 부담은 원하지 않습니다. AMG는 Grafana의 프로비저닝, 설정, 확장, 버전 업그레이드 및 보안 패치를 관리하므로 고객이 이러한 작업을 직접 수행할 필요가 없습니다. AMG는 자동으로 확장되어 뛰어난 가용성으로 수천 명의 사용자를 지원합니다. AMG를 사용하면 AWS, Google, Microsoft 등의 클라우드 서비스를 비롯한 여러 데이터 원본의 운영 지표, 로그 및 [ more… ]

Amazon Managed Service for Prometheus(AMP) 미리보기 출시

2020-12-17 KENNETH 0

Amazon Managed Service for Prometheus(AMP) 미리보기 출시 관찰은 대규모로 클라우드 인프라를 실행하는 데 필수적인 요소입니다. 리소스가 정상이고 예상대로 작동하며 시스템이 고객에게 원하는 수준의 성능을 제공하고 있는지 알아야 합니다. 컨테이너 기반 애플리케이션을 모니터링할 때 많은 문제가 발생합니다. 첫째로 컨테이너 리소스가 일시적이고 감시할 지표가 많기 때문에 모니터링 데이터의 카디널리티가 매우 높습니다. 쉽게 말해 고유한 값이 많아서 공간 효율적인 스토리지 모델을 정의하고 의미 있는 결과를 반환하는 쿼리를 생성하는 것이 더 어려울 수 있습니다. 둘째로 Well-Architected 컨테이너 기반 시스템은 많은 수의 구동 부분을 사용하여 구성되기 때문에 모니터링 데이터 수집, 처리 및 저장하는 것 자체가 인프라적인 문제가 될 수 있습니다. Prometheus는 활발한 개발자 및 사용자 커뮤니티를 보유한 선도적인 오픈 소스 모니터링 솔루션입니다. 컨테이너에서 수집된 시계열 데이터에 매우 적합한 다차원 데이터 모델을 가지고 있습니다. Amazon Managed Service for Prometheus(AMP) 소개 오늘 Amazon Managed Service for Prometheus(AMP)의 평가판이 출시됩니다. 이 완전관리형 서비스는 프로메테우스와 100% 호환됩니다. 동일한 지표와 [ more… ]

Updates to NGINX Unit for Autumn 2020

2020-12-17 KENNETH 0

Updates to NGINX Unit for Autumn 2020 It’s been a while since our previous update, but by no means were we sitting on our hands. In today’s blog post, we discuss the most notable features of NGINX Unit released this autumn. If you stop reading this post after the first paragraph, here’s the key takeaway: now, you can run ASGI apps, use multithreaded request processing with applications, and include regular expressions in your configuration! That being said, let’s proceed in a more orderly fashion, reviewing the new features in NGINX Unit 1.19.0 through 1.21.0. Python: ASGI Support The first major upgrade revolves around Asynchronous Server Gateway Interface (ASGI), a (relatively) new programming interface that aims to bring coherence and uniformity to servers, frameworks, and applications that use Python’s async capabilities. The interface was envisioned as a successor to the widely popular WSGI. [ more… ]