Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기

2019-08-08 KENNETH 0

Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기 EMRFS S3 최적화 커미터는 Amazon EMR 5.19.0부터 Apache Spark 작업에 사용할 수 있는 새로운 출력 커미터입니다. 이 커미터는 EMRFS(EMR 파일 시스템)을 사용하는 Amazon S3에 Apache Parquet 파일을 쓸 때의 성능을 개선합니다. 이 게시물에서는 최근 성능 벤치마크를 실행하여 신규 최적화된 커미터를 기존 커미터 알고리즘(FileOutputCommitter 알고리즘 버전 1 및 2)과 비교하여 어떻게 Spark 쓰기 성능이 개선되었는지 알아봅니다. 실제 사용 시, 제약 사항에 대해 설명하고 가능한 해결 방법을 제시해 드리고자 합니다. EMRFS S3와 FileOutputCommitter와 비교 Amazon EMR 버전 5.19.0 이하에서는 Amazon S3에 Parquet를 쓰는 Spark 작업에는 기본적으로 FileOutputCommitter라고 하는 Hadoop 커밋 알고리즘이 사용해 왔습니다. 이 알고리즘에는 버전 1과 버전 2의 두 가지 버전이 있습니다. 두 버전 모두 임시 위치에 중간 작업 출력을 쓰는 방법을 활용합니다. 그런 다음 이름 바꾸기 작업을 수행하여 작업 완료 시간에 데이터를 표시합니다. 알고리즘 버전 1에는 두 가지 [ more… ]

AWS Toolkit for IntelliJ를 통해 손쉽게 서버리스 앱 배포해 보기

2019-08-08 KENNETH 0

AWS Toolkit for IntelliJ를 통해 손쉽게 서버리스 앱 배포해 보기 작년 re:Invent에서 AWS Toolkit for IntelliJ 작업이 진행 중임을 알려 드린바 있습니다. 그 이후로 이 툴킷은 GitHub에서 활발한 개발이 진행되어 왔으며, 지난 3월에 정식 출시 하였습니다.  이 툴킷은 서버리스 애플리케이션 개발을 위한 통합 환경을 제공합니다. 예를 들어, 이를 통해 다음과 같은 작업을 수행할 수 있습니다. Java로 개발한 애플리케이션을 서버리스로 즉시 배포 가능 AWS Lambda와 유사한 실행 환경에서 단계별 디버깅을 이용해서 로컬에서 코드 테스트 원하는 AWS 리전에 애플리케이션을 배포 Lambda 함수를 로컬 또는 원격에서 호출 . Amazon S3, Amazon API Gateway 및 Amazon SNS과 같은 다양한 이벤트 소스로부터 샘플 페이로드를 사용하거나 맞춤 설정 가능 이 글에서는 간단하게 AWS Toolkit for IntelliJ 사용 방법을 소개합니다. AWS Toolkit for IntelliJ 설치 먼저, AWS SAM(Serverless Application Model) CLI를 설치합니다. 이 CLI는 Lambda와 유사한 실행 환경을 제공하며 단계별 코드 디버깅을 지원합니다. 또한 이 툴킷으로 SAM CLI를 사용하여 애플리케이션에 대한 [ more… ]

[도서] 유튜브, 이젠 나도! 유튜버

2019-08-08 KENNETH 0

[도서] 유튜브, 이젠 나도! 유튜버 분야별 신상품 – 국내도서 – 컴퓨터와 인터넷 [도서]유튜브, 이젠 나도! 유튜버 전은재 저 | 성안당 | 2019년 08월 판매가 17,820원 (10%할인) | YES포인트 990원(5%지급) SBS ‘세상에 이런 일이‘ CG 영상 편집의 달인 유튜버 전은재가 알려주는 가장 쉽게 유튜버가 되는 방법 공개 유튜버 이용자 수 19억 명, 이제 유튜브는 세계에서 가장 커다란 영상 공유 플랫폼으로 자리 잡았 Source: [도서] 유튜브, 이젠 나도! 유튜버

Microsoft and Samsung partner to empower you to achieve more

2019-08-08 KENNETH 0

Microsoft and Samsung partner to empower you to achieve more Today, we joined Samsung on stage in New York City at their Galaxy Unpacked event to share a vision for the future of productivity and how we will continue to partner in the coming years to empower people to achieve more across new Samsung devices and Microsoft experiences. This begins the next chapter of our long-standing partnership with Samsung and is another step in our journey to bring the best of Microsoft productivity to the devices you know and love. We are excited to announce that the new Samsung Galaxy Note10 phones will help you get more done right out of the box, natively integrated with best-in-class productivity apps and services from Microsoft including OneDrive, Outlook, Your Phone app (Link to Windows), and access to Word, Excel and PowerPoint. As [ more… ]

No Image

Announcing 2019 MSRC Most Valuable Security Researchers

2019-08-08 KENNETH 0

Announcing 2019 MSRC Most Valuable Security Researchers Earlier today we announced MSRC’s 2018-2019 Most Valuable Security Researchers at Black Hat. The following 75 researchers hail from all corners of the world and possess varied experience and skills, yet all of them have contributed to securing the Microsoft’s customers and the broader ecosystem. For over a decade, one of Microsoft’s partners in vulnerability … Announcing 2019 MSRC Most Valuable Security Researchers Read More » Source: Announcing 2019 MSRC Most Valuable Security Researchers