Amazon SageMaker를 통한 美 대학 농구 결과 예측하기
미국에서 3월 중순이 되면 수백만 명의 사람들이 대학 농구를 시청하며 내기를 하곤 합니다. 저도 미국에서 살긴 하지만 저와는 무관한 일입니다. 하하!
그런데, NCAA 대학 챔피언십이 진행되는 와중에 Amazon의 Professional Services Machine Learning 전문가 중 한 명인 Wesley Pasfield의 작업물을 하나 간단히 소개하고 싶었습니다. Wesley 씨는 Amazon SageMaker 내장형 XGBoost 알고리즘을 사용하여 kenpom.com과 College Basketball Reference에서 데이터를 가져와 3월의 광란이라 불리는 대학 농구 토너먼트의 결과를 예측하는 모델을 구축했습니다.
Wesley가 데이터를 수집하고, 조사를 위한 데이터 분석을 수행하고(데이터 과학 링고로 작성된 EDA), xgboost 알고리즘용으로 데이터의 형식을 바꾸고, SageMaker SDK를 사용하여 두 가지 모델에 대한 교육 작업을 생성하며, 마지막으로 https://cbbpredictions.com/에서 예측 역할을 할 SageMaker 추론 엔드포인트를 생성하는 과정을 설명합니다.
자세한 것은 Predict March Madness using Amazon Sagemaker의 1부와 2부를 살펴보시기 바랍니다. (영어로 된 가이드지만 따라하기 편하게 되어 있습니다.)
정말 멋지죠. Amazon SageMaker에서 Jupyter 노트북을 열고 xgboost 알고리즘을 한번 사용해 보세요. 예측과 관련해 몇 가지 주의할 점이 있으므로 가이드를 잘 따라하시길 권장드립니다.
– Randall;
(역자주: Amazon SageMaker에 대한 자세한 사용 방법은 한국어 온라인 동영상 강의를 참고하세요!)