acorn+PACKT 시리즈. 최근 빅데이터 분석 분야가 각광을 받으면서 R에 대한 관심이 높아지고 있다. R은 분석 기능이 뛰어나지만 확장성이 부족하다는 단점이 있다. 이런 측면에서, 대표적인 빅데이터 처리 플랫폼인 하둡과 R을 연동하려는 시도는 아주 자연스러운 일이다. 이 책은 데이터 분석가나 플랫폼 엔지니어가 빅데이터 처리를 위해 R의 분석 능력과 하둡의 저장 및 처리 능력을 함께 활용할 수 있도록 이상적인 솔루션을 제시한다.
R과 하둡의 설치, 하둡 맵리듀스 애플리케이션 생성, RHIPE, RHadoop, 하둡 스트리밍을 이용한 R과 하둡의 연동, R과 하둡 기반으로 동작하는 맵리듀스 애플리케이션 개발과 실행, RHIPE와 RHadoop을 이용해 R 환경에서 HDFS 데이터 처리, R 환경에서 하둡 스트리밍 맵리듀스 실행, 다양한 데이터 소스로부터 R에 데이터 가져오기와 내보내기, 다양한 분석을 위한 데이터 수집 등을 다루고 있다.