도서상세정보

알찬 R 프로그래밍_초보 데이터과학자(Data Scientist)를 위한

저자 홍성용
면수 448
발행일 2016-10-15
정가 \ 30,000
ISBN 9788957174555
도서코드 93560
판매가 \ 30,000
주문수량
총 주문금액 \ 30,000
※ 배송비안내 : 구매금액 30,000원이상 무료배송
바로 구매하기 장바구니 담기 위시리스트 담기
비전공자가 데이터 분석을 시작하는 초심에서부터 원리를 하나하나 깨우치며 단계별 실무 학습단계까지 진행할 수 있도록 기획하고 저술하였다. 실제 경험한 사례를 예제로 제공하여 데이터 수집부터 R 프로그래밍 분석까지 체계적으로 접근했다. 또한 실제 R 프로그램으로 무엇을 할 수 있는지 분명히 밝혀 응용으로 나아가는 발판을 마련했다. 따라서 처음 데이터 분석 도구인 R을 시작하는 학습자에게는 많은 도움이 될 것이다.

STEP 1. 준비학습 : 개념 이해하기(1장)

데이터가 무엇이며, 데이터 분석을 위한 기술은 어떻게 발전해 왔는지에 대한 기본 내용을 다룬다. 데이터 모델의 필요성과 데이터 분석을 위한 통계, 예측, 데이터 마이닝, 기계학습 그리고 빅 데이터 등 데이터 분석이 적용되는 분야의 간단한 내용과 기술의 용어들을 학습한다. 비전공자 혹은 일반인에게는 생소하고 어려운 용어일 수 있으니, 과거에서 현재의 기술이 어떻게 변화되어 왔으며 어디에 적용되어 왔는지 이야기 중심의 흥미를 유발하는 학습으로 진행하기 바란다. 그리고 구글의 트렌드 분석과 온라인 설문지를 이용한 데이터 수집 방법도 직접 체험 학습해 보길 바란다.

STEP 2. 기본학습 : R의 설치와 사용(2~3장)

R 소프트웨어는 무료로 사용할 수 있는 데이터 분석 툴의 한 도구이다. 다른 상용 소프트웨어 도구에 비해서 많은 기능과 패키지 라이브러리를 제공하고 있고, R 소프트웨어의 범용성과 활용성이 좋으며, C, Python, Java와 같은 다른 응용 프로그래밍 언어와 연결성이 좋고, 데이터베이스에 연결하여 데이터를 활용하는 방법도 제공하고 있다. R 소프트웨어 설치와 사용 방법을 직접 학습하길 바란다. 

STEP 3. 문법학습 : R의 데이터 구조와 제어문 그리고 함수(4~6장)

R 소프트웨어도 다른 프로그래밍 언어와 유사하게 기본적인 문법과 함수를 제공하고 있다. 특히 R은 함수기반 언어라고 할 정도로 많은 패키지(package)와 라이브러리(library)를 제공하고 있다. 따라서 데이터의 구조 종류와 제어문 그리고 함수의 생성과 사용 방법을 충분하게 학습하고 각 데이터 구조의 특징과 장점을 이해하는 것이 중요하다.

STEP 4. 시각화학습 : R의 2차원 3차원 시각화 기법(7~8장)
R 소프트웨어는 데이터 분석의 결과를 시각화(visualization) 표현하는 2차원, 3차원의 패키지를 다양하게 제공하고 있다. 따라서 데이터 분석의 결과를 막대 그래프, 파이 그래프, 히스토그램 등 2차원의 그래프로 시각화는 다양한 기법을 학습한다. 또한 3차원 그래픽에서는 3차원의 입체적 그래프 시각화를 위해 표면(surface) 그래프, 색상 적용 입체 그래프 등 다양한 예제 중심의 학습을 진행한다. 

STEP 5. 응용학습 : R의 실무적 프로젝트(9~10장)

R은 데이터 분석을 위한 전문적 소프트웨어 툴이다. 데이터 분석을 위한 데이터베이스 활용은 실무적으로 많이 사용하고 있는 기술이며 기존의 데이터를 수집하고 분석하는 중요한 과정중 하나이다. 따라서 MySQL 데이터베이스와의 연결을 이용해 데이터를 추출하고 분석하는 과정을 학습한다. 그리고 비정형 데이터 분석을 통해 워드 클라우드를 생성하는 프로젝트와 지도 그래프를 생성하는 프로젝트를 통해 좀더 실무적인 데이터 분석가가 되기 위한 학습을 진행한다.

관련분야 신간도서