상세 컨텐츠

본문 제목

가볍게 떠먹는 데이터 분석 프로젝트 - 제이펍

Developer/IT 도서

by cepiloth 2021. 12. 15. 14:21

본문

728x90
반응형

 

책 소개 - 쉽게 배워 바로 써먹는 데이터 분석 입문서!

 이 책은 데이터 분석 목적 수립, 데이터 취득 방법, 관련 부서 및 인원과 커뮤니케이션하는 방법, 그리고 분석 후 보고서 작성을 위한 대시보드 사용까지 전체 분석 프로젝트 사이클을 설명하고 있으며, 이어서 서울시 버스의 정류장별 승하차 인원 분석과 온라인 쇼핑몰의 블랙컨슈머를 분석하는 케이스 스터디를 통해 관련 경험과 배경지식이 없는 독자들도 실무에서 사용 가능한 지식과 노하우를 익힐 수 있도록 구성하였다.

 

 데이터 분석은 여러 데이터를 수집, 정리, 변환하여 유용한 정보를 발견하여 결론을 내리고 사용자의 의사결정을 지원하는 총체적인 과정이다. 현재는 우리는 엄청나게 많은 데이터의 홍수 속에 살고 있으며, 이 데이터를 의미 있고 가치를 창출하는 방법에 대해서 고민해야 한다. 이 책은 전문적인 지식과 관련 경험이 없더라도 별다른 어려움 없이 데이터 분석을 수행하는 가이드라인을 제시한다.

 

데이터 분석 프로젝트의 CHAPTER는 아래와 같이 구성되어 있다.

CHAPTER 01 데이터 분석 프로젝트 1

1.1 데이터 분석 프로젝트란? 3
1.2 데이터 분석 프로젝트의 목적 4
1.3 데이터 분석 프로젝트의 중요성 5
1.4 데이터 분석 프로젝트 수행 시 고려사항 6
1.5 체계적인 데이터 분석 프로젝트 관리의 중요성 9
1.6 데이터 분석 프로젝트가 실무에서는 어떻게 이루어질까? 12
1.7 데이터 분석 프로젝트를 진행할 준비가 되었는가? 15
1.8 마무리 18

CHAPTER 02 데이터 분석 프로젝트를 위한 6단계 절차 19

2.1 데이터 분석 프로젝트의 6단계 절차? 집 짓기에 비유하기 22
2.2 1단계: 목표 이해하기 24
2.3 2단계: 계획 세우기 27
2.4 3단계: 데이터 수집 및 전 처리하기 30
2.5 4단계: 데이터 분석하기 33
2.6 5단계: 검증 및 평가하기 40
2.7 6단계: 시각화 및 발표 43
한 템포 쉬어가기_멜론의 데이터 활용 사례 46

CHAPTER 03 데이터 취득 47

3.1 데이터는 어디에서 구할 수 있을까?? 내부 vs?? 외부 49
3.2 데이터 취득하기 57
3.3 마무리 63
한 템포 쉬어가기_엔씨소프트의 데이터 활용 사례 64

CHAPTER 04 데이터 검증 및 전처리 65

4.1 데이터 품질 검증 67
4.2 데이터 전처리(클렌징) 74
4.3 마무리 79

CHAPTER 05 데이터 분석 도구 소개 81

5.1 데이터 분석 도구를 사용하기에 앞서 생각해 볼 것들 83
5.2 프로젝트에 맞는 데이터 분석 도구 선택 방법 83
5.3 데이터 통계 분석 도구 84
5.4 비즈니스 인텔리전스 도구 88
5.5 프로그래밍 언어 기반 도구 92
한 템포 쉬어가기_기후 변화도 예측할 수 있을까? 98

CHAPTER 06 데이터 시각화 차트 사용법 99

6.1 프로젝트에 적합한 차트 선택 방법 101
6.2 마무리 122

CHAPTER 07 데이터 대시보드 사용법 123

7.1 대시보드를 통한 시각화 돋보이기 125
7.2 마무리 134

CHAPTER 08 케이스 스터디 1: 서울시 버스의 승하차 인원 분석 135

8.1 케이스 소개 137
8.2 케이스 스터디 분석 프로젝트 138
8.3 교훈 및 개선점 찾기 158
한 템포 쉬어가기_가짜 뉴스를 찾아라! 160

CHAPTER 09 케이스 스터디 2: 라인 쇼핑몰 마케팅 신입의 블랙컨슈머 분석 프로젝트 161

9.1 케이스 소개 163
9.2 케이스 스터디 분석 프로젝트 165
9.3 교훈 및 개선점 찾기 184
한 템포 쉬어가기_테스코의 몰락 186

 

서평

 데이터 분석 프로젝트를 진행하면서 일정 및 계획 수립에 대한 예시를 제공해준다. 데이터를 분석하는 것은 올바르고 합리적인 의사결정을 하기 위한 일종의 수단이며 이러한 작업을 단계적으로 나누어 접근하는 방법과 일정을 수립하는 예시를 확인할 수 있었다.

 

 

 챕터별 주제와 설명이 일관적이며 마무리 부분에서는 챕터의 내용을 요약하여 정리가 되어 있다. 또 한, 데이터 활용 관련 사례를 특정 기업의 활용 사례를 예시를 들어 내용을 이해하는데 도움이 되었다.

 

 공공 데이터 포탈이나 기업의 ERP, CRM에 통하여 데이터를 확보할 수 있다. 데이터를 확보하고 데이터 전처리를 통하여 의미 있는 데이터를 가공할 때 생기는 데이터 품질관리에 대해서도 설명이 잘되어 있다. 데이터를 확보하여도 물리적 혹은 논리적 오류가 있을 수가 있다. 예를 들면 중복되거나 관련 없는 데이터라던지 수집된 데이터에서 과도하게 벗어난 값, 혹은 데이터가 누락되어 이상치가 발생한 경우가 그 예이다.

 

 이외의 데이터 시각화를 하기 위하여 차트와 대시보드를 활용하는 방법도 소개한다. 필자의 경우 도형 인식 모델을 만들면서 데이터 수집 -> 데이터 증강 -> 데이터 전처리 등을 처리하면서 이 책에서 제시한 이상치 제거 및 의미 없는 데이터를 제거한 경험이 있다. 또한, 인식률을 객관적으로 개선되었다는 것을 보여주기 위해서 파이 차트를 사용하여 인식 결과를 아래처럼 시각화하였다.

 

 올해 4월부터 머신러닝 업무를 처음 맡게 되어 시행착오가 많았던 한 해였다. 운이 좋게 제이펍 IT 전문 리뷰어 1기로 되어서 막힐 때마다 책을 통하여 많은 도움이 되었다. 또 한 추천할만한 책으로 실무 예제로 배우는 데이터 공학 책도 데이터를 이해하는데 도움이 된다.

 

믿고 보는 제이펍 IT 전문서 리뷰어 1기로서 출판사로부터 책을 제공받았으나,
본 리뷰는 제 주관적인 판단에 따라 작성하였습니다. 

 

가볍게 떠먹는 데이터 분석 프로젝트:기초 이론과 케이스 스터디로 배우는 데이터 분석의 전 과

COUPANG

www.coupang.com

 

728x90
반응형

관련글 더보기

댓글 영역