상세 컨텐츠

본문 제목

핸즈온 데이터 시각화

Developer/IT 도서

by cepiloth 2022. 7. 17. 22:01

본문

728x90
반응형

https://www.hanbit.co.kr/store/books/look.php?p_code=B1996635146

서평

 서문에서는 데이터 시각화를 사용하는 이유와 장점과 단점을 소개한다. 그렇다면 데이터 시각화는 무엇일까?

데이터 시각화는 데이터 분석 결과를
쉽게 이해할 수 있도록 시각적으로
표현하고 전달되는 과정을 말한다.

데이터 시각화의 목적은 도표라는
수단을 통해 정보를 명확하고
효과적으로 전달하는 것이다.

참고 - 데이터 시각화-Wiki

GIGO(Garbage In, Garbage Out)

 데이터 시각화 또한 머신 러닝과 마찬 가지로 사용 가능한 데이터(깨끗한 데이터)로 먼저 만드는 작업이 필요하다. 인터넷 혹은 공개 데이터셋에서 누수된 데이터가 있기 마련이다. 위의 GIGO그림은 Garbage-in Garbage-Out이라는 뜻으로 "쓰레기를 넣으면 쓰레기만 나온다"라는 뜻이며 데이터의 중요성을 의미한다.

 

Image Source: Google Images

 책에 도입부에서는 구글 스프레드 시트를 사용하여 지저분한 데이터를 제거하는 방법을 알려준다. 파트 2부터는 차트, 지도, 테이블 등 본격적인 시각화를 하는 방법을 배울 수 있다.

 데이터의 시각화의 목표는 진실하고 의미 있는 스토리를 전달하는 것이다. 또 한 필자가 생각하기에는 데이터의 스토리 텔링이 가장 중요하다는 생각이 들었다. 하지만 해당 책에서는 스토리 텔링에 대해서 깊이 있게 설명되어 있지 않아 더 자세히 알고 싶으면 전문 서적을 따로 보는 것을 추천한다.

 

Image Source: Google Images

 결론적으로 데이터 시각화를 입문을 위한 필요한 도구의 설명과 사용법에 대해서 정리되어 있다고 생각한다. 구글 시트를 이용하여 책에 있는 내용을 실습하는 것을 권장한다. 아래는 책의 일부를 요약해 보았다.


요약

CHAPTER 1. 스토리를 위한 도구 선택하기

http://wordcloud.kr/ 사용

 데이터 시각화를 하기 위한 첫 번째 관문으로 시각화 도구를 선택해야 한다. 세상에는 완벽한 도구는 없으며, 단지 목적을 위한 좋은 도구만 존재한다. 디지털 도구의 진화는 사용성이 적은 도구는 사장될 수 있어 도구를 선택할 때 필요한 고려해야 할 10가지 요소를 제시한다.

 

CHAPTER 2. 스프레드시트 스킬 강화하기

 스프레드시트 기능을 지원하는 소프트웨어인 엑셀, LibreOffice 소개하고 구글 스프레드시트를 활용하여 구글 설문지 연동 및 피봇 테이블을 사용하여 데이터를 재구성하는 방법을 설명한다.

CHAPTER 3. 데이터를 찾고 질문하기

 잘못된 시각화를 방지하기 위해 실제 데이터를 확보하고 수집된 데이터의 진실성에 대해 알아본다. 아래의 두 질문에 대한 답을 찾을 수 있다.

믿을 만한 데이터를
어디서 찾을 것인가? 

데이터를 확보한 후 찾은 데이터가
진정으로 나타내는 것은 무엇인가?

 

 

CHAPTER 4. 지저분한 데이터 정리 하기 


 데이터셋을 확보하고 바로 시각화하기는 어렵다. 데이터에 결측치가 있을 수 있어 분석하는 과정이 필요하다. 구글 시트에서 데이터를 확보하고 데이터에 잡음을 제거하는 몇 가지 방법을 제시한다.

데이터 잡음 제거 방법
(Google Sheet)
데이터 잡음 제거 도구
(Software)
스마트 클린업
중복된 셀 제거
공백 정리
찾기 바꾸기로 이용한 단어 정리
특정 단어 기준으로 분리(탭, 콤마, 스페이스)
타불라
오픈 리파인


CHAPTER 5. 의미 있는 비교 하기

 데이터 분석 과정에서 데이터를 비교할 때 단어를 더 정확하게 사용하는 방법, 정규화해야 하는 이유와 편향을 줄 일 수 있는 방법을 소개한다.


CHAPTER 6. 차트 만들기

 여러 차트를 소개하며 현재 시각화할 데이터가 어떤 차트에 가장 효율 적으로 정보를 전달할 수 있는지 예시를 보여 준다. 데이터와 차트의 조화로 사용자에게 설득력 있는 시각화가 될 수 있는지를 배울 수 있다.



CHAPTER 7. 데이터를 지도로 시각화하기

 데이터 시각화를 표현하는 기술 중 지도로 표현하기 좋은 데이터와 예시를 보여준다.

 

CHAPTER 8. 테이블을 활용한 시각화

 테이블은 일반적으로 시각화의 일종으로 보지 않지만 웹에서 대화형 형태의  테이블을 사용하여 정보를 표시하는 방법을 소개한다.


CHAPTER 9. 웹에 임베딩 하기
CHAPTER 10. 깃허브로 코드 수정하고 호스트 하기
CHAPTER 11. Chart.js와 하이차트 템플릿
CHAPTER 12. 리플릿 맵 템플릿
CHAPTER 13. 지도 데이터 변환하기

 위 챕터들은 실습 위주로 구성되어 있으며 HTML 및 JavaScript 사전 지식이 요구된다. 난이도는 어렵지 않다.


CHAPTER 14. 거짓을 발견하고 편향 줄이기

 잘못된 시각화, 오해의 소지가 있는 시각화, 진실한 시각화를 구별하는 방법을 배운다.



CHAPTER 15. 데이터 스토리 말하고 보여주기

 앞전에 있는 내용들을 데이터를 시각화하기 위한 도구와 방법을 배울 수 있었다면 마지막 챕터는 의미 있는 데이터 시각화를 위한 스토리텔링의 중요성을 설명한다.


책 소개

실무에 바로 적용 가능한 데이터 시각화 방법을 모두 모았다!
간단한 시각화 도구부터 사용자 반응형 고급 도구까지

 한눈에 들어오는 차트와 지도는 글보다 강력하다. 문서가 글로만 빼곡히 채워져 있으면 사용자의 집중력을 저하시킬 뿐 아니라 설득력도 약해지기 마련이다. 하지만 적절한 타이밍에 등장하는 시각화된 데이터는 사용자의 주의를 환기시키고 주장을 더욱 강력하게 만든다. 이 책에서는 웹에서 제공하는 무료 시각화 도구를 이용해 데이터의 스토리를 생생하게 전달하는 방법을 설명한다. 데이터를 대화형(인터랙티브) 차트와 지도로 시각화하는 과정을 통해 데이터에 맥락과 스토리를 덧입혀 주장에 설득력을 더하는 효과적인 방법도 안내한다. 신뢰할 수 있는 데이터를 활용해 가치 있는 차트를 만들다 보면 자연스럽게 다양한 데이터로 만들어진 차트를 파악하는 안목도 생겨날 것이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

728x90
반응형

관련글 더보기

댓글 영역