상세 컨텐츠

본문 제목

머신러닝 실무 프로젝트 2판 - 한빛미디어

Developer/IT 도서

by cepiloth 2022. 4. 26. 14:30

본문

728x90
반응형

 

서평

 이 책은 머신러닝 알고리즘에 대해서는 깊은 설명은 없으나 간략한 특징과 실제 머신러닝 프로젝트를 수행하기 위해 필요한 필요한 지식에 대해서 소개한다. 프로젝트를 시작할 때 여러 필요 요소가 있는데 필자가 생각할 때는 해결하려는 비즈니스 모델의 도메인 지식이 중요하다고 생각했지만 책에서는 아래 4가지가 가장 중요한 요소라고 한다.

  • 제품에 관한 도메인 지식을 가진사람
  • 통계나 머신러닝을 잘 아는 사람
  • 데이터 분석 인프라를 만드는 엔지니어링 역량을 가진 사람
  • 실패 리스크를 책임지는 책임자

 머신러닝 프로젝트는 모델 관련 지식, 코딩 스킬 차이 등 사람에게 의존하기 어려우며 일반적인 소프트웨어보다 인수인계가 어려우며 이러한 문제로 공통 실험 환경(개발환경)이 필요하다. 머신러닝 프레임워크로는 TensorFlow, PyTorch, Keras 등 있는데 이러한 프레임워크도 공통적으로 사용할 수 있는 가상 환경을 구성하는 방법과 데이터 수집 및 모니터링을 할 수 있는 MLOps를 예를 들며 공통 실험 환경(개발 환경)을 구축하는 방법을 제시한다. 

 책에 도입부에서는 머신러닝의 주요 과정을 소개하며 머신러닝 알고리즘별 역할과 특성에 대해서 설명하며 3장 에서는 머신러닝 알고리즘으로 만든 모델의 학습 결과를 평가하는 방법을 알아본다. 평가 지표로는 정답률과, 정밀도, 재현율, F값 등이 있으며 A/B 테스트의 중요성에 대해서 소개한다.

 머신러닝 프로젝트의 도입, 진행, 배포 단계 등 모든 면에서 필요한 사항이 정리되어 있는 책이다. 만약 진행 중인 프로젝트가 있다면 현재 업무에 필요한 챕터만 만 읽어도 도움이 된다고 생각된다.

 


책소개

어디서든 환영받는 ‘실무형 머신러닝’ 비법

 온라인 강의, 책, 대학 연구만으로는 실제 비즈니스에 머신러닝을 어떻게 적용할 것인지, 어떤 경우에 머신러닝 기법과 데이터 분석 방법을 적용해야 하는지 알기 어렵다. 해결해야 하는 문제를 정의하고 시스템을 설계하는 방법 역시 배우기 쉽지 않다. 가설 수립, 탐색적 분석 수행 방법 등 저자들이 경험하고 학습했던 노하우를 아낌없이 담아냈다. 2판에서는 지속적인 학습을 위한 MLOps와 슬롯머신 알고리즘을 활용한 강화 학습 등의 내용도 추가했다. 실무에서 통하는 머신러닝을 구현하고 싶다면 이 책으로 갈증을 해소할 수 있을 것이다.

 


목차

PART1 머신러닝 실무 노하우

CHAPTER 1 머신러닝 프로젝트 처음 시작하기
1.1 머신러닝은 어떻게 사용되는가
1.2 머신러닝 프로젝트 과정
1.3 운용 시스템에서의 머신러닝 문제점 대처 방법
1.4 머신러닝 시스템을 성공적으로 운영하기 위한 조건
1.5 정리

더보기

CHAPTER 2 머신러닝으로 할 수 있는 일
2.1 머신러닝 알고리즘 선택 방법
2.2 분류
2.3 회귀
2.4 클러스터링과 차원 축소
2.5 기타
2.6 정리

CHAPTER 3 학습 결과 평가하기
3.1 분류 평가
3.2 회귀 평가
3.3 머신러닝을 통합한 시스템의 A/B 테스트
3.4 정리

CHAPTER 4 기존 시스템에 머신러닝 통합하기
4.1 기존 시스템에 머신러닝을 통합하는 과정
4.2 시스템 설계
4.3 훈련 데이터를 얻기 위한 로그 설계
4.4 정리

CHAPTER 5 학습 리소스 수집하기
5.1 학습 리소스 수집 방법
5.2 공개된 데이터셋이나 모델 활용
5.3 개발자가 직접 훈련 데이터 작성
5.4 동료나 지인에게 데이터 입력 요청
5.5 크라우드소싱 활용
5.6 서비스에 통합해서 사용자가 입력
5.7 정리

CHAPTER 6 지속적인 머신러닝 활용을 위한 기반 구축하기
6.1 머신러닝 시스템만의 독특한 어려움
6.2 지속적인 학습과 MLOps
6.3 머신러닝 인프라 구축 단계
6.4 지속적인 예측 결과 서빙
6.5 정리

CHAPTER 7 효과 검증: 머신러닝 기반 정책 성과 판단하기
7.1 효과 검증
7.2 인과 효과 추정
7.3 가설 검정 프레임
7.4 A/B 테스트 설계 및 수행
7.5 오프라인 검증
7.6 A/B 테스트를 수행할 수 없을 경우
7.7 정리
7.8 쉬어가기: 무조건 성공하는 A/B 테스트, A/B 테스트 모집단 조작

CHAPTER 8 머신러닝 모델 해석하기
8.1 구글 콜랩에 설치된 라이브러리 버전 업데이트
8.2 학습용 파일 업로드 및 확인
8.3 선형 회귀 계수를 이용한 원인 해석
8.4 로지스틱 회귀 계수로 원인 해석
8.5 회귀 계수 p값 구하기
8.6 결정 트리를 시각화해 원인 해석
8.7 랜덤 포레스트의 Feature Importance 시각화
8.8 SHAP을 활용한 기여도 시각화
8.9 SHAP을 활용한 직원 만족도 시각화
8.10 정리

PART2 머신러닝 실무 프로젝트

CHAPTER 9 킥스타터 분석하기: 머신러닝을 사용하지 않는 선택지
9.1 킥스타터 API 확인하기
9.2 킥스타터 크롤러 만들기
9.3 JSON 데이터를 CSV로 변환하기
9.4 엑셀로 데이터 살펴보기
9.5 피벗 테이블로 다양하게 파악하기
9.6 목표를 달성했지만 취소된 프로젝트 확인하기
9.7 국가별로 살펴보기
9.8 보고서 작성하기
9.9 이후 작업
9.10 정리

CHAPTER 10 업리프트 모델링을 이용한 마케팅 리소스 효율화
10.1 업리프트 모델링의 사분면
10.2 A/B 테스트 확장을 통한 업리프트 모델링
10.3 업리프트 모델링용 데이터셋 만들기
10.4 두 가지 예측 모델을 이용한 업리프트 모델링
10.5 AUUC로 업리프트 모델링 평가
10.6 실제 문제에 적용
10.7 업리프트 모델링을 서비스에 적용
10.8 정리

CHAPTER 11 슬롯머신 알고리즘을 활용한 강화 학습 입문
11.1 슬롯머신 알고리즘 용어 정리
11.2 확률분포에 관한 사고
11.3 사후 분포에 관한 사고
11.4 사후 분포의 신뢰 구간 상한을 이용한 구현 사례
11.5 UCB1
11.6 확률적 슬롯머신 알고리즘
11.7 다양한 슬롯머신 알고리즘 비교
11.8 부트스트랩 알고리즘을 이용한 콘텍스트 기반 슬롯머신 구현
11.9 현실 과제
11.10 A/B 테스트, 업리프트 모델링, 슬롯머신 알고리즘의 관계
11.11 정리

CHAPTER 12 온라인 광고에서의 머신러닝
12.1 온라인 광고 비즈니스
12.2 문제 정식화
12.3 예측의 역할 및 구현
12.4 광고 송출 로그의 특징
12.5 머신러닝 예측 모델 운영
12.6 정리

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

728x90
반응형

관련글 더보기

댓글 영역