메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

비즈니스 머신러닝

아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법

한빛미디어

번역서

판매중

  • 저자 : 더그 허전 , 리처드 니콜
  • 번역 : 김정민 , 문선홍 , 정용우
  • 출간 : 2020-12-23
  • 페이지 : 344 쪽
  • ISBN : 9791162243657
  • 물류코드 :10365
  • 초급 초중급 중급 중고급 고급
4.4점 (19명)
좋아요 : 3

비즈니스에 머신러닝 적용을 더 빠르게! 더 유연하게! 

 

머신러닝은 비즈니스 업무에 큰 이점을 제공한다. 이 책에서 제공하는 몇 가지 안내만으로 고액 컨설팅이나 복잡한 수식 없이 큰 성과를 거둘 수 있다. 엑셀에서 숫자 활용에 능숙하다면 최신 머신러닝 서비스를 이용해 마케팅 비용을 절감하고, VIP 고객을 식별 및 관리하며 백 오피스 프로세스도 최적화할 수 있다. 비즈니스 지향적인 머신러닝 기법을 설명하며, 고객 유지, 전력 사용량 예측, 백 오피스 프로세스 등 실무에서 매우 유용한 6가지 시나리오를 다룬다. 원서 출간 이후 아마존 세이지메이커 버전이 2.x로 업데이트되어 번역서에는 1.x 버전 예제를 오류 없이 실행하기 위한 해결 방법을 함께 담았다.

 

 

출판사 리뷰

 

기업의 비즈니스 경쟁력을 극대화하는 머신러닝 실전 가이드

모든 기업이 IT 기업으로 전환되었듯, 이제는 IT 기업에서 AI 기업으로 바뀔 것이라고 많은 전문가가 예측하고 있다. 기업에서 AI를 도입하는 것이 선택이 아닌 필수가 된 것이다. AI 전문 인력이 없으니 도입이 어렵다고 생각할 수도 있다. 하지만 이 책은 AI 전문 인력이 없는 일반 기업도 비즈니스에 AI를 쉽게 적용할 수 있도록 AWS 세이지메이커와 주피터 노트북을 사용해 비용 효율적인 비즈니스 아이디어를 실현하는 방법을 소개한다. 

 

머신러닝에 적합한 작업 식별, 백 오피스 프로세스 자동화, 오픈 소스 및 클라우드 기반 툴 사용법, 관련 사례 연구 등의 주요 내용과 함께, 비즈니스 머신러닝을 수행하는 데 필요한 고객 유지, 전력 사용량 예측, 백 오피스 프로세스 등 실무에서 매우 유용한 6가지 시나리오를 다룬다. 이 책으로 현대 비즈니스 핵심 기술로 부상한 머신러닝을 적용해 자사 프로세스를 효율적이고 경쟁력 있게 만들 수 있을 것이다. 원서 출간 이후 아마존 세이지메이커 버전이 2.x로 업데이트되어 번역서에는 1.x 버전 예제를 오류 없이 실행하기 위한 해결 방법을 함께 담았다. 

 

■ 비즈니스 생산성을 향상시키는 머신러닝을 이용한 6가지 시나리오

- 구매 요청부터 승인까지의 구매 요청 전달 과정 자동화

- 이탈 조짐을 보이는 고객을 찾는 XG부스트 애플리케이션 구축

- 불만 트윗을 식별하는 머신러닝 모델 구축

- 공급업체가 보낸 청구서에 대해 추가 질의 여부 결정

- DeepAR 알고리즘으로 월간 전력 사용량 예측

- DeepAR 알고리즘으로 월간 전력 사용량 예측 성능 향상

 

예제 코드 

github.com/K9Ns/ml4biz

 

 

추천사

아마존 세이지메이커를 전문으로 다루는 책은 해외에서도 손에 꼽을 만큼 적어서 진입 장벽이 높다. 국내에서 양질의 세이지메이커 입문서가 출간된다는 소식을 듣고 매우 기뻤다. 이 책은 세이지메이커의 주요 콘셉트, 정형 데이터, 자연어 처리, 이상치 검출, 시계열 데이터, 모델 배포 모두를 포함하므로 AWS 클라우드상에서 머신러닝을 시도하려는 데이터 과학자나 개발자에게 강력히 추천한다.

_ 김대근, AWS 코리아

 

영화 <인셉션>에서는 ‘꿈 설계사’라는 기술자가 등장해 단 한 명이 꿈 안에서 거대한 도시를 설계하고 또 그것을 구현해낸다. 사람의 생각만으로 이루어지는 꿈이라는 공간이어서 설득력 있게 다가오지만 클라우드 컴퓨팅은 현실 세계에서 이것을 가능하게 해준다. 클라우드 컴퓨팅이 가져온 것은 가상화를 통한 IT 인프라 구성에 대한 자유뿐만이 아니다. 최신 기술의 대중화라는 측면에서도 누구나 클라우드 컴퓨팅 회사의 기술 지원을 통해 머신러닝 같은 최신 기술을 손쉽게 사용할 수 있게 되었다. 이 책에서 소개하는 세이지메이커는 클라우드 1위 업체인 아마존 웹서비스에서 머신러닝에 관련된 모든 작업을 쉽게 사용할 수 있도록 만든 머신러닝계의 스위스 아미 나이프라 부를 수 있는 서비스다. 이 책은 비즈니스적인 문제를 해결하기 위해서 이 세이지메이커로 머신러닝을 어떻게 구현해야 하는지를 실무자의 관점으로 친절하게 설명한다. 이 책을 통해 여러분도 세이지메이커로 <인셉션>의 꿈 설계사처럼 거대한 머신러닝 서비스를 자유자재로 구현하는 자유를 누리길 바란다.

_ 정도현, AWS 코리아

 

비즈니스에 머신러닝을 적용했을 때 생길 수 있는 문제를 해결하는 방법을 설명한다. 또한 독자의 이해력을 높이는 실전 예제를 가득 수록했다. 전문가와 비전문가 모두 읽을 수 있는 실전서로 머신러닝을 비즈니스에 적용하려는 모든 사람에게 이 책을 추천한다.

_ 존 바실, Fethr

 

머신러닝이 회사의 프로세스 자동화에 미치는 영향을 알 수 있다.

_ 제임스 블랙, 닛산 USA

 

이 책은 개인사업자도 AI를 활용할 수 있다는 것을 보여준다.

_  디비아 시바수브라마니안, 사이언스로직

 

 

상세이미지_비즈니스 머신러닝_700px.jpg

더그 허전 저자

더그 허전

시드니에 본사를 둔 비즈니스 자동화 및 통합 기업 Managed Functions의 CEO다. 파이썬이나 주피터 노트북으로 비즈니스 프로세스를 자동화하는 통합 머신러닝 플랫폼을 구축했다. IT 및 비즈니스 프로세스 아웃소싱 산업에서 20년간 근무했으며 여전히 배움에 대한 적극적인 태도를 지니고 있다.

리처드 니콜 저자

리처드 니콜

Faethm의 수석 데이터 과학자다. 더그와 함께 조달 소프트웨어 회사에서 근무했다. 호주 시드니 대학교에서 데이터 사이언스 석사 학위를 받았다.

김정민 역자

김정민

GS ITM 기술전략팀 부장. 새로운 기술을 많은 사람에게 공유하고 전파하기 위해 관련 서적을 번역하는 데 관심이 많은 데이터 분석 엔지니어다. 분산처리 기술을 활용하여 음악과 영상 서비스의 스트리밍 솔루션 개발자로 출발해 20년 동안 대기업과 벤처기업에서 다양한 서비스를 개발했다.

문선홍 역자

문선홍

GS ITM 기술전략팀 부장. GS ITM 기술전략팀에서 클라우드 환경에서 AI 플랫폼을 개발하고 있다. 중견 기업부터 엔터프라이즈 기업까지 25년간 다수의 IT 서비스 프로젝트 수행 및 솔루션을 개발했다. 또한 빅데이터 기반 텍스트와 AI 분석을 진행했다.

정용우 역자

정용우

GS ITM 기술전략팀 부장. AWS상에서 세이지메이커의 기능 및 데이터 분석 알고리즘을 개발하고 있다. 머신러닝 및 딥러닝을 사용하여 다양한 빅데이터를 사용한 프로젝트에 참여한 경험이 있다. 뉴욕 주립 대학교 버펄로에서 전자공학과 인공지능 박사과정을 졸업했다.

[Part 1 비즈니스를 위한 머신러닝]


CHAPTER 1 머신러닝이 비즈니스에 적용되는 방식

1.1  왜 우리 비즈니스 시스템은 엉망인가

1.2  지금 왜 자동화가 중요한가

1.3  기계는 어떻게 의사결정을 하는가

1.4  캐런의 의사결정을 머신러닝이 도와줄 수 있는가

1.5  기계는 어떻게 학습하는가

1.6  의사결정을 위한 머신러닝 사용의 회사 승인

1.7  도구 

1.8  2~7장의 시나리오를 다루기 위한 세이지메이커 설정

1.9  지금이 바로 행동할 때

1.10  요약

 

[Part 2 비즈니스를 위한 머신러닝 6가지 시나리오]


CHAPTER 2 기술 담당자에게 구매 결재 검토 요청을 전달해야 하는가

2.1  의사결정

2.2  데이터

2.3  학습 시작

2.4  주피터 노트북을 이용한 의사결정

2.5  엔드포인트 삭제와 노트북 인스턴스 중지

2.6  요약


CHAPTER 3 이탈 조짐을 보이는 고객 찾기

3.1  이 장의 의사결정 사항

3.2  업무 처리 절차

3.3  데이터셋 준비

3.4  XG부스트 이해하기

3.5  머신러닝 모델 구축 준비

3.6  머신러닝 모델 구축

3.7  엔드포인트 삭제와 노트북 인스턴스 중지

3.8  엔드포인트 삭제 여부 확인

3.9  요약

 

CHAPTER 4 고객 문의 사항을 고객지원팀에 전달 여부 결정

4.1  이 장의 의사결정 사항

4.2  업무 처리 절차

4.3  데이터셋 준비

4.4  자연어 처리

4.5  BlazingText는 어떤 것이고 어떻게 작동하나

4.6  머신러닝 모델 구축 준비

4.7  머신러닝 모델 구축

4.8  엔드포인트 삭제와 노트북 인스턴스 중지

4.9  엔드포인트 삭제 여부 확인

4.10  요약

 

CHAPTER 5 공급업체가 보낸 청구서에 대해 추가 질의 여부 결정

5.1  이 장의 의사결정 사항

5.2  업무 처리 절차

5.3  데이터셋 준비

5.4  이상치 정의

5.5  지도학습과 비지도학습

5.6  랜덤 컷 포레스트의 개요 및 동작 방식

5.7  머신러닝 모델 구축 준비

5.8  머신러닝 모델 구축

5.9  엔드포인트 삭제와 노트북 인스턴스 중지

5.10  엔드포인트 삭제 여부 확인

5.11  요약

 

CHAPTER 6 월간 전력 사용량 예측

6.1  이 장의 의사결정 사항

6.2  시계열 데이터 작업을 위한 주피터 노트북 불러오기

6.3  데이터셋 준비: 시계열 데이터의 차트 그리기

6.4  신경망이란

6.5  머신러닝 모델 구축 준비

6.6  머신러닝 모델 구축

6.7  엔드포인트 삭제와 노트북 인스턴스 중지

6.8  엔드포인트 삭제 여부 확인

6.9  요약

 

CHAPTER 7 월간 전력 사용량 예측 성능 향상

7.1 DeepAR의 주기적 현상 파악 능력

7.2 DeepAR의 강점: 연관된 시계열 데이터 병합

7.3  전력 사용량 예측 모델에 추가 데이터 병합

7.4  머신러닝 모델 구축 준비

7.5  머신러닝 모델 구축

7.6  엔드포인트 삭제와 노트북 인스턴스 중지

7.7  엔드포인트 삭제 여부 확인

7.8  요약

 

[Part 3 프로덕션에 머신러닝 적용하기]


CHAPTER 8 웹 서비스로 예측 모델 제공하기

8.1  왜 웹상에서 의사결정 모델과 예측 모델을 제공하는 것은 어려울까

8.2  이 장의 단계 개요

8.3  세이지메이커 엔드포인트

8.4  세이지메이커 엔드포인트 설정

8.5  서버리스 API 엔드포인트 설정

8.6  웹 서비스 엔드포인트 생성

8.7  의사결정 서비스 제공

8.8  요약

 

CHAPTER 9 사례 연구

9.1  사례 연구 1: WorkPac

9.2  사례 연구 2: Faethm

9.3  결론

9.4  요약

아마존 세이지메이커와 쥬피터 노트북을 통해 머신러닝 서비스를 현실의 의사결정에 적용할 수 있을지를 다룬 책이다. 머신러닝에 대한 이해가 없는 엔지니어라면 머신러닝 입문서로서 적합하며, 머신러닝에 익숙한 분석가에게는 아마존 세이지메이커를 통해 머신러닝 모델을 어떻게 개발하고 어떻게 배포하면 되는지에 대한 좋은 자습서가 될 수 있다.

 

 

KakaoTalk_20210222_232422830.jpg

 

세이지메이커는 머신러닝 애플리케이션을 구축하고 배포하기 위해 아마존이 제공하는 머신러닝 환경이다. 개인 컴퓨터에 개발 환경을 구성할 필요가 없도록 클라우드에서 개발 환경을 제공해 준다고 볼 수 있다.

 

KakaoTalk_20210222_232423682.jpg

 

엔드포인트와 주피터 노트북을 사용하지 않을 때는 반드시 엔드포인트를 삭제하고 주피터 노트북을 중지해야한다. 이 서비스들을 사용하지 않을 때도 계속 켜놓으면 초 단위로 비용을 지불해야한다.

 

KakaoTalk_20210222_232424309.jpg

 

첫 번째로 "이탈 조짐을 보이는 고객을 찾기" 예제가 수록되어 있다. 아래는 카를로스의 업무 처리 절차이다. 카를로스는 이탈할 고객의 주문에는 일정한 패턴이 있다고 생각한다. 따라서 이러한 고객을 찾으려면 주문 단위의 데이터를 고객 단위의 데이터로 바꿔야 한다. 

 

KakaoTalk_20210222_232424963.jpg

 

혼동 행렬에 대해 나오는데. 혼동 행렬은 동일한 개수의 행과 열을 포함하는 테이블이다. 각 행과 열의 수는 목표 변수가 가질 수 있는 값(클래스)의 수와 동일하다. 예를 들어 카를로스의 데이터셋에서 목표 변숫값은 0 또는 1만 있으므로 혼동 행렬에는 두 개의 행과 열이 있다.

 

KakaoTalk_20210222_232425572.jpg

  

NLP에서 다루는 단일 차원 벡터와 다차원 벡터의 개념을 다루고 있다. 이와 더불어 유니그램, 바이그램 그리고 트라이그램을 다루고 있다. 

 

KakaoTalk_20210222_232426169.jpg

 

유니그램은 단일 단어를 사용하는 것이고 바이그램은 단어 2개로 된 단어쌍을 사용하는 경우이며 트라이그램은 단어 3개로 구성된 단어쌍을 사용하는 경우이다.

 

KakaoTalk_20210222_232426807.jpg

 

이 책을 통해 머신러닝이 비지니스에서 어떻게 사용되는지를 파이썬의 사이킷런 라이브러리를 사용하여 쉽게 따라해 볼 수 있다. 데이터도 아마존 세이지메이커에서 예제로 제공해 주는 것을 사용하므로 제공된 데이터를 사용해 실습이 가능하다. 

 


이 책의 예제를 따라함으로서 비지니스의 의사결정 관점에서 머신러닝이 어떻게 사용될 수 있는지를 배울 수 있을 것이리라 생각한다.

#비즈니스 #머신러닝 #한빛출판사 #도서리뷰 #도서서평단

머신러닝을 공부하면서 이를 어떻게 실무적으로 사용할 수 있을까 항상 고민했었는데, 당장 업무에 적용해 보아도 불편함이 없을 정도로 상세하게 적용할 수 있는 구체적인 예시가 나와서 정말 반가웠다. 

또한 책의 1장에서 자동화가 왜 중요한지, 생산성 향상을 위해서 머신러닝이 어떻게 사용될 수 있는지 친절하게 설명되어 있어 있다. 자동화는 반복 작업 수행을 위한 소프트웨어 사용이라고 할 수 있는데, 이런 업무에 자동화가 어려운 이유는 반복적으로 보이는 프로세스의 여러 단계에 필요한 간단한 의사결정이 필요한 병목들이 있기 때문이다. 이러한 부분에 과거에 적용해서 성공적인 결과를 가져왔던 부분을 학습하여 스스로 의사결정을 내릴 수 있는 머신 러닝을 적용하게 되면 생산성이 크게 향상될 수 있다. 

2장에 나왔던 비즈니스를 위한 머신러닝의 6가지 시나리오에서 마케팅 업무를 하고 있는 내 입장에서 바로 적용해 볼 수 있는 부분은 바로 "이탈 위험 고객 평가" 사례였다. 

이 장에서 이탈이 예상되는 고객을 탐지하고, 불균형한 분포를 가진 데이터를 처리하는 방법을 배우고, XG부스트 알고리즘을 적용해서 모델링하고, 테스트 데이터를 적용해서 모델의 성능을 확인하는 부분에 대해서 단계별로 배울 수 있었다. 

또, 자연어 처리를 업무에 적용할 수 있는 사례로 "고객 문의 사항을 고객지원팀에 전달 여부 결정"이 있었다. 이 부분에서는 자연어 처리에 대한 대략적인 이해와 NLP 머신러닝 시나리오에 접근하는 방법, NLP 시나리오에 맞게 데이터를 준비하는 방법, 결과를 해석하는 방법 등이 구체적으로 설명되어 있어서 이해하기가 쉬웠다. 

특히 트위터에서 고객이 고객지원을 요청하는 트윗 데이터를 기반으로 트윗을 고객지원팀으로 넘길지, 봇에서 자동응답으로 처리할 지에 대해서 Blazing Text가 판단할 때 '사용자가 진짜로 짜증을 내는지 여부'와 '무엇에 대해 얘기하고 있는지'에 대한 판단을 기반으로 의사결정을 하는 모델에 대해서 학습할 수 있었다. 

3장에서는 웹 서비스로 예측 모델을 제공하기 위해서 세이지 메이커를 설정하는 방법, 예측 모델을 배포하기 위한 서버리스 API를 빌드하고 배포하는 방법, API를 통해서 데이터를 전송하고 웹 브라우저를 통해서 예측 결과를 수신하는 방법 등을 직접 실습하면서 익힐 수 있었다. 

지금까지는 이론적으로 머신러닝을 학습했었다면 이 책을 통해서 실제 비즈니스에서 적용해 볼 수 있는 구체적이고 재미있는 사례를 통해서 직접 데이터를 준비하고 모델을 돌려보고, 웹 서비스로 퍼블리싱하는 방법까지 해 볼 수 있다는 것이 이 책이 갖고 있는 가장 큰 장점이라고 생각된다. 

151778030_265608958567283_3817350124989721931_n.jpg

 

152032348_169130018154556_5824355524387815179_n.jpg

 

 

 

machine-learning.jpg

 

안녕하세요 괴짜 개발자 namedboy 입니다.

인공지능이 필수여서 부담을 느끼는 마케터분들에게 정말 추천하는 책이다. 6개월간 인공지능 교육을 받으며 공부해본 사람으로서 이 책은 독자를 배려한 책임을 바로 느낄 수 있었다. 또한, 주피터 노트북, 파이썬, 세이지메이커 이 모든 걸 몰라도 쉽게 따라 할 수 있게 만들어 놔서 부담이 없다. 학습하는데 참고할 수 있는 깃허브 및 코드를 참고할 수 있는 페이지도 부록에 넣어놔서 학습한데 어려움이 없다.

연구소에서 스터디를 개설하여 진행할 수 있는데, 이 책으로 진행해도 좋겠다는 생각이 들었다. 현재 우리 연구소 연구원님들은 딥러닝을 이미 구현할 줄 아시는 중급 이상 분들이 많지만, 마케터 분들이 많이 유입되면 이 책을 기반으로 스터디를 열어 머신러닝 입문용으로 좋겠다는 생각이 바로 들었다.

마지막으로, 한빛미디어에서 좋은 책을 출판한 것에 정말 감사하며 머신러닝 & 딥러닝 엔지니어, 리서처가 아니어도 머신러닝을 통해 어려움을 극복할 수 있음을 많은 사람들이 알았으면 좋겠다.

만약 자신이 경영 지원, 기획, 운영 관리, 마케터 이쪽 계열인데 인공지능을 공부하고 싶다면 위 책을 꼭 추천한다.

 
오늘 리뷰할 책은 [비즈니스 머신러닝] 이다. 사실 이런 책이 많이 나오길 기대했던지라 꽤나 기다린 책이다.

 

표지 2021-02-21 20.17.09.jpg

 

 
그동안 주로 이론적인 내용만 다루는 머신러닝/딥러닝 책을 보다보니, AWS를 직접 사용하는 내용을 담은 이 책은 신선했다.
 
이 책은 초중급용이라고 소개하고 있고, 머신러닝이나 용어들에 대해서도 설명은 적절히 되어 있긴 하지만 
 
책의 분량상 아직 머신러닝에 경험이 없는 분은 다른 책을 먼저 보길 권한다. 
 
이 책에서는 단순 예측 뿐만 아니라 자연어 처리와 시계열 데이터 분석에 대한 내용도 다룬다.
 
또한 AWS 에 가입조차 안되어 있다면 반드시 부록부터 봐야 할 것이다.
 
 

가입 2021-02-21 20.17.00.jpg

 

 
그리고 책의 설명대로 반드시 사용하지 않는 리소드들은 삭제 및 중지를 해야 과금을 피할 수 있다.
 
어려운 내용과 용어들이 꽤 나옴에도 번역은 괜찮아 보였다. 그런데 책의 분량이 330여 페이지 정도밖에 안되는지라
 
주피터 노트북에 대한 내용은 너무 설명이 적어서 초보자들에게는 어려울 수 있겠다. 그렇지만 AWS를 사용하므로
 
설치에 대한 부담은 줄어들테니 크게 걱정할 필요는 없을거 같다.
 
책 중간에 회사 업무 프로세스에 대한 설명들이 은근히 있다. 그런데 개인적으로는 왜 이런 내용을 넣었는지 이해가 가질 않는다.
 
머신러닝과는 크게 연관이 없어보이는데 아무래도 비즈니스적인 시나리오랑 연관지으려고 넣은 내용처럼 보인다.
 
실행 결과에 대해서는 다양하고 예쁜 챠트를 기대했지만 아쉽게 흑백으로만 간단히 설명하고 있다.
 
 

챠트 2021-02-21 20.16.34.jpg

 

 
AWS의 크레딧이 있긴 하지만 개인용이고 아무래도 과금 때문에 신경 쓰여 예제를 다 돌려보지는 못했다.
 
나중에라도 다시 천천히 보면서 실행하고 복습할 기회가 있으면 좋을거 같고, 
 
AWS를 처음 사용해보는 사람들은 차근차근 주의해서 사용하길 권한다.

비즈니스 머신러닝

 

 

[1]읽은 목적

-머신러닝-> 현직에 없으면 대부분 사용하는 데이터는 kaggle 등의 대회용 정제된 데이터 혹은 연구자들이 정리한 데이터를 사용하게 됩니다. 이런 식으로 되면 성능 좋은 모델을 만드는 데에는 도움이 될 수 있어도, 그 데이터를 다루는 방식에서는 취약해지기 때문에, 현실에서 접하는 데이터를 다루는 오히려 떨어지게 됩니다.

 

이 점을 비즈니스 머신러닝이 채워 줄 수 있을 것이라고 생각하고 읽었습니다. 

 

[2]어떤 사람들을 위해 썼는가?

 

데이터 분석에 관심이 있으면서도 파이썬에 익숙하지 않은 사람을 위한 책입니다.

 

다른 머신러닝 관련 책의 끝 부분에서 다루거나 아예 다루지 않는 방법들을 확실한 예측 효과를 위해 사용하면서도, 원리에 대해서 느낌적인 느낌 같은 설명으로, 어렵지 않게 넘어갈 수 있도록 배려했습니다.  

 

또한 책에서 쓰는 코드에서 일부만 고치면 자신들만의 모델을 만들 수 있게 짰다고 합니다.

 

(물론 실제 분석을 하는 사람 입장에서는, 잘 만들어진 템플릿이라고 해서, 그 템플릿을 맞는 데이터를 가져오지 않으면 무용지물이기 때문에, 실제로 템플릿을 사용하려면 사용자가 직접 데이터를 변형시켜야 될 것인데..... ) 

 

 

[3]주 내용

 

 전력 예측 모델 같은 전통적인 머신러닝의 예측 문제부터, 이것을 전문가가 검토해야 하나와 같은 의사 결정 문제와 같은, 

현실에 있을 법한 문제를 던져 놓고, 이를 머신러닝을 통해서 해결해나가는 것이 주된 내용입니다. 

 

분석 방법보다는 현실의 문제 같이 않는 당연한 것들(빵집에 주문이 끊기거나, 경비 문제 같은 잡무)을 어떻게 구조화 시키고, 자동화 시킬 것인가가 주요 내용으로, 어떻게 보면 서비스 기획 같은 느낌입니다.

 

이에 더해, 책 내용을 직관적으로 이해할 수 있도록 , 아마존 세이지와 주피터 노트북을 이용해, 실행 버튼만 클릭해도 진행되었고, 이 점에서 코드에 대한 부담감은 매우 적습니다. 

 

이 점에서, 머신러닝이 잘 해결할 수 있는 데이터를 가져와 푸는 것이 주된 내용인 다른 머신러닝 책들과 비교해서는 신선합니다.  

 

 

[4]기대 독자 

 

처음 머신러닝을 공부하실 분보다는 바로 현실에서 사용해보고 싶은 분, 또는 머신러닝은 아는 데, 데이터 그 자체를 다루는 방법을 모르시는 분들에 도움이 될 것 같습니다.

 

전자는 의욕이 있다면, 엑셀로 고생하는 것 정도 일 것이고, 후자는 공공 데이터 포털 같은 데서 데이터 사용하실 때, 어떻게 데이터를 바꾸면 좋을지 고민하게 해는 계기가 될 수 있을 것 같습니다.

 

<비즈니스 머신러닝>, 더그 허전/리처드 니콜 지음, 김정민/문선홍/정용우 옮김, 한빛미디어, 2021

 

기업 경영은 의사결정의 연속이라 해도 과언이 아니다. 매 순간순간이결정해야 할 일 투성이다. 모든 의사결정을 최고 경영진이 할 수 없으니, 권한을 적절히 위임하여 의사결정 체계를 구축한다. 의사결정에는 의사결정자의주관이 반영되지만, 의사결정을 받고자 하는 사람의 주관도 반영된다. 품의자는자신이 원하는 결과를 도출하기 위해 근거 자료를 만들고, 의사결정자도 자신의 판단이 틀리지 않았음을증명할 근거 자료를 원한다.

 

빅데이터, AI의 발달로 최근 기업의 화두는 디지털 트랜스포메이션이다. 거대기업일수록 디지털 트랜스포메이션을 강조하지만 변화의 속도는생각만큼 빠르지 않다. 기존에 사람이 하는 반복적인 업무를 자동화하는 것으로만 이해하는 경우도 있다. 과거에 기반해 현재의 업무를 개선하는 것에 초점이 맞춰져 있다. 하지만빅데이터, AI는 불확실한 미래에 대한 예측에 더 도움이 될 것이다.즉 과거를 기반으로 미래를 예측해 현재를 개선하는 것이 아닐까 싶다.

 

가령 기후위기는 이제 기정사실로 받아들여진다. 지구 평균 기온상승에 따른 지역별 기후의 변화, 그로인한 경작지의 변화 등을 예측한 시나리오는 공개되어 있지만 우리기업에 미칠 영향에 대해서는 예측하기 어렵다. 이를 예측하기 위한 내부 정보도 부족하지만, 고려해야할 외부 변수가 너무 많다. 엑셀에 의존해 예측할 수 있는범위가 아니다. 그래서 머신러닝에 관심을 갖게 되었다.

 

기후변화에 대한 정보와 우리 회사의 원재료 조달, 제조, 판매, 유통 등의 정보를 통해 기후변화 시나리오에 따른 미래 경영환경을 예측할 수 있지 않을까하는 발칙한 상상을 했다. 그렇게 <비즈니스머신러닝>이 눈에 띄었다.

 

비즈니스 시스템이 엉망인 두 가지 이유가 있습니다. 첫째, 개인의 습관을 바꾸는 것도 쉽지 않지만 집단의 특성을 바꾸는것은 더더욱 어렵습니다.() 둘째,비즈니스 시스템 여러 개를 관리하는 것은 매우 어려운 일입니다.(31)

 

<비즈니스머신러닝>은 아마존 세이지메이커와 주피터를 활용해 머신러닝을 활용하는 방법을 전하고 있다. 먼저 기업에서 효과적인 의사결정을 위해 머신러닝 도입이 필요하다고 강조한다.그동안 컴퓨터 처리능력의 발달은 비즈니스 생산성을 높여줄 것이라 했지만, 실제로는 비느니스생산성이 크게 증가하지 않았다고 한다. 경제학자 로버트 솔로는 컴퓨터시대가 도래했다는 사실이 도처에서 확인됐지만 단 한 곳 생선성 통계만은 예외다라고 비꼬아 말했고, 경제학자들은 이를 솔로 패러독스라고부른다고 한다.

 

생산성은 반복 작업 수행을 위한 자동화가필요한데, 업무 중 의사결정은 규칙에 기반하고 예외적인 상황이 많아 사람의 개입이 필요해 자동화하기어려워 생산성이 증가하지 않았다고 한다. 사람은 규칙기반 의사결정과 패턴기반 의사결정을 모두 사용해의사결정하는데, 그동안의 프로그램은 규칙기반 의사결정에 국한해 개발되었고, 패턴기반 의사결정은 여전히 사람에 의존할 수밖에 없었다는 것이다. 머신러닝은데이터셋의 패턴을 기반으로 의사결정할 수 있어 자동화를 통해 생산성 향상이 가능하다고 한다.

 

머신러닝을 비즈니스에 적용할 때 진정한 이점은 변화에 탄력적인 의사결정 애플리케이션을구축할 수 있다는 것입니다. 시스템에 수십 또는 수백 개의 규칙을 프로그래밍하는 대신 과적의 올바른결정과 잘못된 결정의 예시를 머신러닝 애플리케이션에 입력하기만 하면 됩니다.(9)

 

그리고 <비즈니스머신러닝>은 비즈니스를 위한 머신러닝 시나리오 6가지를통해 어떻게머신러닝을 사용할 수 있는지 보여준다. 구매 결재 검토 요청 여부 결정, 이탈 조짐 있는 고객 찾기, 고객 문의 사항 전달 여부 결정, 공급업체 청구서 추가 질의 여부결정, 월간 전력 사용량과 예측 성능 향상으로 원재료 조달부터 고객 관리, 협력사 관리, 운영 관리 등 밸류체인 전반을 다루고 있다. 기후변화 시나리오 예측과 관련되어 보이는 월간 전력 사용량 예측에 특히 관심이 갔다.

 

비즈니스에 머신러닝을 도입해야 하는 이유와방법에 대해서는 어느 정도 깊이 이해할 수 있었다. 다만 누구나머신러닝을 시작할 수 있게 하겠다는 저자의 집필의도에도 불구하고, 코드에대해 잘 모르는 사람으로서 쉽게 이해하고 따라하기에는 어려움이 있었다. 아직 기후변화 시나리오 예측이라는 발칙하고 무모한 도전이 결실을 맺은건 아니지만 가능성은 확인할 수 있어 만족한다.

 

* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.

 

머신러닝 이론에 치우치다 보면 결국 그래서 이걸 어떻게 써먹어야 될지 난감할 때가 종종 있다. 그래서 현실과 가까운 데이터를 다루다 보면 내 업무에도 이렇게 적용하면 되겠다는 아이디어가 떠오르기도 한다.

이 책은 실무에 최대한 촛점을 맞춰 제작되어 있다. SageMaker를 예전부터 사용해 보고 싶었는데 해당 도서가 출간되어서 읽어보게 되었다.

머신러닝 모델을 만들고 비즈니스에 적용하려면 이 모델을 어떻게 실 서비스에 적용하고 배포해야하는지에 대한 이해가 필요한데 요즘 대부분 클라우드 환경을 사용하다보니 SageMaker에 관심을 갖게 되었다.

이미 주피터 노트북을 통해 머신러닝이나 딥러닝 모델을 만들어 본 사람들이라면 이 책의 SageMaker 사용법은 쉽게 느껴질 수 있다. 내 컴퓨터가 아닌 클라우드 환경에서 주피터 노트북을 사용해 실제 머신러닝 모델을 만드는 과정을 소개하고 있다.

로컬 컴퓨터 환경에서 주피터 노트북을 사용해보지 않았다면 로컬 컴퓨터 환경에서 우선 아나콘다 등의 툴을 사용해 주피터 노트북으로 같은 과정을 진행해 보는 것이 왜 SageMaker를 사용해야 하는지에 대한 이해를 도울 수 있을 것 같다.

실제 비즈니스 환경에서 머신러닝을 응용할만한 일들은 정말 무궁무진하다. 이 책의 초반부에 나와있는 설명처럼 우리의 의사결정을 앞으로는 머신러닝이 대신해줄 일들이 많다.

다음의 내용은 책에 나온 예시다.

  • 주문을 승인하는 사람이 승일할 권한이 있는지?
  • 품절된 품목에 대해 다른 제품으로 대체해도 괜찮은지?
  • 공급업체가 제품을 다른 제품으로 대체했을 때 고객이 이를 수용할지?
  • 청구서를 그대로 지불 승인해야 할지? 추가적인 질의를 해야할지?

비즈니스 환경에 대한 시나리오를 작성하고 해당 시나리오에 맞는 머신러닝 모델을 만들어 봄으로 우리가 왜 비즈니스에 머신러닝을 도입해야 하는지에 대한 설명을 담고 있다.

이 책은 SageMaker라는 특정 제품군을 설명하고 있지만 SageMaker를 제외하고 봤을 때도 실제 비즈니스에 적용할만한 시나리오를 제시하고 있다는 점이 마음에 든다.

GitHub 에 소스코드가 있으니 다운로드 받아서 열어보면 목차와 함께 어떤 내용으로 구성되어 있는지 볼 수 있을것 같다.

K9Ns/ml4biz: 비즈니스를 위한 머신러닝 예제

클라우드를 사용해 머신러닝 모델을 프로덕트에 적용해 보고자 하는 분들에게 추천한다. 또 주피터 노트북이나 파이썬 머신러닝에 대한 기본 이해가 없다면 조금 어려울 수도 있으니 주피터 노트북에서 머신러닝 예제를 몇 개 돌려봤다면 이 책을 읽는데 도움이 될 것이다.

sagemaker가 무엇인지 궁금하다면 여기에서 확인해 볼 수 있다 => https://aws.amazon.com/ko/sagemaker/

이 책은 6가지 시나리오를 활용하여, 각각 시나리오를 업무에 적용할 수 있도록 하였다. 각각의 업무 절차를 통하여 어떻게 처리할 것인가를 쉽게 파악할 수 있게 하였고, 어렵고 많은 데이터셋보단 간단하고 쉬운 데이터셋을 통해 실습할 수 있도록 하였다.

또한 대부분 내가 접한 머신러닝 책들은 초심자가 접하기엔 난이도가 있었다. 초심자가 하기엔 너무나 복잡한 수식들이나 개념들이 있어서, 보자마자 피로감과 부담감이 느꼈다. 이 책의 타겟은 '처음 머신러닝을 접한 사람들'로, 필요한 개념만 집고 쉽게 넘어간다. 따라서, 공부에 대한 스트레스와 피로감을 덜 느끼게 만든다.

이 책이 다른 책과의 차별점은 바로, AWS 활용하여 머신러닝을 한다는 것이다. 그동안 내가 봤던 책들도 로컬 자원들을 이용하여, 머신러닝을 돌리는 정도로 끝났다. 하지만 이 책에서 나온 방법은 AWS를 활용해 바로 실무에 적용할 수 있도록 하였다. AWS 셋팅을 하고 머신러닝을 돌릴 수 있다는 것만으로도 이 책의 가치는 충분하다고 생각한다.

# 한빛미디어 <나는 리뷰어다>로 선정되어 쓰는 리뷰입니다.

 

아래 리뷰는 한빛 미디어에서 진행하는 <나는 리뷰어다> 이벤트를 통해 도서를 제공받아 작성하였습니다.

본 도서의 최대 장점은 실습을 통한 활용 예시를 상세하게 설명하고 있고, 해당 예제 또한 git hub를 통해 제공하고 있어서,

데이터등의 가공이 필요하지 않다면 추가로 코딩이 필요하지 않아 보입니다.

 

다만, 아래 리뷰는 이러한 실습의 절차는 따라 하지 않고, 오롯이 책의 내용만 읽고 작성하였습니다.

 


결론부터 말하자면, 아래의 독자에게 가장 유용한 책

 

1. 아마존 세이지 메이커와 주피터를 활용한 머신러닝을 학습하고자 하는 독자

2. 책 내의 6가지 실제 활용 사례와 유사한 사례에 머신러닝을 적용하고자 하는 독자

3. 머신 러닝의 개념이나 AI의 개념에 대해 막연히만 알고 있어, 실 활용사례에 적용되는 데이터 흐름및 적용이 어떻게 되는지를 알고 싶은 독자

 

 

그리고, 세이지 메이커를 사용할 이유가 없고, tf 등을 이용하여 머신 러닝을 기 학습하신 분들은 이 책의 6가지 활용 사례 부분에서 필요한 부분만 발췌하여 보는 도 좋을 것 같다.

 

 

1. 확실히 세이지 메이커와 주피터를 활용하시는 독자라면, 초보자일 수록 이 책의 활용가치가 높아 보인다. 어떤 책이든 "hello world"는 있듯이, 이 책에서도 셋업에서부터 code 설명까지 자세하게 설명하고 있다.

 

2.실습의 영역을 떠나서, 책에서 소개하는 6가지의 시나리오는 해당 프로세스의 end to end를 정의하고, 머신러닝이 어떤 부분에 적용이 되어야 하고, 실제 데이터 engineering 의 부분까지 상세하게 다뤄주고 있다.

 

3. AI, 머신러닝, 딥러닝등 개요와 알고리즘 중심의 개념만을 가진 분이라면, 흔히 접할 수 있는 Image, NLP 등에 활용 되는 사례 외에, 실용적이고 현실적인 내부 프로세스를 알아가는데 도움이 될 것으로 보인다.


한빛미디어에서 진행하는 <나는 리뷰어다 2021>에 신청했는데 제가 선정되었습니다!! 

오예!!! 진짜 이렇게 열심히 공부하라고 또 도와주시니, 너무 감사합니다..! 


한빛미디어의 나는 리뷰어다는 한 달에 한 번, 한빛미디어에서 보내준 도서 리스트 중에 읽어보고 싶은 도서가 있으면 신청해서 그 도서를 성실히 읽고 리뷰를 작성하는 거예요! 너무 좋은 거 있죠?


제가 올해, 처음으로 신청한 도서는 바로!

비즈니스머신러닝(한빛미디어 / 2020.12.23) 입니다!! 

표지가 좀 신기하죠? ㅋㅋ 표지에 엄청난 매력을 느끼진 않았지만.. ㅋㅋㅋ

그래도 뭔가 나름 간지가 느껴져서 좀 좋았습니다. 


​그리고 책의 느낌이 빳빳하기보다, 종이가 얇아서 흐물흐물 잘 말리는(?) 도서라 해야하나!?ㅋㅋ그래서 너무 좋았어요 ㅋㅋㅋ 딱 제가 좋아하는 재질이거든요 ㅋㅋ 종이가 얇아서 책이 두껍게 느껴지지 않는!!!


일단 책을 보면서 전체적으로 느꼈던 것 중 하나는 친절한 도서는 아니다였어요. 

그 이유가, 첫번쨰는 책에 예제와 표 등이 되게 많이 있었는데. 

예를 들어, 예제 2-7가 69p에 나오는데. 

77p쯤에 다시 예제2-7를 언급하는 이런 경우가 종종 있더라고요. 

그러면 다시 예제 2-7을 확인하러 돌아가서 보고. 

이래야하는 귀찮음이 있어서 처음엔 그게 조금 별로였어요.

 

그리고 두번째는 난이도가 물론 초중급책이긴 한데. 

사실 처음엔 중급같은 느낌이 더 강했어요. 

정말 초보자가 본다면 조금 어렵겠다 싶었던 게, 개념에 대한 설명이 없거나. 

있어도 설명들이 너무 간결하다보니, 명확하게 이해하기가 좀 부족했거든요.

근데 초보자를 위한 나름의 도구에 대한 설명이나 이런것들이 있어서, 

초중급이 맞구나 싶었지만 도서가 친절하진 않구나 라고 생각했죠.  


그래서! 만약 초보자가 이 책을 사실거라면, 이런 분들이 사면 좋을 것 같아요. 

책만 보고 공부를 끝내겠다는 분보다는

내가 책에 나온 개념들 중 이해가 안되는 건 찾아보고 여기 책에 정리하고. 

그러면서 책에 나온 것들을 하나하나 이해해 나가겠다. 

이런 생각을 가진 초보자분들이 읽기에 정말 좋겠다고 생각했어요. 

왜냐하면 책이 머신러닝을 쓰기 좋은 상황들을 만들어서, 

거기서 머신러닝을 구축하고 그 과정에서 생기는 개념과 방법을 설명하는 방식이거든요.

상황별로 머신러닝을 구축할 때마다 필요한 머신러닝 개념들을 다양하게 짚고가요.

책이 개념들을 간결하게 다루는거지, 그 개념들을 도서에 아예 누락시키는 게 아니라서.

개념에 대한 설명이 부족하거나 할 경우, 

그 부족함을 내가 직접 찾아서 채워넣고 공부할 마음이 있는 초보자라면.

머신러닝에 대한 개념 및 적용, 설명등을 이 한권에 다 단권화할 수 있겠단 생각이 들었거든요!!

그래서. 책만 보고 공부를 끝내겠다기보단,

책에 나온 것들을 보면서 내 개인공부를 하겠다는 사람에게 추천!!

 

아, 그리고 챕터가 끝날때마다 요약이 잘 되어 있는 것도 좋았어요. 

이 챕터에서 어떤 내용을 다뤘는지 요약만 봐도 어느정도 알 수 있다보니. 

챕터 다 보고 요약을 보면, 

아 내가 잘 이해했구나 또는 내가 이 부분은 이해가 좀 부족했구나 하면서

체크할 수 있어서 좋더라고요!!! 


마지막으로, 번역서지만 읽는데 불편함이 느껴지지 않아서 좋았어요 ㅋㅋ

물론 예시를 들거나 했을 때, 우리나라 문화와는 약간 다른 느낌도 조금 느껴졌지만

그런 것들이 이해를 방해하거나 그렇지 않아서 참 좋게 읽었습니다 :) 


이렇게 한 권을 읽으니 뿌듯하고 참 좋네요. 

앞으로도 나는 리뷰어다 2021 활동 열심히 하면서 

IT도서 공부하실 때 도움이 될 수 있는 책정보 가져와서 공유할게요!! 


# 개념이 조금 부족하지만, 

  책에 나온 개념들을 인터넷이나 다른 곳을 참고해서 100%이해하면서  

  책을 필기로 채워나갈 의지가 있는 분이라면. 

  그런 분들이 사서, 머신러닝에 나오는 기본 개념들을 정리하며 실습까지 할 수 있는 좋은 책!!  


#비즈니스머신러닝 #한빛미디어 #나는리뷰어다2021 #솔직하게쓴리뷰

#단권화하기좋은책 #열심히공부할초중급자추천도서 #나도열심히할거야 #공짜로받은책

머신러닝에 대한 이론 공부만 해서는 실무에서 적용할 때 무쓸모가 될 수도 있기에

실무에 적용을 어떻게 해야하는지에 대해서 살펴보고자 찾던 중 찾게 된 도서 !!

 

 "Machine Learning for Business"

 

 

sagemaker-00.png

 

 

 

왠지 멋지게 생긴 선장 같은 아저씨가 더욱 더 눈길을 잡아끌었다.

 

하지만, 보험약관 처럼 놓친 것이 있었으니...

"아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법"

 

어쩐지 추천의 글에 있는 2분 모두 AWS코리아 소속이시더라니...

 

 

뭐 하지만, 회사에서도 퍼블릭 클라우드 사용량을 보면 대부분 AWS를 쓰고 있고,

글로벌 트렌드를 봐도 뭐 AWS가 대세이기는하니 ...

이번 기회에 말로만 듣던 세이지메이커 한 번 써보지 뭐 !!!

 

 

우선 AWS 가입부터 해야하는데,

친절하게도 책의 뒷 부분에 있는 '부록'에

"AWS 가입"부터 파일 저장을 위한 S3 설정 및 사용방법, 세이지메이커 설정 등에 대해서 친절히 알려준다.

 

 

sagemaker-02.png

 

 

 

그런데, AWS 서비스 쓰려면 돈드는 것 아닌가!?

 

본래 처음 가입하면 1년간 어느 정도 사용할 수 있는 무료 정책이 있다지만

나는 이미 무료 1년이 지났는데... 그래서 홈페이지 찾아가봤다.

 

 

sagemaker-05.png

 

 

 

리전을 서울로 바꾸지는 말자.

시간당 요금이 여기보다 비싸다.

 

그런데, 실제 사용하면 얼마쯤 나온다는 것일까?

 

 

 

sagemaker-06.png

 

  

 

2시간 정도 쓰면 500원쯤 지불한다는거네... 음... 나의 똑똑해짐을 위해 이 정도는 투자해줘도 될 것 같다.

뭐, 기본 환경 구축은 이 정도로 하고...

 

 

책의 내용을 살펴보자.

 

 

sagemaker-03.png

 

 

 

일반적인 회사의 운영 영역을 시나리오로 해서 구성이 되어있다.

 

 

각 시나리오에 따라 데이터가 제공되고

그 데이터를 모델에 적합한 형태로 가공도 하고

학습/검증/테스트 용도에 맞게 데이터셋 분리도 해보고

시나리오와 데이터에 맞는 머신러닝 알고리즘을 선택해서 학습도 한다.

심지어 AWS 비용 절감을 위한 관리 방법까지도 알려준다.

 

 

다만, 이렇게 실제 머신러닝을 비즈니스에 적용하기 위한 과정을

AWS SageMaker를 이용해서 적용하는 과정에 대해서 설명을 하다보니

머신러닝에 대해서는 많은 분량으로 설명해주지는 않는다.

 

하지만 이 부분은 절대 이 책의 단점이 아니다!!!

 

이 책은 분명히 타이틀에 적어놓은 것 처럼

"비즈니스 머신러닝"에 대한 책이다!!!

 

 

또한,

"아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법"에 대해서 알려주는 책이다.

 

 

 

그리고, 이 책의 경우 원서에는 없는 설명도 포함되어 있다.

 

 

sagemaker-04.png

 

 

  

IT 서적의 안타까운 부분인데... 대상 시스템이 업그레이드가 되어버려 버전이 맞지 않게 되는 것이다.

하지만, 친절하게도 버전을 맞출 수 있는 방법을 가이드해주고 있다.

 

 

머신러닝에 대해서 기본적인 사항들을 공부하신 분들에게 추천하고픈 책이다.

전체적으로 어떤 흐름으로 비즈니스에 적용하는지 살펴보기에 충분히 괜찮은 책이다.

 

 

 

비즈니스 머신러닝

본 소개는 한빛미디어의 도서 서평단 이벤트를 통해 작성되었습니다.

 

머신러닝이 온 업계의 화두입니다. 이제 기술에 관심이 있는 사람들이라면 머신러닝이 어떤 과정을 통해 작동하는지 대충은 이해하고 있을 것입니다. 하지만 과연 이게 개발 업무를 하지 않는 사람과도 상관이 있는 이야기일까요? 이 책은 머신러닝이 일반적인 경영환경에서 어떻게 적용될 수 있는지 예제를 통해 설명합니다.

 

총 6개의 시나리오는 1. 고객(3장과 4장), 2. 공급업체(2장과 5장), 3. 자원(설비 관리, 6장과 7장)이라는 일반적인 회사의 SCM 영역을 다룰 수 있도록 구성되어 있습니다. 그리고 각 시나리오에 따라 머신러닝의 모델을 확장해가며 XG부스트, 자연어처리, 이상치 정의, 랜덤 컷 포레스트, 신경망, DeepAR 등의 개념을 설명합니다. 그리고 마지막으로는 실제 프로덕션에서 다른 사용자들과 모델을 공유하기 위해 필요한 작업을 설명합니다.

 

이 책에서 다루고 있는 머신러닝 이론과 설명은 다른 두꺼운 책들에서도 충분히 찾아볼 수 있는 내용들입니다. 하지만 이 책의 장점은 실제 비즈니스 사례를 다루는 과정에 있습니다.

 

먼저 전체 사이클을 체험할 수 있도록 구성되어 독자가 실제 사례에 적용할 때 발생가능한 문제들을 미리 시뮬레이션해 볼 수 있습니다. 문제의 시작부터 이를 분석하기 위한 세이지메이커와 쥬피터노트북의 설정, 그리고 실제 프로덕션에 적용하기까지 비즈니스에 머신러닝을 적용하기 위한 전체 과정을 체험해 볼 수 있습니다.

 

또한 이 책은 구조화된 데이터가 넘쳐나는 기술 기반 회사들이 아닌 일반적인 SCM을 갖고 있는 기업을 사례로 들고 있습니다. 비즈니스 환경에서 기술을 적용하는 데에 있어서 가장 어려운 점은 자동화를 할 프로세스가 정립되어 있지 않고 학습에 사용할 데이터의 구조도 명확하지 않다는 데에 있습니다. 이 책의 장점은 어떤 데이터셋을 준비하고 현재의 프로세스를 어떤 방식으로 구조화하면 머신러닝을 사용할 수 있는지 제안해 줍니다.

 

마지막으로 매우 사소하게 지나칠 수 있지만 실제 적용과정에서는 많은 시간과 에너지를 소모시킬 수 있는 항목들을 꼼꼼하게 챙기고 있습니다. 머신러닝 테스트 과정에서 발생할 수 있는 비용 항목들과 이를 방지하기 위한 방법들, 데이터 집계에서 에러가 발생할 수 있는 경우들에 대한 언급들을 예로 들 수 있습니다.

 

여러 부분들에서 저자가 실제 일반 기업들을 대상으로 비즈니스 자동화 서비스를 제공하는 기업의 CEO라는 사실을 느끼게 해준 책이었습니다. 파이썬에 대한 경험이 있으면 더 쉽게 이해할 수 있을 것으로 보이고 AWS 세이지메이커를 Azure나 GCP와 비교해주었으면 더 좋았을 것 같습니다.

 

이번에 함께 봐볼 책은 한빛미디어의 <비즈니스 머신러닝> 입니다.

 

먼저 결론부터 말씀드리죠.

 

이 책은 최소 3번은 읽어주시길 바랍니다.

 

이 책은 얇습니다.

 

이 책은 초중급자에게 '필요한' 책입니다.

 

그럼 본격적으로 책에 대해 말해보겠습니다.

 

먼저 표지부터보면 책의 원제목과 간단한 부제목을 확인할 수 있습니다.

 

그리고 책의 옮긴이가 3명이나 되는 것을 볼 수 있습니다.

 

모두들 IT와 AI관련하여 공부와 경험을 5년 이상 쌓으신 분들께서 책을 옮겨주셨습니다.

 

아까 말씀드렸듯이 책은 얇지만 반드시 3번이상 읽어보라고 한 이유입니다.

 

'경험'이 녹아들어있습니다.

 

그리고 그 경험에 우리가 알아야 될 '이론'에 대해 맥락에 맞게 설명되어있습니다.

 

 

 

책에 대한 소개도 간단히 보면 머신러닝에 대해서만 말하는 것이 아닌 실제 프로젝트 수행을 하는 경우에 상황을 펼쳐주시고 어떻게 어떤 기술로 대응해야 될지 운을 띄워주고 있습니다.

 

기술책이 이해하기 어려운 점은 이론과 실제가 동떨어져있는 느낌을 받기 때문입니다.

 

이 책의 특장점이 여기서 나옵니다.

 

경험을 그대로 책에 옮겼다는 것입니다.

 

그래서 마치 대선배가 신기술에 대해서 경험과 함께 논리적으로 설명해주는 컨퍼런스에 온 느낌을 받을 수 있었습니다.

 

경험을 이론에 녹여냈기 때문에 책이 재밌습니다.

 

모든 이론을 이해할 수 없어도 책 자체의 맥락흐름이 훌륭하기때문에 책이 잘 읽힙니다.

 

책의 내용을 한 번 살펴보겠습니다.

 

 

 

 

 

 

 

 

 

먼저 시작부터 봐보면 특정 상황을 설정합니다.

 

우리가 머신러닝이라는 기술을 왜 배우냐를 생각해보는 것입니다.

 

결국에는 특정한 문제를 해결하기 위함입니다.

 

일단 그 문제가 무엇인지는 모르지만 상황을 살아가는 우리들에게는 상황을 바꿔야되는 것이기 때문에 기술이 필요하게 되는 것입니다.

 

그래서 이 책의 특장점이 또 나오게 됩니다.

 

바로 상황설정입니다.

 

처음 무언가를 배울 때 어려운 점은 공감이 가질 않기 때문입니다.

 

그래서 우리는 계속해서 예제를 찾아보고 이해가기 쉬운 예시를 찾아서 자신에 적합하게 이해합니다.

 

이 책에서는 대표적인 상황을 6개정도 보여주면서 어떻게 머신러닝으로 상황에 대응하는지 보여줍니다.

 

 

 

또한 머신러닝에서 중요한 것은 무엇이며 알고리즘과 같은 다른 지식과 엮어서 추가적인 설명을 보여주고 있습니다.

 

저 또한 머신러닝에 대한 이론만을 배우다가 이러한 상황을 절차적으로 배움에 따라 빠르게 이해할 수 있었습니다.

 

 

 

 

 

 

 

이 책에서는 자연어처리와 딥러닝과 같은 부분에 대한 활용도 보여주고 있습니다.

 

얇은 책이지만 연관지어 활용할 수 있는 부분을 함께 설명해주고 있어서 지식활용의 큰 그림을 볼 수 있습니다.

 

요약부분과 이론적인 용어를 어떤 상황에서 사용하는지 실생활에 대입해서 설명해주고 있습니다.

 

책 이름은 '비즈니스' 라고 했지만 결국에는 비즈니스는 돈과 연관되어 있고 돈은 우리 실생활과 연결되기 때문에 이 책이 필요한 이유가 될 것입니다.

 

 

 

 

 

 

신경망에 대해서 설명해주고 있는 것을 확인할 수 있습니다.

 

이 책을 통해서 초급자들이 바로 이해하는데는 무리가 있겠지만 산과 같은 큰 그림을 그리는데 도움이 될 것입니다.

 

결국에는 지식의 연장선으로 머신러닝과 딥러닝은 연결되고 딥러닝에서 활용되는 기술은 머신러닝에서 파생된 것이 있기때문입니다.

 

자신의 지식을 확장시키는데 아주 좋은 도구가 될 것입니다.

 

머신러닝을 활용하는데 예측을 위해서 사용하기도 합니다.

 

예측은 데이터 기반으로 이뤄지고 데이터를 통해 보여집니다.

 

어떠한 현상을 바라봐야 될지 기술적인 전문용어로 설명을 해주는 것을 볼 수 있습니다.

 

이 책에서 볼 수 있는 특장점은 주석입니다.

 

소스코드만 있는 책들은 독학을 하는 경우 어렵습니다.

 

이 책에서는 코드를 실행시켜보는 것뿐만 아니라 코드를 읽으면서 흐름을 파악하고 주석과 함께 이해할 수 있습니다.

 

 

 

 

 

마지막으로 소개드릴 부분은 거시적인 시선과 책에 대한 또 다른 소개입니다.

 

책에서 사용하는 기술은 AWS를 메인으로 활용합니다.

 

실제로 파이썬이라는 프로그래밍 언어만으로 머신러닝을 이해하기는 어렵습니다.

 

기술이 발전하면서 이와 함께 기술을 더 쉽게 활용하는 것이 중요한 부분입니다.

 

그러면서 많은 도구들이 개발되었고 그 도구의 선두주자인 AWS의 서비스를 설명합니다.

 

이 책과 함께 AWS에 대해 큰 그림을 그려보는 것도 좋은 경험입니다.

 

실제로 회사에서도 AWS를 활용하고 있는 추세고 구글의 GCP와 함께 다양한 서비스를 제공하고 있습니다.

 

마지막으로 이 책은 비즈니스를 위한 머신러닝 책이기도 하지만 IT에 대한 지식을 확장시켜주기도 하는 책입니다.

 

 

 

클라우드와 데이터베이스, 비즈니스 패턴, 상황을 해결하기 위한 도구의 활용 등 다양하게 생각하고 실제로 머신러닝 모델적용, 데이터 분석 측면에서도 배울 수 있기 때문에 다각도의 주제를 다루고 있습니다.

 

이 책을 기반으로 데이터  분석뿐만 아니라 머신러닝 엔지니어쪽의 지식을 확장시켜보는 기회가 되시길 바랍니다.

[한줄평]

실제 비즈니스에서 어떻게 머신러닝을 적용하는 알수있다.


[목차]

[Part 1 비즈니스를 위한 머신러닝]

CHAPTER 1 머신러닝이 비즈니스에 적용되는 방식


[Part 2 비즈니스를 위한 머신러닝 6가지 시나리오]

CHAPTER 2 기술 담당자에게 구매 결재 검토 요청을 전달해야 하는가

CHAPTER 3 이탈 조짐을 보이는 고객 찾기

CHAPTER 4 고객 문의 사항을 고객지원팀에 전달 여부 결정

CHAPTER 5 공급업체가 보낸 청구서에 대해 추가 질의 여부 결정

CHAPTER 6 월간 전력 사용량 예측

CHAPTER 7 월간 전력 사용량 예측 성능 향상


[Part 3 프로덕션에 머신러닝 적용하기]

CHAPTER 8 웹 서비스로 예측 모델 제공하기

CHAPTER 9 사례 연구


[이 책의 특징]

  • 구매 요청부터 승인까지의 구매 요청 전달 과정 자동화

  • 이탈 조짐을 보이는 고객을 찾는 XG부스트 애플리케이션 구축

  • 불만 트윗을 식별하는 머신러닝 모델 구축

  • 공급업체가 보낸 청구서에 대해 추가 질의 여부 결정

  • DeepAR 알고리즘으로 월간 전력 사용량 예측

  • DeepAR 알고리즘으로 월간 전력 사용량 예측 성능 향상


[대상 독자]

- 파이썬 언어보다 엑셀 사용이 더 편한 독자

- 머신러닝을 비즈니스에 적용되는 방법을 배우고 싶은 데이터 과학자나 개발자

- 아마존 세이지메이커로 머신러닝을 어떻게 구현해야하는지를 배우고 싶은 실무자


[서평]


이제는 인공지능이 정말 선택이 아닌 필수인 시대가 되었습니다. 정부기관에서도 데이터기반으로 행정을 결정하고 기업들 또한 비즈니스 결정을 데이터기반으로 의사결정을 하는 시대가 도래되었다. 

기업에서는 머신러닝을 적용하여 비즈니스 프로세스를 더욱 빠르고 유연하게 변경하는 방법을 알려줍니다. 이책은 다음과 같이 총 3 파트로 구성되어 있습니다.


Part1에서는 비즈니스를 위한 머신러닝으로 먼저 기업이 경쟁력을 유지하기 위해 생산성을 지금보다 높여야 하는 이유를 설명하고, 효과적인 의사결정이 생산성 향상에 얼마나 중요한지 설명합니다. 그런 다음 비즈니스에서 의사결정 시 머신러닝이 왜 좋은 방안인지를 그 이유를 살펴봅니다. 그리고 아마존 웹 서비스에서 제공하는 도구와 오픈 소스 도구를 사용하여 실제 비즈니스에서 많이 이루어지는 의사결정 사항에 머신러닝을 적용하는 방법을 살펴봅니다.


Part2에서는 비즈니스를 위한 머신러닝 6가지 시나리오로 머신러닝을 사용하는 시나리오 6가지를 살펴보고 직접 작업을 할수 있습니다. 각 시나리오는 실제 비즈니스에서 이루어지는 의사결정에 머신러닝을 어떻게 사용할 수 있는지 보여줍니다. 그리고, 이 시나리오는 페이스북, 구글 아마존같이 머신러닝을 많이 사용하는 회사가 아닌 일반 기업이 머신러닝을 사용하는 방법에 초점을 맞추고 있습니다.


Part3에서는 프로덕션에 머신러닝 적용하기로 웹에서 머신러닝 모델을 설정하고 공유하는 방법을 배우게 됩니다. 이를 통해 현재 회사 업무의 의사결정 과정에 머신러닝을 적용할 수 있을 것입니다. 그런 다음 몇 가지 사례를 통해 의사결정에 머신러닝을 적용했을 때 발생하는 변화 관리 방법을 보여 줍니다.


이책을 통해서 회사의 비즈니스 정책 결정권자에게 머신러닝 서비스에 대한 이해와 도입 검토를 위한 좋은 안내서가 될 것이라 생각됩니다. 그리고 머신러닝을 처음 접하는 입문자들에게도 쉽게 아마존 세이지메이커를 통해 머신러닐 모델을 어떻게 만들고 배포하는지 배울수 있는 좋은 계기가 될것이라 생각합니다.

 

 

실제 사례 기반의 머신러닝 분석을 배울 수 있는 책이며, 아마존 세이지 메이커(Amazon Sage Maker)를 분석 도구로 사용하시는 분들에게는 최적의 학습 도서라고 생각합니다.
 
일반적인 머신러닝 책에서 '문제 - 분석 - 결과해석'을 중심으로 설명한다면, 이 책에서는 세이지 메이커에서 제공하는 기능들을 활용해 '서비스' 까지 학습 및 구현해 볼 수 있습니다. 

 

business-ml-01.jpg

 

쥬피터 노트북으로 만든 모델을 서비스로 적용할 수 있는 설명이 있다. 머신러닝에 대한 설명과 예제가 좋다.

6가지 시나리오로 여러 사례(의견 도출, 텍스트 분석)을 설명해준다.

이를 가지고 잘 접해보지 못한 아마존 세이지메이커를 이용하여 생각한 부분을 적용할 수 있도록 도움을 준다.

 

 

 
 
도서 협찬으로 작성한 리뷰입니다.

 

가지 회사에서 생길만한 시나리오로 아마존 세이지 메이커를 어떻게 사용하나 설명해뒀다. 법적인 문제, 전기세,트위터 응답에 캐글에서 데이터 받기 등 인공지능을 비지니스에 어떻게 활용하나 나온책이다. 실습은 파이썬 주피터 에디터로 가능하다. 알고리즘 설명도 되어 있고 소스의 주석도 볼만하다. 회사에 다닌다면 추천하고 싶다

난이도는 초중급 이상에게 적합해 보이며, 

 

경영사례를 통한 활용례를 보여주는 시나리오 6개중 

구매주문서, 이탈위험고객 관리 case는 정확한 경영환경에 대한 설명이 조금 불충분해 보여 

회사 생활을 하지않은 이공계열 학생들은 알고리즘 작성시 정확한 프로세스 작성이 어려울 수도 있어 보인다.

 

프로그래밍 파트뿐만 아니라 경영, 비즈니스에 대한 조금더 상세한 설명이 있으면

이 책을 접하는 여러 사람들에게 도움이 될 듯 하며, 

 

시나리오 갯수도 6개가 아니라

회사 업무를 대표하는 50개 또는 100개 정도의 사례를 통해 머신러닝을 활용하도록

하면 더 좋을듯 싶다. 

 

이 책의 부록을 통해 AWS, 주피터 노트북을 가입, 설치등을 설명한 부분은 다른 도서에 

비해 친절해 보여 매우 좋아 보인다.

 

이 리뷰는 한빛미디어 도서협찬을 받아 작성하였습니다.   

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
비즈니스 머신러닝
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
비즈니스 머신러닝
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
비즈니스 머신러닝
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실