메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

데이터 드리븐 리포트

상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬

한빛미디어

집필서

판매중

  • 저자 : 이상석
  • 출간 : 2023-10-31
  • 페이지 : 408 쪽
  • ISBN : 9791169211574
  • 물류코드 :11157
  • 초급 초중급 중급 중고급 고급
4.9점 (33명)
좋아요 : 2

무조건 안 된다는 상사, 데이터로 설득하라!

 

데이터를 근거로 의사소통해야 하는

모든 실무자를 위한 데이터 기반의 의사결정 가이드

 

경험 또는 직관만으로 의사결정자나 이해관계자를 설득할 확률은 0%에 가깝다. 상사나 고객을 설득하려면 데이터에 기반하여 소통해야 한다. 이 책은 데이터 분석을 실무적으로 다루며 방대한 데이터 속에서 핵심 인사이트를 찾아내 그 결과를 명확하게 전달하는 방법을 안내한다. 또한 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여섯 가지 사례를 통해, 분석 목표 파악부터 데이터 유형에 따른 적절한 분석 기법 선택, 분석 결과를 바탕으로 의사결정자를 설득하는 실무 과정까지 익힐 수 있다. 데이터 기반의 의사결정 절차를 살펴보면서 데이터를 효율적으로 분석하고, 그 결과를 근거로 원활히 소통하는 전문 역량을 키워보자.

 

상세이미지(700)_데이터 드리븐 리포트.jpg

이상석 저자

이상석

어린 시절부터 사람에게 관심이 많던 저자는 자연스럽게 HR 분석가로 성장했다. 하지만 직관과 감, 경험으로 무장한 경영진을 설득하는 데 한계를 느꼈고 이 벽을 넘기 위해 미국 듀크 대학교 데이터 사이언스 석사 과정을 졸업했다. 그리고 데이터 과학자로서 공공기관에서는 최초로 HR 애널리틱스 분야에 뛰어들었다. 입사부터 퇴직까지의 HR 데이터를 데이터 레이크에 담아 채용, 승진, 이동, 평가 등을 종합적으로 분석하여 데이터 기반 HR 정책 효과성 측정 및 개선에 활용하고 있다. 또한 HR과 데이터 사이언스를 융합한 분야를 연구하며 기업의 HR 애널리틱스 도입 관련 자문 및 강사로도 활동 중이다. 감정 분류 모델, 인재 추천 시스템, HR 면접관 추천 시스템 등을 개발하여 특허를 출원했고 London Text Analytics, AI Summit Seoul, HR AI Forum 등의 콘퍼런스에서 발표하기도 했다. 그간 데이터에 기반한 의사소통과 보고를 하며 느낀 데이터의 힘을 나누고자 이 책을 썼다.

| 1장 |  데이터 드리븐 보고

 

1.1 일상의 보고 상황

 

1.2 데이터 드리븐 의사결정이란

_1.2.1 일상부터 비즈니스 의사결정까지

_1.2.2 데이터 드리븐 흐름

_1.2.3 데이터 드리븐 효과

 

1.3 데이터 드리븐 보고란

_1.3.1 데이터 드리븐 보고에 관한 오해들

_1.3.2 데이터 드리븐 보고의 여섯 가지 유형

_1.3.3 데이터 드리븐 보고가 나와 무슨 관계가 있을까?

 

1.4 데이터 드리븐 보고 5원칙

_1.4.1 설명 가능해야 한다

_1.4.2 데이터 드리븐 보고는 중립적이지 않다

_1.4.3 문제를 정의할 수 있어야 한다

_1.4.4 MVP부터 시작하라

_1.4.5 추론과 예측을 구분하라

 

| 2장 |  데이터 드리븐 보고 절차

 

2.1 데이터 드리븐 보고 전략

 

2.2 분석 전 알아야 하는 용어

_2.2.1 독립변수와 종속변수

_2.2.2 테이블, 행과 열

_2.2.3 데이터 분리

_2.2.4 모델링

 

2.3 분석 목표 설정

_2.3.1 분석 목표(가설)를 확실하게 정의하라

_2.3.2 의사결정자에게 최대한 많이 질문하라

 

2.4 계획서 작성

_2.4.1 분석 계획서의 필수 요소

 

2.5 데이터 선정

_2.5.1 데이터 수집

_2.5.2 EDA & 데이터 정제

 

2.6 분석 방법 결정 및 해석/검증

_2.6.1 기본 통계

_2.6.2 가설검정

_2.6.3 선형회귀분석

_2.6.4 분류예측모델

 

2.7 보고 대상자에 따른 보고 방식

_2.7.1 실무자용 보고

_2.7.2 의사결정자용 보고

 

| 3장 |  데이터 드리븐 보고 실전 사례 with 챗GPT

 

3.1 데이터와 친해지자: EDA & 기술통계

[사례] 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

_3.1.1 상황

_3.1.2 분석 목표 파악하기

_3.1.3 분석 계획 세우기

_3.1.4 데이터 선정하기

_3.1.5 EDA 수행하기

_3.1.6 해석하기

_3.1.7 보고하기

_3.1.8 챗GPT 활용하여 EDA 수행하기

 

3.2 데이터도 백문이 불여일견: 데이터 시각화

[사례] 회사의 중장기 인력구조 예측, 분석, 시각화하기

_3.2.1 상황

_3.2.2 분석 목표 파악하기

_3.2.3 분석 계획 세우기

_3.2.4 데이터 선정하기

_3.2.5 EDA 수행하기

_3.2.6 분석 및 예측 방법 결정하기

_3.2.7 시각화하기

_3.2.8 해석하기

_3.2.9 보고하기

_3.2.10 챗GPT 활용하여 시각화하기

 

3.3 당신의 질문에 데이터가 답한다: 가설검정

[사례] 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

_3.3.1 상황

_3.3.2 분석 목표 파악하기

_3.3.3 데이터 선정하기

_3.3.4 분석 방법 결정하기

_3.3.5 해석하기

_3.3.6 보고하기

_3.3.7 챗GPT 활용하여 가설검정하기

 

3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석 

[사례] 유학 컨설팅을 위한 해외 대학 합격률 분석하기

_3.4.1 상황

_3.4.2 분석 목표 파악하기

_3.4.3 분석 계획서 작성하기

_3.4.4 데이터 선정하기

_3.4.5 EDA 수행하기

_3.4.6 분석하기

_3.4.7 해석하기

_3.4.8 컨설팅하기

_3.4.9 챗GPT 활용하여 회귀분석하기

 

3.5 합격이냐 불합격이냐: 분류예측

[사례] 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

_3.5.1 상황

_3.5.2 분석 목표 파악하기

_3.5.3 분석 계획서 작성하기

_3.5.4 데이터 확인하기

_3.5.5 EDA 수행하기

_3.5.6 분석하기

_3.5.7 해석하기 

_3.5.8 솔루션 제공하기

_3.5.9 챗GPT 활용하여 분류예측모델 만들기

 

3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링

[사례] 전 직원 대상 설문조사의 서술형 응답 분석하기

_3.6.1 상황

_3.6.2 결과물 미리 보기

_3.6.3 검증하기

_3.6.4 토픽 모델링 따라하기

_3.6.5 챗GPT 활용하여 워드 클라우드 만들기

 

| 4장 |  데이터 드리븐 커뮤니케이션

 

4.1 데이터 드리븐 커뮤니케이션의 필요성

_4.1.1 나의 연봉과 상사의 연봉이 다른 이유

_4.1.2 타이밍이 중요한 이유

 

4.2 데이터 드리븐 커뮤니케이션 구성 요소

_4.2.1 메시지

_4.2.2 시각화

_4.2.3 스토리

 

4.3 데이터 드리븐 커뮤니케이션 방법

_4.3.1 어떤 차트가 효과적인가

_4.3.2 어떤 도구를 써야 하는가

_4.3.3 어떤 전달 방식이 적합한가

 

4.4 스토리텔링

_4.4.1 스토리텔러의 핵심은 속임수?

_4.4.2 스토리 만들기

 

4.5 데이터 드리븐 커뮤니케이션 체크리스트

_4.5.1 내가 이해하는 만큼 상대방도 이해한다

_4.5.2 보고는 내가 하고 싶은 이야기를 전달하는 것이 아니다

_4.5.3 나보다 보고 주제를 더 잘 아는 사람은 없다

_4.5.4 보고의 성패를 가르는 사전 준비 질문

_4.5.5 보고가 끝났다고 모든 일이 끝난 것은 아니다

데이터 유형별 효과적인 분석 기법 선정부터

설득을 위한 커뮤니케이션까지


실무에 바로 써먹는 데이터 기반 보고의 모든 것

 

비즈니스 영역에서 데이터 분석의 궁극적인 목적은 이해관계자를 설득하여 효율적인 의사결정을 내리는 데 있다. 데이터를 분석하는 역량만으로는 모든 결과를 가치 있게 만들 수 없다. 복잡하고 화려한 분석 결과물을 얻더라도 의사결정자에게 설득력 있게 전달하지 못한다면 그 데이터는 의미가 없다. 

 

이 책은 문제 해결을 위한 올바른 문제 정의부터 데이터 수집, 정제, 분석 그리고 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 데이터 드리븐(Data-Driven) 보고 능력을 키우는 방법을 상세하게 제시한다. 국가 공인 데이터분석전문가(ADP)이자 HR 데이터 과학자인 저자의 경험을 바탕으로 다양한 비즈니스 사례를 통해 상황별 가장 적합한 분석 기법을 어떻게 선택하는지 익힐 수 있다. 또한 방대한 양의 데이터에서 핵심 인사이트를 찾아내고 이를 설득력 있는 보고로 만들어내는 방법뿐만 아니라, 상대방이 가진 편향을 고려해 효과적으로 의사소통하는 방법까지 얻을 수 있다. 데이터 중심의 의사결정을 하고자 하는 데이터 분석가의 필독서로, 데이터 분석 사고의 폭을 넓히고 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있을 것이다.

 

● 내용 구성

1장. 데이터 드리븐 보고

일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.

 

2장. 데이터 드리븐 보고 절차

성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.

 

3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.

- 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

- 회사의 중장기 인력구조 예측, 분석, 시각화하기

- 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

- 유학 컨설팅을 위한 해외 대학 합격률 분석하기

- 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

- 전 직원 대상 설문조사의 서술형 응답 분석하기

 

4장. 데이터 드리븐 커뮤니케이션

데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.

 

● 주요 내용

- 데이터에 기반한 보고 방법

- 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법

- 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법

- 실제 분석 업무에 적용할 수 있는 단계별 실습 사례

- 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법

- 선형회귀분석을 통한 고객 설득 방법

- 수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법

- 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법

 

● 대상 독자

- 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 사람

- 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람

- 다양한 상황별로 적합하고 효율적인 분석 기법을 알고싶은 사람

- 분석 업무에 챗GPT를 활용하고 싶은 사람

- 데이터분석전문가(ADP), 빅데이터분석기사를 준비하는 사람

 

● 먼저 읽은 베타리더의 한 마디

- 비즈니스와 맞닿아 있는 신선한 사례들을 경험할 수 있고 실무에 적용하는 데 큰 도움을 준다. _김수현

- 데이터에 익숙하지 않은 주니어를 포함하여 이미 관련 경험이 있는 매니저급도 자신의 역량을 한 단계 끌어올릴 수 있을 것이다. _윤명식

- 데이터 분석, 시각화 코드 생성, 분석 결과를 보고서화하기 위한 챗GPT 프롬프트까지 알찬 내용만 담겨 있다. _윤세완

- 데이터 기반의 보고를 주저하는 직장인에게 자신감을 심어주고 끝내 보고할 수 있게 만든다. _정보영

- 편견과 인지 편향으로 가득한 상사를 설득하기 위한 체계적인 프레임워크를 제시한다. _조현석

- 데이터에 관심이 있고 분석을 할 줄 알아도, 이를 활용하는 방법 및 보고의 실체에 대해 감이 잡히지 않는다면 반드시 이 책을 읽어야 한다. _최철훈

1. 시작

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

2023년 11월달에 소개할 책은 「데이터 드리븐 리포트」입니다

 

 
                                                      <표지>



이 책은 데이터를 근거로 의사소통해야 하는 모든 실무자를 위한 데이터 기반의 의사결정 가이드입니다.

다음과 같은 내용을 다루고 있습니다.

 

  • 데이터를 기반으로 하는 보고의 5원칙
  • 실제 분석 업무에 적용할 수 있는 단계별 실습 사례
  • 데이터 유형별 적절한 분석 기법 선정 방법
  • 보고 대상자에 따른 맞춤형 커뮤니케이션 방법
  • 챗GPT를 활용한 노코딩 데이터 분석 실습
  • 선형회귀분석을 통한 고객 설득 방법


이 책의 내용을 더 알아보도록 하겠습니다.

 

2. 책의 구성

 

이 책은 총 4개의 장으로 구성되어 있습니다.

 

제 1장. 데이터 드리븐 보고

  • 일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 기반 의사결정이 비즈니스에 어떻게 활용되는지 알아본다. 데이터 드리븐 보고가 비즈니스에 어떻게 적용되는지 살펴본다

제 2장. 데이터 드리븐 보고 절차

  • 성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차(목표 설정 - 데이터 선정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다.

제 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

  • 실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 직접 실습한다. 사례별로 챗GPT를 활용하여 코딩에 대한 지식 없이도 파이썬 코드 작성할 수 있도록 했다.

제 4장. 데이터 드리븐 커뮤니케이션

  • 분석 결과로 상사 혹은 고객을 설득해 원하는 결과를 얻는 것은 분석 과정 만큼이나 중요하다. 데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트를 안내한다.




3. 책의 내용

 

1) 데이터 드리븐 보고

데이터 기반의 의사결정(Data driven decision making, DDDM)을 위한 데이터 드리븐 보고(리포트)가 무엇인지? 데이터 드리븐 보고가 우리의 일상에서 어떻게 적용할 수 있는지? 비즈니스에서는 어떻게 가치를 창출하는지? 실제 기업에서 어떻게 활용하는지?를 알려준다. 데이터 드리븐 보고의 중요성을 깨닫길 바랍니다.

 

 

33페이지

 

 

 

 

35페이지

 



 

49페이지

 

 

 

 

2) 데이터 드리븐 보고 절차

제2장에서는 데이터 드리븐 보고의 전략적인 단계를 살펴보고 분석을 하기 전에 알아야 할 기본 용어, 개념을 이해하고, 목표 설정 -> 데이터 선정 -> 분석 방법 결정 -> 해석 및 검증 -> 보고(리포트) 까지 단계에 대해서 알려줍니다.

 

65페이지

 

 

 

140페이지

 

 



3) 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 현장의 절차를 기반으로 데이터 드리븐 보고를 진행하는 것을 알려줍니다. 실제 비즈니스 적용 방법이 궁금한 실무자를 위한 내용을 다루고 있습니다. 

 

 

167페이지

 

 

 

 

179페이지

 



 

215페이지

 



 

276페이지

 



 

306페이지

 

 

4) 데이터 드리븐 커뮤니케이션

데이터 드리븐 보고의 마지막 절차인 ‘데이터 드리븐 커뮤니케이션'에 대해서 알려줍니다. 왜 데이터 드리븐 커뮤니케이션이 필요한지? 커뮤니케이션의 성공 기준부터 효과적인 메시지, 시각화, 스토리텔링까지 다양한 측면을 다루고 있습니다.

 

 

363페이지

 

 

 

 

371페이지

 



 

380페이지

 

 

4. 책을 읽은 후

데이터 분석은 정말 쉬운 분야가 아닙니다. 

분석의 80%는 기본 통계와 시각화를 통해 이뤄지고

20%는 고도화된 분석 도구를 사용할 수 있어야 합니다.

기본을 알고 있어야 고도화된 분석이 가능합니다.

데이터 분석관련 책이 어려운 이유입니다.

하지만 데이터 분석 책 가운데 실제 예시를 통한 전반적인 분석 절차에 대한 예시가 다양하고, 좀더 쉽게 접근하려는 저자의 의도를 볼 수 있습니다.

그리고 예시를 따라할 수 있도록 모든 소스코드는 GitHub에 공개를 하고 있습니다.

 

OpenAI 사의 ChatGPT가 출시되고 전세계에 지각 변동이 일어나고 있습니다.

‘AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다.’ 라고 산티아고 발다라마 가 말했습니다.

 

직장인의 생존 스킬, 지속가능한 비즈니스를 위한 필수적인 도구임에는 틀림이 없습니다. 

이 책을 통해서 고객을 설득하고, 상사를 설득할 수 있는 직장인, 분석가가 되기를 희망합니다. 



"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

감사합니다

 

회사생활을 하다 보면 업무와 직군 상관없이 굉장히 많은 자료를 만들게 된다. 그리고 그 자료의 목적이 상황마다 다르겠지만 기본적으로 내가 준비한 자료는 내가 말하고자 하는 것을 뒷받침할 때 사용된다. 사람은 객관적인 자료에 신뢰를 느낀다. 그리고 최근에 느낀 점인데 근거가 빈약하거나 잘못된 자료라 하더라도 그럴싸해 보이면 신기하게도 뭔가 신뢰를 느끼는 경우가 종종 있는 것 같다. 그렇기 때문에 자료의 근거와 출처를 꼼꼼히 확인하고 올바른 선택을 할 수 있도록, 이성적인 판단을 할 수 있도록 비판적으로 보는 시각이 필요한 것 같다.

 

내가 말하고자 하는 것은 보기 좋은 떡이 맛있다는 말도 있는 것처럼 내가 고생해서 얻은 자료와 지표에 더 힘을 실어주기 위해선 이를 위한 적절한 표현법이 필요다는 것이다. 아무런 정렬 없이 문장으로 나열하는 것보다는 리스트 형식으로 정리하는 것이 눈에 더 잘 들어온다. 하지만 여기서 조금 더 신경 써본다면 데이터의 성격에 따라서 적합한 표현법을 찾아 이것을 적용해 볼 수 있다. 이 책은 그런 것들을 파이썬 예제와 함께 실습해 볼 수 있는 내용을 담고 있다. 

 

최근에 발표자료를 몇 번 만들 일이 있었는데 고민이 많았다. 나는 디자이너는 아니지만 그럼에도 불구하여도 조금 더 내가 준비한 좋은 내용을 표현할 수 있는 알맞은 그릇이 없을까라는 생각을 했다. 이 책에서 제시하는 방법은 코드를 작성해야 한다는 점에서 허들은 있지만 개발자들에게는 굉장히 유용할 것 같다.

 

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

 

"데이터 드리븐 리포트"는 데이터 분석의 실무적 적용에 중점을 둔 책으로, 실무에서 데이터 분석에 고민하는 모든 이들을 위한 귀중한 자료이다. 이상석 저자는 이 책을 통해 데이터를 기반으로 한 의사결정의 필요성을 강조하며, 실제 비즈니스 상황에서 데이터를 효율적으로 활용하는 방법을 제시한다. 이 책은 단순히 데이터 분석의 이론적인 측면을 넘어서, 실무자들이 데이터 분석을 통해 의사결정을 내리고 이해관계자들을 설득하는 데 필요한 실질적인 지침을 제공한다.

 

 

저자는 상사나 고객을 설득하기 위해서는 데이터에 기반하여 소통해야 한다고 강조한다. 이 책에서는 방대한 데이터 속에서 핵심 인사이트를 찾아내고 그 결과를 명확하게 전달하는 방법을 상세하게 설명한다. 데이터 분석의 궁극적인 목적을 이해관계자를 설득하여 효율적인 의사결정을 내리는 것으로 정의하며, 이를 위한 구체적인 방법론을 제시한다.

실무자들이 직면하는 다양한 문제 상황을 고려하여, 데이터 유형별로 적절한 분석 기법을 선택하는 방법을 안내하는 이 책은, 데이터 분석가가 아닌 일반 실무자들도 쉽게 이해하고 적용할 수 있는 실질적인 지식을 제공한다. 예를 들어, 행복에 영향을 미치는 변수 분석, 회사의 중장기 인력구조 예측 등의 다양한 실습 사례를 통해 실무자들이 실제 업무에 적용할 수 있는 데이터 분석의 접근 방식을 배울 수 있다.

 

데이터 기반의 의사소통 기술에도 중점을 두고 있는 이 책은, 데이터 드리븐 보고의 절차와 실전 사례, 커뮤니케이션 방법에 대한 체크리스트를 제공하여 실무자들이 데이터를 통해 보다 설득력 있는 보고를 할 수 있도록 지원한다. 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여러 사례를 통해 구체적인 학습 경험을 제공하며, 실무자들은 데이터 분석 사고의 폭을 넓히고 복잡한 데이터 분석 결과를 의사결정자에게 설득력 있게 전달하는 방법을 배울 수 있다.

"데이터 드리븐 리포트"는 데이터 분석의 기술적 측면뿐만 아니라, 실무에서의 응용과 커뮤니케이션 기술에 중점을 두는 독특한 접근 방식으로 구성된 책이다. 실무에서 데이터 분석에 고민하는 실무자들에게 필수적인 지식과 기술을 제공함으로써, 데이터 기반의 의사결정 과정을 강화하고, 보다 효과적인 결과를 도출할 수 있도록 돕는다. 이 책은 데이터 분석의 복잡한 세계를 구조적이고 체계적인 방식으로 탐구하며, 이를 통해 독자가 데이터 분석의 깊은 이해를 얻을 수 있게 돕는다. 실제로 이 책은 데이터를 '실제로 분석하면서 학습한다'는 목표를 더욱 효과적으로 달성할 수 있도록 도와주며, 이를 통해 독자는 데이터 분석 프로젝트를 성공적으로 수행할 수 있다. 또한 이 책은 최신 데이터 분석 도구와 기술 트렌드를 업데이트함으로써 데이터 분석 분야의 최신 동향을 파악할 수 있는 기회를 제공한다. 이 책은 또한 독자에게 실용적인 예제를 통해 데이터 분석의 다양한 적용 영역을 보여준다. 실제 실무에서 겪을 수 있는 문제를 해결하는 데 필요한 실질적인 지식과 능력을 제공함으로써, 독자에게 데이터 분석의 실제 적용에 대한 귀중한 통찰력을 제공한다. 이런 점에서 "데이터 드리븐 리포트"는 데이터 분석 분야에 깊이 있는 이해를 원하는 모든 이에게 권할만한 책이다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

1.들어가며

 

창업동아리를 하다보면 자연스럽게 창업경진대회를 나가게 된다. 그럴땐 자신의 아이템이 왜 세상에 나와야하고, 어떻게 매출이 이루어지며, 지속 성장 방향 등을 설명하게 된다. 이때 처음 하는 사람들이 놓치는게 바로 '설득하는 데이터' 이다.

회사도 마찬가지이다. 보고를 할 때, 의사결정에 대한 근거가 필요하다. 일반적으로 의사결정, 협업등은 구두보다는 보고서로 이루어지며, 이때 필요한게 바로 데이터 드리븐 리포트이다.

 

 

2.중요 요소

-글보다는 숫자가 좋으며, 숫자가 없다면 1)수치화를 하거나 (설문조사가 대표적 예이다.) 2) 데이터를 시각화해서 보여줘야 한다.

-직관을 배제해서는 안된다. 시작 단계를 넘어가다보면, 100% 직관없는 보고서를 꿈꾸기도 한다. 직관자체가 나의 과거 경험들에 의한 산물이다. 비지니스 최종 선택은 직관적이여야한다. 즉, 직관으로만 결정이 되는게 아니라, 데이터가 양쪽 다 합리적인 경우, 시간관계상 데이터 드리븐을 빠르게 줄여 업무 효율성을 높여야 하는 경우, 과거 매우 흡사한 사례가 있던 경우가 직관을 사용할 수 있는 예이다.

-분석 도구는 화려한게 중요한게 아니라 의사 결정자의 판단에 도움을 주는게 본질이다. 추가 설명도 가능하면 없는게 중요하다. 뽑는 방식에 따라 추가설명이 필요한 경우에는, 직접 2차 가공화하여 한번에 알아 볼 수 있도록 하자.

-도메인 지식도 중요하다. 과거 kt엠하우스 데이터 분석대회에서 포기하는 팀들이 많았다. 이유는 제공된 데이터로 너무나 당연한 이야기만 도출되기 때문이다. 토익 스피킹으로 비유하면, 토익 스피킹 점수가 높은사람은 발음도, 문법도, 단어도 훌륭하다. 라는 너무 당연한 결과가 나온다. 분석의 관점을 설정이 잘못되서 그런거고, 관점을 제대로 잡으려면 도메인 지식이 필요하다. 토익 스피킹을 예시로 들자면, 만점에서 뭐가 부족할 수록 단계가 떨어지는지를 분석하는 관점으로 접근해야하는것이 그 예이다.

 

3. 활용 예시

image.png

사진 설명을 입력하세요.

사진은 NIA(한국정보화 진흥원) 데이터 분석 대회에 참가했을때의 자료이다. 당시 KBO의 선수영입 모델을 주제로 발표를 했었다.

(위의 사진은 기록이 아닌, 키워드 중심 분석을 했던 자료이다)

1)LDA는 야구선수 관련 크롤링 키워드를 군집화하여 감정분석했던 방식이다.

2)군집화를 위해 KoNLPy 불용어 사전을 활용하여 불용어를 처리하고

KSNU 긍부정 사전 기반으로 감정분석을 하였다.

3)부정 키워드를 분석해본 결과 연봉, 코로나, 범죄 관련 키워드가 도출됐다.

 

image.png
 

사진 설명을 입력하세요.

(위의 분석은 타격, 수비 지표를 통해 분석한 자료이다.)

 

1)일반적으로 WAR중 타격은 굉장히 객관적이지만, 수비는 사이트에서 정의를 한다. 이유는 도전적 수비, 호수비를 노리지 않을경우 수비 스탯이 오르기 떄문에 불공정하기 때문이다.

해당 이유로 미국 논문을 참고하여 수비 요인(Factor)을 만들고 타자의 수비 가치를 분석한 자료이다.

 

이처럼 데이터 드리븐 리포트는 1.키워드 같은 정성적 데이터 2.야구 성적과 같은 정량적 데이터 모두 분석이 가능하며

설득을 위해서의 본질은 결국 '설득 하는 사람이 1)납득이 가고 2)쉽게 이해하도록 3)객관적으로 전달하는 것이다.

 

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

모든 조직에서 올바른 전략을 수립하고 계획을 실행하기 위해서는 의사 결정이 무엇보다 중요하다. 의사 결정에 이르는 과정이 적절하지 않고, 그로써 합리적인 결정이 도출되지 않는다면 조직은 당면 과제를 해결할 수 없고 결국엔 원하는 바를 이룰 수가 없다. 그렇기에 최선의 의사 결정을 돕는 훌륭한 도구가 필요한데, 바로 그 무기가 '데이터'이다. 데이터를 통해서 문제를 제대로 정의하고, 올바른 의사 결정이 뒷받침된다면 조직은 어떠한 문제라도 효율적으로 해결할 수 있고 종국적으로 소기의 목적을 달성할 수 있게 된다. 이렇게 데이터를 기반으로 또는 데이터 주도적(데이터 드리븐)으로 의사 결정하는 흐름이 하나의 트렌드로 부상했지만, 도처에서 올바른 방법으로 데이터 드리븐을 시도하거나 그러한 문화를 정착하는 데 많은 시행착오와 어려움을 겪는 것으로 전해진다. 너나 할 것 없이 데이터 드리븐의 중요성은 너무나 잘 알고 있지만, 막상 그것을 구현하고 실행해 나가는 데 있어 실질적으로 도움받을 만한 리소스가 충분하지 않은 실정이다. 이러한 와중에 데이터 드리븐 보고를 통해 조직이 올바른 방향으로 나아가게끔 안내해 주는 서적이 등장했다. 오늘 소개할 책은 '데이터 드리븐 리포트'라는 서적이다. 

 

KakaoTalk_20231126_185751080.jpg

 

본 서적은 총 4개의 장으로 구성되어 있고, 첫 장은 데이터 드리븐 의사 결정의 정의와 데이터 드리븐 보고 그리고 그에 따른 5원칙을 설명하고 있다. 이를 통해 독자는 데이터 드리븐 보고의 첫 발을 내딛게 된다. 2장에서는 본격적으로 데이터 분석을 위해 필요한 핵심 용어 및 개념을 학습하게 되고 데이터 분석에 필요한 제반 절차, 이를테면 목표 설정, 계획서 작성, 데이터 선정, 분석 방법 결정 및 해석/검증, 보고 방식 등에 대한 각각의 요소를 상세하게 나열하면서 데이터 드리븐 보고의 초석을 다지게 된다. 

 

이윽고 3장에서는 데이터 드리븐 보고의 실전 사례를 파이썬 코드 및 ChatGPT의 일부 도움을 받아 실제 적용하는 학습을 진행하게 된다. EDA와 기술 통계, 데이터 시각화, 가설 검정, 선형 회귀 분석, 분류 예측, 토필 모델링 등의 총 6가지 사례를 2장에서 얻게 된 데이터 분석 절차를 통해 파이썬 코드로 구현하고, ChatGPT를 활용하여 완성도 높은 결과물을 이끌어 낸다. 

 

마지막 장에서는 데이터 드리븐 의사 소통에 대해 다루고 있는데, 데이터 드리븐 의사 소통의 필요성, 구성 요소, 방법, 스토리텔링과 체크리스트 등의 내용을 통해 효율적으로 데이터 분석 결과를 이해관계자에게 전달하고 궁극적으로 목적을 달성하기 위한 실질적인 팁과 노하우를 배울 수 있고, 이로써 데이터 드리븐 보고의 정수를 여실히 체험하게 된다. 

 

데이터 활용은 더할 나위 없이 중요해지고 있고, 모든 조직은 어떻게 데이터를 분석하느냐에 따라 그 결과를 기반으로 하여 최선의 의사 결정을 이루고 목적을 달성할 수 있다. 그런데 데이터 분석도 중요하지만, 문제는 그에 따른 결과를 어떻게 효율적으로 조직의 이해관계자에게 전달하고, 의사 결정권자가 올바른 결정을 내릴 수 있도록 지원하는 과정 역시 굉장히 중요하다. 시중에는 데이터 분석에 관련된 서적이 편재해 있지만, 데이터 드리븐 보고에 대한 책은 아마 본 서적이 유일무이할 것이다. 3장에서 실제 사례를 파이썬 코드로 다루기 때문에, 이 책을 제대로 활용하기 위해서는 파이썬에 대한 기본 문법과 기초를 사전에 익히고 있어야 한다. 파이썬에 대한 기본을 갖추고 있는 상태라면, 조직의 올바른 의사 결정 과정을 지원하고 데이터를 기반으로 원하는 바를 이룰 수 있도록 하기 위해 당장 이 책과 함께 데이터 드리븐 보고의 여정을 시작해 보자. 데이터 드리븐 보고를 통해 조직의 성공을 위해서라면 주저하지 말고 이 책을 가이드로 삼아 앞으로 나아가 보자. 

 

P.S 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다. 

AI 시대에 데이터 리터러시가 중요해졌다. '리터러시=문해력'으로, 이 경우엔 데이터를 읽고 이해하는 능력을 말한다.

AI와 데이터는 무슨 상관일까? 챗GPT를 보면 온라인상에 있는 엄청난 양의 데이터를 활용하고 있으며 사용자가 추가적인 데이터를 던져주면 나에게 맞춤형 결과를 내놓는다. 그야말로 개인 비서가 되는 셈. 데이터를 잘 가지고 놀 줄 알수록 직장에서, 세상에서 살아남기 수월해 지는 것이다.

지금 리뷰하는 '데이터 드리븐 리포트' 책 안에 이런 내용이 나온다.

"AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다."

밥벌이에 컴퓨터를 사용하는 직군이라면 앞으로는 데이터와 AI를 활용하지 않고는 생산성 차이를 극복할 수 없을지도 모른다.

책에서는 데이터 드리븐 리포트를 이렇게 정의한다. 올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 정제, 분석을 거쳐 스토리텔링과 시각화로 설득을 끌어내는 일련의 과정이다.

데이터 문해력을 높였다면 최종적으로는 어떤 결과를 이끌어내야 할 것이다. 그것은 곧 (상사 또는 고객의) 의사결정이다. 실무자는 이들이 좀 더 쉽게 결정을 내릴 수 있게 데이터 중심의 보고서를 쓰는 것이 중요하다.

어떻게 쓸 수 있을까? 나는 데이터 중심으로 보고서를 써본 적이 없는데...!

책에 모든 실무적인 내용이 다 나와 있으니 걱정하지 않아도 된다.

대상 독자는 다음과 같다.

  • 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인
  • 상사와 고객을 설득해야 하는 데이터 분석가
  • 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람
  • '해봤는데 안 돼.' '예전에 검토해봤어' 등의 이유로 상사에게 거절당한 경험이 있는 사람
  • 분석 업무에 챗GPT를 활용하고 싶은 사람
  • 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람

출판사인 한빛미디어에서 책 분류를 '중급'으로 설정했다. 어느 정도의 수학 능력과 기본적인 파이썬, 최소한의 통계 지식이 필요하기 때문이다. 원래 데이터를 다루는 것 자체가 종합 예술이어서 육각형 인재가 되어야 이 분야의 전문가가 될 수 있다. 초급자가 처음부터 이 책을 이해하기는 쉽지 않겠지만 그만큼 실무에 도움되고 수준 높으며 흥미로운 내용으로 채워져있다.

구성은 모두 4장으로 되어 있다.

  • 1장 : 데이터 드리븐 보고
  • 2장 : 데이터 드리븐 보고 절차
  • 3장 : 데이터 드리븐 보고 실전 사례 with 챗GPT
  • 4장 : 데이터 드리븐 커뮤니케이션

1장과 4장은 술술 읽히는 재밌는 챕터이다. 데이터 드리븐 보고에 대한 기본 정의부터, 왜 우리가 이걸 해야 하는지, 상사(또는 고객)에게 잘 전달하려면 어떻게 해야 하는지 등의 내용이 있다. 저자가 독자인 우리가 이 책을 완독하게끔 설득하는 장이다.

2장은 데이터 분석을 하기 위해 필수로 알아야 할 기본적인 용어와 개념을 설명한다. 가설을 설정하고 데이터를 선정한 후 분석 방법을 결정 -> 해석과 검증을 하고 최종적으로 내가 설득할 대상에게 보고하는 데이터 드리븐 리포트의 절차가 나와 있다.

3장은 이 책의 핵심으로 실전 사례로 데이터 기반 보고를 학습한다. 가장 지면을 많이 차지하는 챕터이다. 여기서는 여러 상황이 주어진다. 각 상황은 아무렇게나 주어지는 건 아니고, 데이터 시각화나 가설검정, 선형회귀분석, 분류예측 등 데이터 드리븐 보고에 해당하는 여러 유형에 익숙해 질 수 있는 사례들이 나온다. 여기서 흥미로운 부분은 현실 문제를 해결하는 과정에서 챗GPT를 활용한다는 점이다. 창의성이 부족한 나는 이렇게 딱딱 알려주는 게 넘 좋다.ㅎㅎㅎ


책 '데이터 드리븐 리포트'를 다 보고 느낀 건 데이터의 활용가치가 참 높다는 거다. 기업들이 왜들 그렇게 사용자 데이터를 확보하려고 책을 읽다보면 느껴진다.

그리고 상사를 설득하기 위한 리포트 용도 뿐만 아니라 개인적으로 의사결정을 하는데에도 데이터가 도움이 될 것 같다. 매일매일이 선택의 연속이다 보니 가끔은 무지성으로 무언가를 선택하기도 하는데, 데이터 분석이 습관화 되면 이런 단점도 좀 고칠 수 있지 않을까^^;;

1장부터 4장까지 내용이 다 좋아서 버릴 부분이 없는, 종이 아깝지 않은 책이다. 3장 실전 사례는 따라하면서 데이터를 분석해 가는 과정이 특히 재밌었다. 데이터 자격증을 준비하는 사람이나 직무에 관심있는 사람, 현재 실무자인 사람 모두에게 도움이 도리 것이라 생각한다.

--------------------

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

    데이터 분석이라는 분야는 이미 관련책 책이 상당히 많이 출간되어 있고 이제는 어떤 책을 고를지만 고민하면 될 정도로 많이 알려진 분야가 되었습니다. 조금은 성숙되어 가고 있는 분야가 되다 보니 순수한 데이터 분석의 영역을 넘어서서 다른 분야로 적용되는 방법에 대한 책들도 하나 둘 나오고 있습니다. 이번 책 데이터 드리븐 리포트는 HR전문가인 저자의 손을 거쳐서 데이터 분석을 통해 어떻게 의사결정을 하고 좋은 리포트를 만들어서 보고를 할 수 있는지에 대해 가르쳐 줍니다. 책의 내용이 크게 어렵지 않으니 하나씩 따라가보면 다양한 인사이트를 얻을 수 있습니다.

 

 

 

 

    책은 총 4개의 장으로 구성되어 있습니다.

  • 1장. 데이터 드리븐 보고
  • 2장. 데이터 드리븐 보고 절차
  • 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
  • 4장. 데이터 드리븐 커뮤니케이션

책의 내용을 순서대로 조금만 살펴보겠습니다.

 

 

 

 

    이 책의 주요 요점은 설득하는 사람이 되는 것입니다. 그리고 여기에 필요한 기술 중 하나가 바로 데이터 기반의 의사결정 방법입니다. 인공지능 전문가인 산티아고 발다라마는 이렇게 말했습니다. 

 

"AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다." 

 

 

 

 

    데이터를 기반으로 어떤 일을 한다는 것은 사실 단순히 몇 가지 일에만 적용되는 것이 아닙니다. 아무 많은 일반인들이 고민하는 주식 투자에 있어서도 데이터 드리븐 의사 결정이 적용될 수 있습니다. (현실에서는 그냥 감으로 투자하는 사람이 많다고 하지만 말이죠) 데이터를 기반으로 한 의사 결정을 한다고 해서 정확한 예측을 보장할 수는 없지만 많은 부분을 보완해 줄 수 있는 것은 너무나도 당연한 사실입니다.

 

 

 

 

    이 책에서 데이터를 다루는 주된 이유는 보고하고 전략을 수립하기 위함입니다. 책의 2장에서는 데이터 드리븐 보고 전략에 대해서 다루고 있습니다. 기본적으로 아래와 같은 커뮤니케이션 ON AIR 분석 절차를 따른다고 합니다. 목표를 설정하고 데이터를 선정한 후 분석 방법을 결정해서 해석하고 검증한 뒤 보고하는 순서입니다. 가장 중요한 것은 이 모든 과정에서 보고 대상자인 의사 결정자와 지속적으로 대화해야 한다는 것이라고 합니다.

 

 

 

 

    잘 분석된 데이터와 좋은 결과가 나온 보고서라도 결국은 시각적으로 잘 표현되어야 의사 결정에 도움이 됩니다. 3장에서는 데이터 시각화에 대해서도 다루고 있습니다. 다양한 데이터들을 분석해서 데이터를 뽑고 이를 시각화해서 의사 결정자에게 인사이트를 제공하는 것을 목적에 두고 있습니다. 실제로 인간의 뇌는 텍스트보다 6만 배 빠른 속도로 이미지를 처리한다고 합니다.

 

 

 

 

    특정 데이터에 대해 시각화하고 데이터 분석을 하는 과정에 필요한 파이썬도 책을 통해 배울 수 있습니다. 이미 파이썬이 익숙한 개발자라면 아주 쉽게 이해할 수 있는 수준이고 그렇지 않은 사람들도 이 책을 통해 하나씩 배워나가면 쉽게 데이터 드리븐 리포트를 작성할 수 있습니다.

 

 

 

 

    회귀 분석과 같은 아주 간단한 데이터 분석 기법을 사용해서 실제 데이터를 분석하면서 배우는 파트도 준비되어 있습니다. 책의 목적에 맞게 아주 깊은 인공지능 모델이나 데이터 분석 기법에 대해서는 다루지는 않습니다. 다만 이 책을 기반으로 해서 다른 머신 러닝 기법들을 함께 공부한다면 훨씬 멋있는 데이터 드리븐 리포트를 만들 수 있을 것 같네요.

 

 

 

 

    토픽 모델링(텍스트 데이터 내 단어 빈도 분석 후 LDA 방식 토픽 자동 분류)을 사용해서 대통령 연설문을 분석한 결과의 예입니다. 아주 간단하고 쉬운 기법이지만 장문의 텍스트 데이터에 적용했을 때, 그냥 봐서는 알 수 없는 인사이트를 얻을 수 있게 됩니다. 데이터 분석 그리고 시각화의 힘이 이런 것이라고 생각됩니다.

 

 

 

 

    책이 결코 어렵지 않게 쓰여졌습니다. 그럼에도 불구하고 배울 부분이 많고 특히, 단순히 데이터 분석이라는 기술을 배우는데 그치는 것이 아니라 실제 업무에서 어떻게 적용될 수 있을지에 대한 노하우를 담고 있기 때문에 개발자뿐만 아니라 관련 분야에 데이터 분석 기법을 적용해보고 싶은 분들이 많은 도움을 얻을 수 있을 것 같습니다.

 

끝.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

data00001.jpg

 

데이터 드리븐을 아시나요?

 

경험이나 직관의 한계를 넘어 상사나 이해관계자를 설득할 줄 알아야 합니다.

 

설득하지 못하는 것에는 반드시 이유가 존재합니다.

 

이유를 찾는 사람은 상대방을 설득할 수 있게 됩니다.

 

당신은 설득하는 사람인가요? 그렇다면 설득률을 몇 퍼센트입니까?

이 질문에 스스로 답변하고 이 책을 읽어보시길 추천합니다.

 

데이터 드리븐 리포트를 작성하는 노하우를 알려주는 책을 소개하려 합니다.

 

소개해 드릴 책은 ‘데이터 드리븐 리포트’입니다.

 

데이터의 힘을 실무에서 어떻게 효과적으로 활용할 수 있는지에 대한 체계적인 가이드를 제시하고 있습니다.

 

이 책은 저자가 경험이나 직관만으로는 한계를 느끼는 상황에서 데이터 사이언스를 공부하게 됐습니다.

 

저자의 동기부터 시작하여, 상사나 이해관계자를 설득이 필요했습니다.

 

저자의 깊은 내공을 쌓기 위한 핵심 원리부터 실무적인 적용 방법을 상세하게 다루고 있습니다.

 

이 책에서는 데이터의 힘을 효과적으로 활용하는 방법을 체계적으로 안내합니다.

 

어떻게 효과적으로 활용하는지 같이 살펴보겠습니다.

 

 

data00003.jpg

 

 

 

1) 데이터 드리븐 보고의 실무 적용

데이터 드리븐 보고의 실무 적용은 개념과 이론을 설명한 뒤, 어떻게 실무에서 적용하는지에 대한 가이드를 제공합니다.

 

다양한 통계적 기법을 활용하여 근거자료로 활용하는 방법을 다루며, 이론보다는 실무적인 측면에 중점을 두고 있습니다.

 

여기서는 여섯 가지 다양한 비즈니스 사례를 통해 데이터 형식과 보고 목적이 다른 상황에서 데이터 분석과 보고 과정을 실습함으로써 독자는 다양한 시나리오에서 데이터 활용에 대한 실질적인 경험을 쌓을 수 있을 것입니다.

 

이를 통해 독자는 이론을 실제 상황에 적용하는 데 있어 실질적인 능력을 키울 수 있습니다.

 

 

 

data00002.jpg

 

 

2) 데이터 드리븐 보고의 핵심 원리와 적용 방법

데이터 드리븐 보고의 핵심 원리와 적용 방법은 올바른 문제 해결을 위한 과정입니다.

 

문제 정의부터 데이터 수집, 정제, 분석, 스토리텔링, 시각화까지의 단계를 데이터 드리븐 보고의 중요한 핵심 원리를 알려줍니다.

 

이는 데이터 문해력과 스토리텔링의 결합을 통해 데이터를 단순히 해석하는 것을 넘어, 데이터의 전체적인 유기적 연계성을 이해하고 함정과 오류를 피하는 능력을 키우는 것을 강조합니다.

 

초년생 분석가들이 직면하는 어려움에 대한 해법을 제시하며, 다양한 데이터 중에서 핵심을 찾는 방법과 데이터 분석 역량의 중요성을 강조합니다.

 

특히, 현대사회에서는 AI와 데이터 분석이 중요성을 더하고 있으며, 데이터 분석 역량 향상이 개인의 가치를 높이는 핵심이라고 강조하고 있습니다.

 

 

 

 

PS

이 책은 데이터의 활용과 분석에서 나오는 결과를 효과적으로 전달하는 방법과 중요성에 대해 다루고 있습니다.

 

데이터 드리븐 리포트를 통해 데이터를 효과적으로 활용하여 의사소통하고 설득력 있는 결과물을 만들어 내는 방법을 제시하며, 실무에서의 적용을 위한 다양한 예시를 제공합니다.

 

종합적으로, 상사와 고객을 설득하는 데이터 기반의 의사결정은 데이터에 기반한 의사결정의 중요성을 강조하고 싶습니다.

 

이를 실제 업무에 어떻게 적용할 수 있는지를 실질적으로 가르치는 데 그 목적을 두고 있습니다.

 

다양한 비즈니스 사례를 통해 독자들은 데이터 분석 역량을 향상하는 데 큰 도움을 얻을 수 있을 것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

저의 꿈은? 목표는 데이터 과학자 였습니다.

데이터의 힘을 믿는다!

이것 저것 공부도 하고 책도 많이 보고 그렇게 이론은 공부를 했는데....

문제가 생겼습니다.

 

내가 공부한 이 내용들을 어디에 어떻게 사용해야 하는지 잘 모르겠더라구요.

혼자서 이것 저것 파일럿 프로그램도 만들어 보고

미니 프로젝트도 하고 했었는데요.

이 책이 필요한 순간 이었네요!

 

"데이터 드리븐 리포트"

이 책은 HR 분석가로 감정 분류 모델, 인재 추천 시스템 등을 개발하여 특허 출원까지 한 이상석님의 책입니다.

이 책은 네개의 장으로 구성되어있습니다.

1장은 데이터 드리븐 의사결정과 , 데이터 드리븐 리포트가 무엇인지 리고 데이터 드리븐 리포트의 필요성 등을 알 수 있습니다.

데이터 드리븐 보고 5원칙이 있습니다.

① 설명 가능해야 한다.

② 데이터 드리븐 보고는 중립적이지 않다.

③ 문제를 정의할 수 있어야 한다.

④ mvp부터 시작하라

⑤ 추론과 예측을 구분하라.

 

이 중 4번 mvp(최소 기능 제품)는 '린 스타트업'에서 이미 살펴 본 내용이었습니다.

"MVP 목적은 제품을 통해 문제를 해결하려는 문제와 가설을 명확히 하는 것"

저는 MVP는 제품 개발에만 쓰인다고 생각했습니다.

그런데 '데이터 드리븐 리포트'에서 가설을 명확히 하기 위해 사용할 수 있다는 것을 알게 되었습니다.

이 책을 읽어야 하는 이유가 바로 이런 것 입니다.

제가 공부는 하는데 이 공부한 내용을 어디에 어떻게 적용해야 하는지 모르겠더라는 것이죠.

그런데 이 책은 저같은 사람들을 위해 꼭 필요한 내용이라는 것이죠.

 

2장에서는 데이터 드리븐 보고 절차가 나옵니다.

데이터 과학의 기본 이론이 나옵니다.

EDA(exploratory data analysis) 탐색적 데이터 분석이라는 멋진 말도 나옵니다.

"EDA는 주어진 데이터를 활용해서 기술통계 및 간단한 그래프를 그려보며 내가 세운가설 혹은 앞으로 세울 가설에 대한 윤곽을 정해가는 절차다."

 

3장은 실제 사례를 살펴봅니다.

파이썬을 이용한 데이터 분석 기법 및 챗GPT를 이용하여 코드를 작성하고 데이터를 분석하는 방법도 상세하게 나옵니다.

이 부분은 공부를 위해서 볼 부분은 아닙니다.

실제 사례에 어떻게 적용할 수 있는 사례가 나옵니다.

 

처음으로 나오는 사례가  "행복에 영향을 미치는 변수와 국가별 행복지수 분석하기" 였는데

혼자 공부하는 R 데이터 분석에서 제가 한 미니 프로젝트였기 때문에 너무나 반가웠습니다.

제가 R로 했던 내용을 파이썬 코드로 보니 무척이나 새롭더라구요.

그리고 챗 GPT를 활용한 EDA라니!

 

다른 예로는 저자가 HR 부분 전문가이다보니 인력구조 예측 분석과 시각화, 유학 컨설팅을 위한 해외 대학 합격률 분석, 당뇨병 예측모델 수립 및 사전 예방 솔루션 등 데이터 분석 교재에서 볼 수 있는 이론에 따른 실제 사례들 6가지가 나옵니다.

3장은 어느정도 데이터 분석에 관련된 학습이 되어있는 상태에서 보면 좋을 것 같습니다.

 

마지막 4장은 보고 방법을 위한 시각화방법 및 데이터 분석을 어떻게 표현하고 보고서로 작성하는지 방법이 나옵니다.

솔직히 저는 보고 보수적 기업문화가 자리 잡은 회사이다보니

보고서에도 정해진 포멧이 있고 이에 따르지 않으면 혼납니다. ㅜ..ㅜ

하지만 조금씩 업무에 도입해 보고 싶은 욕심이 들었습니다.

그렇게 변화될 수 있겠죠.

 

이 책은 우리 짱님들도 많이들 읽어보시고 우리 조직문화 및 보고 방식도 더 발전적으로 변화하면 좋겠습니다.

 

이상석 저자님 감사합니다.

그리고 좋은 책 만들어서 보내주신 한빛미디어 감사합니다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

KakaoTalk_20231126_224040079.jpg

 

KakaoTalk_20231126_224040079_01.jpg

 

이번에 리뷰할 서적은 한빛미디어에서 출판된 "데이터 드리븐 리포트" 입니다.

부제 "상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬"라고 설명하고 있는 이 도서는 데이터를 근거로한 의사소통을 해야 하는 모든 실무자에게 도움이 되는 가이드 서적 입니다.

도서는 408페이지를 할애하여, 파이썬의 여러 라이브러리를 사용하여 데이터 분석을 하는 방법과 챗GPT를 활용한 실전사례를 다루고 있습니다.

목차와 간략히 설명한 내용은 다음과 같습니다.

목차

1장 데이터 드리븐 보고

1.1 일상의 보고 상황

- 일상의 보고 상황을 상사와의 마케팅 전략 보고라 가정하여 대화식으로 설명하고 있습니다.

1.2 데이터 드리븐 의사결정이란

- 일상부터 비즈니스의 의사결정까지 데이터 드리븐 흐름과 효과에 대해 설명하고 있습니다.

1.3 데이터 드리븐 보고란

- 데이터 드리븐 보고의 정의에 대해 설명하며, 데이터 드리븐 보고의 오해와 여섯가지 유형,

보고와 나와의 상관관계에 대해 설명하고 있습니다.

1.4 데이터 드리븐 보고 5원칙

- 데이터 드리븐의 5원칙으로 설명가능과 보고는 중립적이지 않고, 문제를 정의할 수 있어야 하며, MVP부터 시작하며, 추론과 예측을 구분할 수 있어야 한다고 설명하고 있습니다.

2장 데이터 드리븐 보고 절차

2.1 데이터 드리븐 보고 전략

- 데이터 드리븐의 ON AIR 분석절차라 명명한 절차에 대해 설명하고 있습니다.

2.2 분석 전 알아야 하는 용어

- 분석 전 알아야 하는 용어로 독립변수와 종속변수, 테이블, 행과 열, 데이터 분리 모델링에 대해 설명하고 있습니다.

2.3 분석 목표 설정

- 분석 목표(가설)의 확실한 정의와 의사결정자에게 최대한 많은 질문을 하라는 내용을 설명하고 있습니다.

2.4 계획서 작성

- 분석 계획서의 필수요소(범위설정, 가설/목표 설정, 사용데이터 정의, 분석도구 선정, 기대효과 정의)에 대해 설명하고 있습니다.

2.5 데이터 선정

- 데이터 선정에 필요한 데이터 수집과 EDA & 데이터 정제에 대해 설명하고 있습니다.

2.6 분석 방법 결정 및 해석/검증

- 분석방법 결정 및 해석/검증에 필요한 기본통계, 가설검정, 선형회귀분석, 분류예측모델에 대해 설명하고 있습니다.

2.7 보고 대상자에 따른 보고 방식

- 보고 대상자에 따른 실무자용 보고 및 의사 결정자용 보고에 대해 설명하고 있습니다.

3장 데이터 드리븐 보고 실전 사례 with 챗GPT

3.1 데이터와 친해지자: EDA & 기술통계

[사례] 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획 세우기, 데이터 선정하기, EDA 수행하기,

해석하기, 보고하기, 챗GPT 활용하여 EDA 수행하기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.2 데이터도 백문이 불여일견: 데이터 시각화

[사례] 회사의 중장기 인력구조 예측, 분석, 시각화하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획 세우기, 데이터 선정하기, EDA 수행하기,

분석 및 예측 방법 결정하기,시각화하기, 해석하기, 보고하기, 챗GPT 활용하여 EDA 수행하기 의 과정을 통해

실습해보는 내용을 설명하고 있습니다.

3.3 당신의 질문에 데이터가 답한다: 가설검정

[사례] 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 데이터 선정하기, 분석 방법 결정하기, 해석하기,

보고하기, 챗GPT 활용하여 가설검정하기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석

[사례] 유학 컨설팅을 위한 해외 대학 합격률 분석하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획서 작성하기, 데이터 선정하기,

EDA 수행하기, 분석하기, 해석하기, 컨설팅하기, 챗GPT 활용하여 회귀분석하기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.5 합격이냐 불합격이냐: 분류예측

[사례] 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획서 작성하기, 데이터 확인하기,

EDA 수행하기, 분석하기, 해석하기, 솔루션 제공하기, 챗GPT 활용하여 분류예측모델 만들기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링

[사례] 전 직원 대상 설문조사의 서술형 응답 분석하기

- 실전사례를 챗GPT를 활용하여 상황, 결과물 미리 보기, 검증하기, 토픽 모델링 따라하기, 챗GPT 활용하여 워드 클라우드 만들기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

4장 데이터 드리븐 커뮤니케이션

4.1 데이터 드리븐 커뮤니케이션의 필요성

- 데이터 드리븐 커뮤니케이션의 필요성을 상사와 나와의 관심 포커스가 어디에 있는지 설명하며,

타이밍의 중요성에 대해 설명하고 있습니다.

4.2 데이터 드리븐 커뮤니케이션 구성 요소

- 데이터 드리븐 커뮤니케이션 구성 요소로 메시지, 시각화, 스토리에 대해 설명하고 있습니다.

4.3 데이터 드리븐 커뮤니케이션 방법

- 데이터 드리븐 커뮤니케이션 방법으로 효과적인 차트와 도구, 적합한 전달 방식에 대해 설명하고 있습니다.

4.4 스토리텔링

- 스토리텔링의 핵심과 스토리 만들기에 대해 설명하고 있습니다.

4.5 데이터 드리븐 커뮤니케이션 체크리스트

- 데이터 드리븐 커뮤니케이션 체크리스트로 다음에 대해 설명하고 있습니다.

1. 내가 이해하는 만큼 상대방도 이해한다

2. 보고는 내가 하고 싶은 이야기를 전달하는 것이 아니다

3. 나보다 보고 주제를 더 잘 아는 사람은 없다

4. 보고의 성패를 가르는 사전 준비 질문

5. 보고가 끝났다고 모든 일이 끝난 것은 아니다

전반적으로 데이터를 기반으로 하는 보고서를 작성하기 위한 방법을 설명하고 있으나, 파이썬의 여러 라이브러리를 활용하여 전문적으로 분석하고, 챗GPT를 활욯하여 여러 실전사례들 분석하는 방법에 대해 심도 있게 자세히

알기 쉽게 설명 하고 있습니다. 내용이 알차서, 제가 따로 준비하는 빅데이터 분석기사 자격증 준비도 많은 도움이 되었습니다. 여러 서적들이 있지만 최근에 나온 서적중에 데이터 분석 기법에 대해서는 잘 다뤄주고 있다는 생각이 들었습니다.데이터 분석에 관심이 많은 독자들에게 추천하며, 파이썬과 챗GPT를 이용한 분석기법을 알고자 하는 독자들에게 아주 유용한 서적이 될것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

IMG_4546.JPG

 

대부분의 데이터 분석 관련 책들은 분석 자체에만 집중하는 경우가 많은데 이 책은 목적을 가장 중요하게 생각하고 알려주는 책이라서 마음에 들었다. 데이터 드리븐은 '데이터에 기반하여 의사결정을 하는 것'이다. 다른 말로 분석 결과를 통해 이해관계자들을 '설득'시켜야 한다는 것이다. 분석가들의 실질적인 목표인 보고를 위한 '보고를 위한 분석'에 중점을 둔 책이여서 데이터 분석이 업무에 들어가는 모든 직군이 읽어보면 큰 공부가 될 것이라고 생각한다. 또 보고 능력이 분석 능력에 비해 떨어지는 사람들을 위한 책이라고 한다. 데이터는 쌓는 자, 분석하는 자, 보고하는 자, 문제 해결자가 같은 사람일수록 큰 힘을 발휘한다. 요즘 등장하는 생성형 AI를 통해 이 간극이 좁혀지고 있지만 설득을 어떻게 해야하는지는 이 책을 통해 충분히 공부할 수 있다고 생각한다.

 

IMG_4547.JPG

 

책 내용은 크게 데이터에 기반한 보고 방법, 구글 콜랩/파이썬/챗GPT를 실제 보고에 활용하는 방법, 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법, 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법, 실제 분석 업무에 적용할 수 있는 단계별 실습 사례, 선형회귀분석을 통한 고객 설득 방법, 수치형/범주형 데이터에 적용하는 추론과 분류예측 방법, 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법이 있다. 각 사례 문단 첫번째에 요약이 있어서 핵심 내용을 빠르게 파악할 수 있고 QR코드를 통해 바로 예제 코드가 들어있는 콜랩에 들어갈 수 있어서 빠르게 예제를 실행해볼 수 있다.

 

IMG_4548.JPG

 

 

또 챗GPT를 이용하는 방법 또한 기재되어 있어 어떻게 적용해봐야 하는지 알 수 있다. 아마도 이 책은 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인, 상사와 고객을 설득해야 하는 데이터 분석가 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람, 분석 업무에 챗GPT를 활용하고 싶은 사람, 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람이 읽는다면 큰 도움이 될 것이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

#한빛미디어 #이상석 #데이터드리븐 #데이터기반의사결정 #챗GPT #데이터분석

 

[소개]

 

"데이터 드리븐 리포트"는 데이터를 근거로 의사소통해야 하는 모든 실무자를 위한 데이터 기반의 의사결정 가이드이다. 

 

데이터 주도형 보고서 작성에 중점을 둔 책으로, 다양한 산업 분야에서 데이터를 효과적으로 활용하여 의사 결정 및 전략 수립을 수행한 사례를 제시한다. 

 

 

[특징]

 

이 책에서 눈에 띄는 주요 특징은 다음과 같다. 

 

1. 데이터 기초와 이해

 

데이터의 기본 개념과 다양한 유형의 데이터 소스에 대한 이해. 데이터 수집, 정제, 저장 및 관리에 대한 기본적인 개념을 제시한다. 

 

2. 시각화와 효과적인 커뮤니케이션

 

데이터 시각화 기술과 도구를 사용하여 효과적인 보고서 작성. 데이터를 이해하기 쉽게 전달하고 다양한 이해관계자에게 정보를 전달하는 방법을 보여준다.

 

3. 통계 및 분석 기법

 

다양한 통계 및 분석 기법을 활용하여 데이터에서 통찰력을 도출. 효과적인 통계 및 분석 결과를 포함한 의사결정자료 작성 방법을 제시한다. 

 

4. 실전 사례 케이스 스터디

 

실제 비즈니스 케이스를 기반으로 한 데이터 보고서 작성 예시와 그에 따른 결과 해석 및 다양한 업종과 상황에서의 데이터 주도형 접근 방법을 알려준다.

 

 

[소감]

 

데이터 분석에 대해서 대단히 실무적이고 실용적인 접근을 하는 책이다. 

 

이론뿐만 아니라 실제 사례와 함께 실용적인 지침을 제공한다. 또한, 독자가 책에서 배운 내용을 실제 업무에 적용할 수 있도록 돕는다.

 

또한, 다양한 산업 분야에서의 데이터 보고서 작성에 관한 예시와 지침을 다루고 있다. 

 

데이터 분석과 시각화와 관련된 최신 도구와 기술도 소개한다. 

 

현대적인 데이터 시각화 및 분석 도구, 기술, 플랫폼 등에 대한 최신 정보를 제공하며, 독자가 최신 도구를 활용하여 보다 효과적으로 데이터를 다룰 수 있도록 한다. 

 

 

[결론]

 

경험이 풍부한 데이터 전문가의 실무 경험과 교훈을 공유하여 독자들에게 실제 현장에서 어떻게 데이터를 다뤄야 하는지에 대한 인사이트를 제공한다. 

 

이 책은 데이터 분석을 실무에 제대로 적용하기를 원하는 거의 모든 사람들이 많은 것을 얻어갈 수 있는 제대로 된 도서로, 대단히 추천할만한 책이다. 

 

KakaoTalk_Photo_2023-11-26-18-17-40.jpg

 

 

이 책에서 정의하는 ‘데이터 드리분 보고’란 올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 정제, 분석을 거쳐 스토리텔링과 시각화로 설득을 끌어내는 일련의 과정을 말한다.

10쪽, 데이터 드리븐 리포트.

 

 기업에서의 데이터 분석은 점점 더 중요한 위치를 차지하고 있다. 어떤 직급과 업무이든 간에 유의미한 토대가 되지만 상사에게 보고를 하며 설득하는데 있어 중요한 역할을 하는 것이 데이터 분석 결과이기도 하다. ‘데이터 드리븐 리포트’는 단순히 분석을 하는 것뿐 아니라 어떤 데이터를 가지고 어떻게 분석할 것인지, 또 어떻게 해석할 것인지에 대해 설명하고 있다. 보고를 하는 과정에서 필요한 데이터 분석 방식과 커뮤니케이션에 중점을 두고 있다. 데이터 관련 종사자보다는 그 외의 부서에서 데이터를 기반으로 하는 보고를 수행하는 이들이 읽으면 좋겠다는 생각이 든다. 데이터 사이언티스트 독자라면 커뮤니케이션 요소를 주목하는 것도 도움이 될 것이다. 

 

 각 장에서는 실제 회사에서의 데이터 활용 사례와 올바른 접근 방법에 대해 설명한다. 1장 데이터 드리븐 보고에서는 데이터 기반 의사결정 활용 사례에 대해 설명하고, 2장 데이터 드리븐 보고 절차에서는 성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차( 목표 설정 - 데이터 설정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다. 3장 데이터 드리븐 보고 실전 사례 with Chat GPT에서는 실제 비즈니스에 활용되는 데이터셋으로 직접 실습하고 Chat GPT를 통해 파이썬 코드를 작성한다. 4장 데이터 드리븐 커뮤니케이션에서는 설득해야할 대상과의 의사소통 시 점검해야할 체크리스트를 확인한다.

 

 

 

 

과거에는 고려하지 않았던 데이터가 현재는 의사결정에 반영되면서 복잡성이 높아졌다. 글로벌 기업들은 이 복잡성을 관리하고 분석할 수 있는 데이터 드리븐 능력을 앞으로의 시장을 선점하기 위한 가장 중요한 요인으로 보고, 데이터 드리븐 의사결정을 하기 위한 트랜스포메이션을 위해 수조 달러를 투자해왔다.

33쪽, 데이터 드리븐 리포트.

데이터 드리븐 보고는 비즈니스에서 데이터 드리븐 방식으로 의사결정하기 위해 보고하는 절차와 커뮤니케이션을 말한다.

36쪽, 데이터 드리븐 리포트.

 

 데이터 드리븐 보고에는 여섯 가지 유형이 있다. 기초통계, 시각화, 가설검정, 선형회귀분석, 분류예측, 토픽 모델링의 개념을 소개한다. 이후 독립변수와 종속변수, 테이블의 행과 열, 데이터 분리 등 이론적 통계와 분석 시 필요한 개념을 설명한다.

 

 기본 용어 설명과 더불어 파이썬으로 라이브러리를 import하여 데이터셋을 가져와 최댓값 최솟값, 첨도, 왜도 값을 구하는 기본 통계를 실습한다. 상관분석이나 t-검정, 선형회귀분석 등 기본 통계의 간단한 분석들을 살펴본다. 구글 colab을 통한 실습이라 파이썬이나 R을 설치할 필요가 없어 실습을 용이하게 진행할 수 있다.

 

 기본 통계를 살펴본 후 EDA를 수행하여 EDA상에서의 시각화, 결측치/이상치 처리 등에 대해 언급한다. 요즘 핫한 Chat GPT를 활용하여 EDA를 수행하는 방법(히스토그램, xy 플롯 생성 등)에 대해서도 설명하는데 사용자 입장에서 데이터 분석 코드를 받기 타이핑 해야할 문장과 예상 답변을 제공한다. QR코드로 프롬프트 및 결과 또한 설명하여 이해하기에는 어려움이 없었다. Chat GPT로 코드를 받아 활용할 수는 있겠지만 제대로 된 데이터를 받기 위해 잘 유도해야겠다는 생각이 든다.

 

스크린샷 2023-11-27 오후 11.04.10.png

 

책의 가이드 대로 git에 있는 데이터를 불러왔다. pandas 라이브러리를 import하고 데이터프레임을 살펴보았다. 아래 도표는 따로 그린 것이 아니라 colab에서 제공해준 것이라 신기하기도 하고 편리하기도 했다. 

 

스크린샷 2023-11-27 오후 11.18.40.png

 

Chat GPT에서는 간단한 데이터를 제시한 뒤 정규성 검증을 요구했다. 

 

스크린샷 2023-11-27 오후 11.21.16.png

 

알아서 분석부터 print까지 짠 Chat GPT... GPT에서 받은 코드를 colab에서 돌리고 colab에서 받은 결과를 다시 실행시키면 결과도 받을 수 있다. 

 

 

 

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

단순히 이 기술 좋아요! 핫!해요 보다 데이터를 이용해서 설득하는 법에 관해 배울 수 있었다. 

 

프로그래밍을 하면서 여러 데이터를 읽고 다루고 통계치를 낼 수는 있어도 어떤 의도를 가지고 설득하는 것은 전혀 다른 영역이었다. 

 

저자는 파이썬 코드와 ChatGPT를 적극적으로 활용해서 여러 종류의 데이터를 내가 원하는 의도에 맞춰서 분석하고 시각화해낸다. 정형/비정형 데이터로 ChatGPT를 사용해 실습을 해보며 이 정도 분석은 나도 할 수 있을 것 같은데..? 라는 자신감을 가질 수 있었다. 

 

4장의 데이터 드리븐 커뮤니케이션 부분에서 많은 팁을 얻었다.

 

나보다 내 보고 주제를 아는 사람이 없으므로 중요 수치 및 지표 암기하기, 처음 보는 사람에서 질문 생각하기

현재 보고 상황 (ex. 상사가 보고 내용을 잘 알고 있으나 동의하지 않는 경우인가? 보고 내용을 처음 접하는가 등)에 따라 다르게 생각할 것들 등

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

오늘 리뷰할 책은 [데이터 드리븐 리포트] 입니다.

https://www.hanbit.co.kr/store/books/look.php?p_code=B5932813354

1-표지 IMG_20231126_185945.jpg

 

 

저도 데이터 관련 일을 꽤 했었던지라 이 책을 보게 되었네요.

일단 분량은 400 페이지 정도로 큰 부담 없습니다.

그런데 위 링크에 가보시면 이 책은 중급용 으로 표시되어 있습니다.

그 이유는... 이 책은 데이터 분석을 위한 기본서가 아닙니다.

데이터를 다루는 세세한 내용에 대해서는 다루고 있지 않으며,

살짝 큰 그림을 바라보는 입장? 이랄까... 이런 내용들이 더 많아 보입니다.

이 책을 보기 위해서는 구글 코랩/주피터 노트북은 기본적으로 다룰 수 있어야 합니다.

파이썬에 대한 기본적인 문법 설명 따위는 없으니 다른 책을 참고하세요.

아래 내용에서도 나오듯이 의사결정자에게 질문하라,

즉 데이터/리포트를 보는 사람에게 질문을 많이 하라는 내용입니다.

기술적인 설명이 아니라, 현장 경험에서 얻을 수 있는 조언들입니다.

 

2-의사결정자 IMG_20231126_190133.jpg

 

그렇다고 기술적인 내용들이 아주 없는건 아닙니다. 그리고 데이터를 다루는 기본이 되는 통계적인

내용들에 대해서도 설명들이 많이 있습니다. 저도 예전에 공부하다가 왜도? 라는 내용이 나오길래

뭔가 찾아봤던 기억이 있는데 이 책에 마침 그림과 함께 설명이 나와 있드라구요.

 

3-왜도 IMG_20231126_190344.jpg

 

이 책의 좋은 점은 제가 늘 강조하는 컬러판이라는거!

모든 그림이 컬러로 인쇄되어 있어서 가독성이 아주 좋습니다.

그리고 이 책은 올해 한참 유행하는 챗GPT를 함께 사용하는 것을 다룹니다.

개발을 직접 했던 입장에서는 얼마나 도움이 될지는 모르겠지만,

비개발자라면 챗GPT를 사용하는게 상당한 도움이 되겠네요.

 

4-프롬프트 IMG_20231126_190423.jpg

 

책의 내용 대부분이 영어로 된 데이터를 다루고 있어서 좀 아쉬웠는데, 뒷부분에 한국어 데이터를 다루는 내용들도 있네요. 이 부분은 꼭 보시길 권합니다.

 

5-한글 IMG_20231126_190724.jpg

 

 

정리하면, 이 책은 데이터 분석을 주로 하고 C 레벨급들에게 보고를 하는 사람들에게 적당한 책으로 보입니다.

기술적으로 세세한 내용들은 제외하고,

데이터 기반 리포트를 다루는 내용들만 잘 정리 되어 있는 좋은 책이라 추천 하고 싶네요.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

데이터 드리븐 보고가 의사결정의 설득을 위한 것이라면 데이터 드리븐 커무니케이션의 핵심은 바로 인사이트가 있는 스토리를 전달하는 것이다.

 

모든 보고서는 또는 커뮤니케이션의 핵심은 전달이 핵심이 아니라 설득이다.

 

이를 위해 스토리를 만들어야 하는데, 여기에 AI를 잘 적절히 포함하는 방법을 이 책을 통해. 배울 수 있다.

당연히 인공지는 프로그래밍의 기본인 파이썬과 통계기술, 그리고 기본적인 인공지능 모델을 배울 수 있다.

무엇보다도 line by line으로 잘 정리된 내용은 사용자 수준을 넘어 누구나 쉽게 이해하고 또한 응용 할 수 있는 방법으로 구성된 점이 훌륭하다.

 

 

최대한 빨리 데이터를 정리하고 포토폴리오에 업데이트 하기를 원하는 모든이에게 감히 추천한다.

 

 

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

KakaoTalk_20231126_190928130_01.jpg

 

KakaoTalk_20231126_190928130.jpg

 

 

소개

"데이터 드리븐 리포트"는 실무 중심의 데이터 분석에 깊이 있는 내용을 담은 책으로, 저자의 풍부한 경험과 이론적 지식을 토대로 체계적이고 자세한 데이터 분석 소개를 제공합니다. 이 책은 데이터 분석을 시작하는 사람들을 위한 가이드로 파이선 프로그래밍, 통계학, 머신러닝, 딥러닝 등 다양한 주제를 아우르고 있습니다.

 

 

 

목차

1장. 데이터 드리븐 보고

  • 소개: 일상에서 데이터를 활용한 의사결정 사례 소개
  • 적용 분야: 데이터 드리븐 의사결정이 비즈니스에 미치는 영향

2장. 데이터 드리븐 보고 절차

  • ON AIR 분석 절차: 성공적인 데이터 드리븐 보고를 위한 단계별 절차 설명

3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

  1. 행복 지수 분석: 국가별 행복지수와 영향을 미치는 변수 분석
  2. 인력구조 예측: 중장기 회사의 인력구조 예측, 분석, 시각화
  3. 마케팅 효과 분석: 광고 플랫폼 최적화를 위한 마케팅 효과 분석
  4. 유학 컨설팅: 해외 대학 합격률 분석 및 컨설팅 방향 제시
  5. 당뇨병 예측모델: 예방 솔루션을 위한 당뇨병 예측모델 수립
  6. 설문조사 분석: 전 직원 대상 설문조사의 서술형 응답 분석

4장. 데이터 드리븐 커뮤니케이션

  • 체크리스트: 데이터 기반 의사소통 시 확인해야 할 사항 체크리스트
  • 맞춤형 커뮤니케이션: 보고 대상자에 따른 맞춤형 의사소통 방법 안내

 

추천

"의사 결정에 있어 개인의 경험이나 직관이 아닌 객관적인 데이터를 기반으로 하는 의사결정이 필요한 분들에게 이 책을 적극 추천합니다. 현실적이고 체계적인 데이터 분석의 시작을 지원하며, 다양한 주제를 아우르고 있어 전공자와 비전공자 모두에게 유익한 내용입니다."

 

 

 

 
 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

그리하여 저는 최대한 이 책이 어떻게 정리되어 있는지 펼쳐드리는 역할을 하도록 하겠습니다.

내용을 보시고 도움이 될것 같으면 구매해서 보시면 되지 않을까 싶네요.^^

 

1. 다루는 내용 

데이터에 기반한 보고 방법 

구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법 

보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법 

데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법 

실제 분석 업무에 적용할 수 있는 단계별 실습 사례

선형회귀분석을 통한 고객 설득 방법 

수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법 

텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법 

 

2. 대상 독자 

파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인

상사와 고객을 설득해야 하는 데이터 분석가

기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람 

‘해봤는데 안 돼’,‘예전에 검토해봤어’ 등의 이유로 상사에게 거절당한 경험이 있는 사람 

분석 업무에 챗GPT를 활용하고 싶은 사람 

데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람 

 

3. 책의 구성

1장 데이터 드리븐 보고

   일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 기반 의사결정이 비즈니스에 어떻게 활용되는지 알아본다.

   데이터 드리븐 보고가 비즈니스에 어떻게 적용되는지 살펴본다.    

2장 데이터 드리븐 보고 절차  

   성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차(목표 설정 - 데이터 선정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다.

3장 데이터 드리븐 보고 실전 사례 with 챗GPT 

   실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 직접 실습한다.

   사례별로 챗GPT를 활용하여 코딩에 대한 지식 없이도 파이썬 코드 작성할 수 있도록 했다. 

   - 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기 

   - 회사의 중장기 인력구조 예측, 분석, 시각화하기 

   - 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기 

   - 유학 컨설팅을 위한 해외 대학 합격률 분석하기 

   - 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기 

   - 전 직원 대상 설문조사의 서술형 응답 분석하기 

4장 데이터 드리븐 커뮤니케이션

   분석 결과로 상사 혹은 고객을 설득해 원하는 결과를 얻는 것은 분석 과정 만큼이나 중요하다. 

   데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트를 안내한다.

 

5. 개발 환경 

   구글 콜랩 기본 설정인 파이썬 3.10.12 버전(23.9.27 기준)으로 집필했다.

   독자 여러분의 사용하는 로컬 컴퓨터의 파이썬 버전 혹은 라이브러리 설치 유무에 따라 실행 결과가 책의 내용과 다를 수 있으니 참고하길 바란다. 

 

6. 예제 다운로드 

   실습에 필요한 예제 파일은 아래 깃허브를 통해 내려받을 수 있다. 

   구글 콜랩에서 실행하는 과정은 3장 각 절에서 안내하는 QR 코드를 참고하여 진행할 수 있다. 

   https://github.com/sangsucki/DataDrivenReport 

 

7. 소감

- “AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다.” - 산티아고 발다라마  

- 우선 이 책의 가장 큰 장점은 업무를 조금이라도 경험을 해봤던 사람들이라면 실질적으로 접근하고 생각할 수 있게 유도하고 있다는 점이다. 

- 요즘의 책들이 어떤 것들은 사례만 집대성해 놓고 분석을 해놓는 것도 있는데 그런 것들은 이론상으로는 알겠지만 실질적으로 적용하기가 힘든데 그런 부분에서 데이터를 분석하고자 하는 사람들이 접근하기 친근한 책인 것 같다. 

- 그리고 개인적으로는 데이터 분석 성숙도 모델이 잘 정리가 되어 있어 참 좋은 것 같다. 

   코드화 - 수집 - 처리 - 모델 - 설명 - 해석 - 처방 

   이런 식으로 놓고 실무를 처리하는 것도 좋은 것 같고, 기술적으로도 보면 어떤 기술을 이 시점에 적용해야 할지도 정리가 되는 것 같아 아주 인상적이다. 페이지가 공개되어 있지 않아 일단은 텍스트로만 정리를 해봤다. 

- 그리고 보고 대상자에 따라 어떤 식으로 보고를 해야할지도 설명하고 있는데 이것은 마치 어떤 사람에게 조언을 할 때 그 사람에 맞는 조언을 하는 것이 가장 좋은 것과도 일맥상통한다. 

- 모든 사람에게 똑같은 조언을 하면 안되는 것처럼 보고도 보고 받는 사람의 입장에 맞게 이야기를 하고 있는 점도 실무를 하고 있는 사람들에게 매우 도움이 되는 것 같다. 

- 그리고 구글 콜랩의 사용방법도 잘 설명이 되어있어 구글 콜랩 사용방법을 혹시라도 모르는 분들은 일단 그것을 살펴본 후에 챗GPT를 활용하는 장을 보면 좋을 것 같다. 

- 또한 데이터 드리븐 커뮤니케이션의 필요성에서 타이밍이 중요한 이유가 나오는데 보고를 할 때도 상사에게 그 보고가 필요한 시점이 있다. 그 시기가 지나면 보고 하고도 욕을 먹을 수도 있다. 인생사 다 모든 게 타이밍이다.

- 그리고 같은 데이터를 보더라도 지금 내가 해결하려고 하는 것이 어떤 것이냐에 따라 분석하고 처리하고 대응하는 결과가 달라진다. 많은 경험을 통해 하나만 정답이라는 생각을 갖지 말고 이렇게도 될 수 있고 저렇게도 될 수 있다는 생각을 하는게 중요하고, 자신만의 깊은 통찰력이 중요함을 이야기 하고 있다. 

그 통찰력을 결국에는 다른 사람에게 전달을 해야 하기 때문에, 전달할 때 스토리를 어떻게 만들어서 전달을 하느냐에 따라 전달력이 달라지기 때문에 이런 스토리 텔링 능력이 중요하다고 이야기하고 있다. 

- 예를 들면 자바에서 상속을 이야기 할때, 코끼리, 아시아 코끼리, 아프리카 코끼리 이렇게 설명을 하면 이해를 못하는 사람들도 있지만, 커피, 아메리카노, 라떼 이렇게 설명하면 이해를 하는 사람이 많은 것처럼 어떤 스토리로 만들어내느냐가 매우 중요하다고 이야기 하고 있다. 

- 프로그래밍을 배우지 않았던 사람이 시각적인 데이터를 보고, 챗GPT를 활용해서 인사이트를 키우는 경험을 하기에 매우 좋은 책이라고 생각한다.

기본적으로 프로그래밍을 안해봤던 사람이 프로그래밍을 잘해보고 싶지만 막상해보면 어려움에 봉착하게 되는게 그때 가장 쉽게 접근할 수 있는 언어가 파이썬이 아닌가 싶다. 그리고 인공지능까지 활용할 수 있는 방법까지 나오기 때문에 python 잘모르고 연습하고 싶은데 그냥 따라서 해보고 데이터 분석도 해보고 싶은 사람들에게 딱 알맞는 책이 아닌가 싶다. 

- 그리고 컬러로 되어 있어서 이해도 잘되는 편이고, 저자가 데이터에 노력을 많이 하신 것 같고, 글도 쉽게 잘 읽히는 것같다. 어떤 저자들은 이공계적인 글쓰기를 통해 무슨 말인지는 알게는데 어려워서 이해하는데 오래 걸리는 책이 있다면 이 책은 글도 쉽게 읽히는 것 같다. 물론 개인차는 있겠지만, 데이터 분석을 경험하기에 전천후로 좋은 책이라고 생각한다. 

데이터 분석은 꼭 분석가 직군 뿐만 아니라 비즈니스나 경영, 학술 등 분야를 막론하고 필요한 스킬이지 않을까 싶다. 평소 데이터 분석에 관심이 많고 다양한 데이터를 다루다 보니 관심있게 보게 된 책이기도 하다.

 이미지 출처 : generated by OpenAI’s DALL-E

 의사결정의 정확성, 시장 트렌드 파악, 고객 이해, 효율성 및 생산성, 위험 관리, 혁신 촉진, 규제 준수 등 다양한 비즈니스 환경에서 데이터를 활용한 비즈니스 성장 전략이 공유되고 있고 또 어느 때보다 데이터가 넘쳐나는 시대이지 않을까 싶다.

 이 책은 비즈니스 환경에서 데이터 기반 의사결정의 중요성을 강조하며, 실제 업무에 적용할 수 있는 구체적이고 실용적인 지침을 알려준다.

 이미지 출처 : generated by OpenAI’s DALL-E

 데이터 분석의 기초부터 시작하여, 구글 콜랩, 파이썬, 챗GPT 같은 도구를 활용하는 방법을 쉽게 설명한다. 다양한 데이터 유형(수치형, 범주형, 텍스트 등)에 대한 분석 방법과 이를 활용한 설득 전략을 제시하여 데이터 분석 초보 뿐만 아니라 현업 전문가에게도 가이드를 제공한다.

 선형회귀분석, 워드 클라우드, 토픽 모델링 등을 포함한 분석 기법이 실제 사례를 통해 설명되어 있어, 어려운 모델링 기법을 이해하고 적용하기 위한 이론과 실제 사이의 간극을 잘 메워주고 있기도 하다.

 이 책은 데이터 기반 보고 방법, 구글 콜랩과 파이썬을 활용한 실제 보고 방법, 그리고 챗GPT를 포함한 다양한 도구들을 실제 보고에 어떻게 활용할지에 대한 내용을 다룬다. ChatGPT를 활용한 프롬프트 작성법을 통해 원하는 결과를 얻기 위해 어떻게 질문하고 활용해야 하는지에 대한 구체적인 접근법을 제시해 주기 때문에 막상 프롬프트와 마주했을 때 어떤 질문을 해야할지 모르겠다면 이 가이드를 참고해 보는 것도 좋겠다.

 데이터 특성에 따른 분석 기법의 선택, 데이터 분석 결과물을 효과적으로 의사소통하는 방법, 선형 회귀분석을 통한 고객 설득 방법, 수치형과 범주형 데이터의 추론과 분류예측 방법, 텍스트 데이터의 워드 클라우드와 토픽 모델링에 대한 내용을 통해 정형 데이터 뿐만 아니라 비정형 텍스트 분석을 파이썬 라이브러를 통해 코드 몇줄로 구현할 수 있는 방법을 제시한다.

 데이터 분석에 대한 전반적인 내용을 비즈니스 사례에 적용가능하도록 작성된 책으로 의사결정에 가이드가 되는 분석을 하는 노하우와 팁을 얻을 수 있는 책이다.

 

 

다음 내용 구성으로 데이터 분석 뿐만 아니라 의사결정과 설득을 위한 데이터 분석 기법에 대해 고민해 보기에 좋은 책이었다.

 

1장. 데이터 드리븐 보고

일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.

 

2장. 데이터 드리븐 보고 절차

성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.

 

3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.

  • 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기
  • 회사의 중장기 인력구조 예측, 분석, 시각화하기
  • 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기
  • 유학 컨설팅을 위한 해외 대학 합격률 분석하기
  • 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기
  • 전 직원 대상 설문조사의 서술형 응답 분석하기

4장. 데이터 드리븐 커뮤니케이션

데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.

 

일반적인 데이터 분석내용 보다 두걸음 앞선 실제 실무 내용들을 다루고 있습니다. 

때문에 파이썬 기초 및 통계 기초에 대해서 간단하게 선행학습을 한 뒤 이책을 보게 된다면

실무에 바로 적용하여 활용할 수 있을 정도로 도움이 많이 될 것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다"

 

 

의사결정, 설득력의 필요성을 느꼈을 때

학교에서 건축 설계 수업을 들을 때 굉장히 어려운 질문을 받을 때가 있었다.

“근거가 뭐야? (이거 왜 그래야해?)”

“그 컨셉에서 나온 이 단어의 정의는 뭐야?”

진땀이 빠진다. 만약 데이터를 가져갔는데 교수님의 마음에 안든다면 (예를 들면 “나는 그렇게 생각하지 않는데?”)

사례를 가져가면 반례를 들어버리면 정말 난감하다.

노년층의 요양과 여가 관련한 시설을 설계 수업에 진행했을 때는 “요양이 뭐야?” 같은… 질문을 들으면 그 뒤에 나올 많은 데이터, 사례, 설계 자료들이 무너지는 경험을 하게 됐다.

그래서 나는 늘 논리는 의외로 수학적으로만 딱 떨어지지 않을 수 있다는 생각을 해왔다. ‘아’와 ‘어’는 다르고 교수님의 기분과 컨디션에 따라서 그 논리가 통과가 될 때도 있고 아닐 때가 있다. 발표하는 나의 말투, 옷차림, 제스쳐도 의외로 영향이 가곤 했다. 논리를 증명하는 것이 아니라 설득하는 과정이기 때문인 것 같다.

이런 무시무시한 일을 당한 나의 의문에 이유를 찾게 해준건 개발, 데이터 관련 책인 데이터 드리븐 리포트인 것 같다.

이 책에서 다루는 내용

데이터 드리븐 의사결정의 중요성을 다룬다.

데이터가 어떻게 의사결정 과정을 개선할 수 있는지, 그리고 이 접근법이 가져오는 효과가 어떤지 알 수 있다.

데이터 리포트의 오해와 실체, 그리고 접근법을 다룬다.
이런 일종의 리포트 '방법론'을 통해서 제공하는 가치. 그리고 이런 데이터에 대한 오해를 알려준다. 내가 리뷰글 초반에 생각했던 고민에 답을 찾는데 큰 도움을 얻었다.
그리고 이러한 데이터를 활용한 접근법, 원칙, 절차에 대해서 알려준다. (파이썬을 통해 만든 그래프로 인사이트를 얻어내는 과정을 알려준다.)

커뮤니케이션과 스토리텔링에 대해서 다룬다.
데이터 기반 리포트는 논증이 아니라 듣는 이(상사, 교수, 클라이언트같은...)를 설득하는과정이 되어야한다. 데이터에 대해서 받아들일 수 있도록 하기 위한 커뮤니케이션, 이해하기 쉽도록하는 스토리 텔링에 대한 인사이트를 다룬다.

의견에 설득력을 주는 것은 데이터

책의 초반 부분에 전무에게 보고하는 내용이 나오는데, 꽤나 자주 겪었던 이야기여서 공감을 하고 시작할 수 있었다.

내가 느꼈던 것은 이 2가지였고 극복하기 위해선 데이터를 통한 설득이 필요하다.

  • **내가 갖고 있는 편향성, 편승 효과로 인해서 내 시야를 가리기도 한다.
  • **상대방의 확증 편향에 의해 내 의견이 반려당하거나 의외로 쉽게 통과되기도 한다.

편향성의 예

화자 : "채널 A, B에만 집중했던 기존 전략과 차별화하기 위해 이번에는 획기적으로 채널 C에 전폭 집중하려고 합니다." → 친혁신 편향 (혁신의 중요성을 과대평가하고 반대로 단점을 과소평가하는 경향)

화자 : (5년 전에 채널 C가 효과가 없었다라는 피드백에 대해서) "그래도 요즘 MZ 세대에서는 채널 C의 효과가 가장 좋다고 합니다. 5년 전과는 확실히 다른 결과를 전망합니다." → 편승 효과 (대중적으로 유행하고 있다는 정보의 선택에 더욱 힘을 실어주는 효과)

전무 : "MZ세대에게 효과가 좋은 것이 장기적으로 우리 회사 브랜드에 도움이 되는 건가요? 5년 전과 다른 결과를 전망하는 근거가 무엇인가요?" → 확증 편향 (가설의 진위를 가리거나 문제를 해결할 때 자신의 신념과 일치하는 정보만 취하고 상반되는 정보는 무시하는 무의식적 사고 경향)

데이터 드리븐 의사결정을 위해 필요한 4가지

  • 숫자 : 숫자가 들어가면 신뢰도가 높아지고 데이터를 통한 의사결정에 도움을 준다. 그러나 이 숫자를 통해 어떤 인사이트를 줄 것인가는 필요하다.
  • 도구 : 화려하게, 복잡한 문제를 풀어내는 것은 설명이 어려워진다. 짧은 시간 내에 의사결정을 위해서는 의사결정자가 한 번에 이해할 수 있는 보고를 위해서 필요하다.
  • 도메인 지식 : 그저 데이터를 읽는 행위를 넘어서 인사이트를 끌어내기 위해서는 배경지식이 필요할 수 밖에 없다.
  • 직관 : 최종 결정은 항상 직관적이다. 과거의 경험을 현재의 의사 결정에 연결하는 방법이기 때문에 배제해서는 안되는 항목이다.

→ 이 4가지 항목을 무기로 커뮤니케이션과 스토리텔링을 버무리면 너무 좋은 리포트가 된다.

후기

내가 갖고 있던 고민인 설득력을 어떻게 보여줄 것인가를 책으로 읽을 수 있었다. 내가 갖고 있는 생각이 그냥 의견을 넘어서 설득력을 갖는 배경이 될 수 있을 것 같다.
논리적인 의사결정, 그리고 듣는 이가 호의적인지, 반발심을 갖고 있는지에 따른 커뮤니케이션 방법도 알려주는 세심한 내용이 나오기 때문에 나같은 귀여운 초보들에게 알려주는 선배의 조언이라 느꼈다.

결국 개발도 의사결정도 사람이 한다. 이 점을 잊지 않아야한다는 것을 이 책을 통해 알 수 있었다.

그리고 저번에 읽었던 앤서블 책도 그렇고 ChatGPT를 활용한 코드 작업(그래프를 만들어줘!) 같은 방법이 책에서 나오게 되는데, 이젠 AI에게 단순 작업을 위임하는 방식이 대중화되고 있음을 느낀다.

안녕하세요 마개입니다.

이번 달에 소개해 드릴 책은 "데이터 드리븐 리포트, 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬"입니다. 해당 책에 대해 알아봅시다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

도서 소개

● 도서명 : 데이터 드리븐 리포트, 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬

● 지은이 : 이상석

● 출판사 : 한빛미디어

● 출간 일자 : 2023-10-31

● 페이지 : 408쪽

● 가격 : 정가 33,000원

 

해당 책을 보면서 많은 공감을 할 수 있었습니다. 기존에 책들은 데이터 분석의 하드 스킬을 많이 다룬다고 하면 이 책은 하드 스킬뿐만 아니라 소프트 스킬도 다루어 회사에서 바로 적용해 볼 수 있을 만큼 정교하게 지식을 공유해 주고 있습니다. 회사에서 의사결정을 할 때 왜 데이터를 기반으로 의사결정을 해야 하고 같은 데이터를 이용하여 보고하더라도 어떻게 더 효율적이고 효과적으로 보고할 수 있는지 등 여러 고민을 담은 책이라고 생각됩니다.

데이터 분석을 하는데 필요한 순서의 절차를 알려주고 해당 절차에서 각 단계에서 해야 할 내용도 같이 공유하고 코딩이 익숙하지 않은 사용자들을 위해 ChatGPT를 이용하여 코딩하는 방법도 직접 보여주고 있습니다. 그리고 모든 상황을 제시하여 해당 상황을 해결해나가는 방식으로 진행되어 더 이해하기 쉽고 실생활에서 경험해 볼 만큼 공감이 되도록 잘 설명해주고 있습니다. 데이터 분석을 하는데 하드 스킬이 있지만 실생활에서 어떻게 이용해야 할지 모른다면 이 책을 강력 추천합니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
이상석 지음

 데이터 드리븐 리포트 책을 처음 봤을 때, 소제목이 굉장히 매력적으로 다가왔습니다. 상사와 고객을 설득하는 데이터 기반의 의사결정은 데이터분석가에게 회사 생활에서 가장 중요한 부분이라고 생각합니다. 데이터 분석가는 늘 많은 데이터 속에서 새로운 인사이트를 찾아내지만, 이 내용을 어떻게 효과적으로 전달할 지 고민하는 경우가 많습니다. 개인적으로는 저처럼 주변 동료들이 데이터 전문가보다는 도메인 전문가들이 많은 곳은 더더욱 중요한 것 같습니다.

1. 대상 독자

 이 책은 의사결정을 위해 다양한 데이터를 사용하고 분석하시는 분들에게 도움이 될 만한 책이라고 생각합니다. 당연히, 파이썬을 다루시는 분이라면 더 잘 이해가 되고 도움이 많이 되실 것입니다. 그럼에도 데이터를 통해 효과적으로 보고서를 작성하고 싶으신 분들에게도 도움이 될만한 것이 많이 있습니다. 한 예로, 책의 내용을 살펴보다보면 독자가 matplotlib이라는 시각화 라이브러리를 몰라도, gpt를 활용해서 효과적으로 시각화하는 방법을 알려줍니다.
 특히나, 책에서는 다양한 상황을 가정하여, 회사에서 일어날 법한 대화들을 통해 어떻게 효과적으로 전달할 수 있는 지에 대해서 소개하고 있습니다.

2. 책의 내용 및 장단점

책의 목차는 다음과 같습니다.

  • 1장. 데이터 드리븐 보고
    • 일상의 보고 상황
    • 데이터 드리븐 의사결정이란
    • 데이터 드리븐 보고란
    • 데이터 드리븐 보고 5원칙
  • 2장. 데이터 드리븐 보고 절차
    • 데이터 드리븐 보고 전략
    • 분석 전 알아야 하는 용어
    • 분석 목표 설정
    • 계획서 작성
    • 데이터 선정
    • 분석방법 결정 및 해석/검증
    • 보고 대상자에 따른 보고 방식
  • 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
    • 데이터와 친해지자: EDA & 기술통계
    • 데이터도 백문이 불여일견: 데이터 시각화
    • 당신의 질문에 데이터가 답한다: 가설검정
    • 데이터에 맞는 직선을 찾아라: 선형회귀분석
    • 합격이냐 불합격이냐: 분류 예측
    • 대량의 텍스트 데이터를 이해하다: 토픽 모델링
  • 4장. 데이터 드리븐 커뮤니케이션
    • 데이터 드리븐 커뮤니케이션의 필요성
    • 데이터 드리븐 커뮤니케이션 구성요소
    • 데이터 드리븐 커뮤니케이션 방법
    • 스토리텔링
    • 데이터 드리븐 커뮤니케이션 체크리스트
  • 부록
    • 구글 코랩 시작하기
    • 라이브러리 설치하기
    • 데이터 훑어보기

 파이썬에 익숙하지 않고, 데이터 분석을 해보지 않으신 분이라면, 2장에서 기본적인 내용에 대해서 소개하고 있으니, 그것들을 참고하면서 읽어보시면 도움이 많이 될 것 같습니다. 주의해야할 점은 회사의 데이터로 직접 적용을 시키고자 한다면, 3장에서 챗GPT에 고스란히 데이터를 넣는 것은 위험할 수 있습니다. 일부 변환시키거나 동일한 포멧이지만 임의의 숫자를 넣은 데이터로 변경한 뒤 활용하시는 것을 추천드립니다.

 이 책을 읽으면서 가장 좋았던 일부분을 발췌했습니다. 단순히 결과만 도출하는 것에서 끝나는 것이 아니라, 어떤식으로 해석하고, 인사이트를 줄 것인지에 대해 디테일하게 적힌 부분이 좋았습니다.

 또한 다양한 시각화를 진행할 때, 어떻게 전달하느냐에 따라 어떤 차트를 사용하는 것이 좋을 지를 알려주는 내용도 포함되어 있습니다. 이러한 내용은 특히나 초년생인 데이터 분석가들에게는 도움이 많이 되는 부분이라고 생각합니다.

 당연하게도, 어떻게 전달하느냐에 초점이 맞춰져있다보니, 깊은 분석 방법들을 다루지는 않습니다. 그럼에도 데이터분석가라면 한번 쯤은 반드시 읽어보면 좋을 책임은 분명한 것 같습니다. 단순하게 팩트만 전달하는 사람들에게 좋은 가이드가 될 수 있을 것 같습니다.

 

3. 총평

 많은 초년생 분석가들은 다양한 데이터 중에서 어떠한 내용을 강조시켜야할 지, 어떻게 내용을 전달할 지에 대한 고민을 많이 하고 계실 것 같습니다. 데이터 드리븐 리포트는 이러한 궁금증에 대해 어느 정도 해소시켜줄 수 있는 책이라고 말할 수 있습니다. 이론만 주구장창 들어있기보다는 실제 상황을 가정해서 기술하고 있어서, 생각보다 쉽게 읽어지는 책입니다. 이 책은 실무에서 충분히 도움될 수 있는 책이므로 꼭 한번쯤은 읽어보시기를 추천드립니다. 비록 다양한 통계적인 기법 부분에서는 부족한 부분이 있으나, 그런 것들을 어떻게 활용해서 근거자료로 사용하게 되는 지를 알려주는 책입니다. 지식의 깊이보다는 실제 업무 과정 속에서 어떻게 해야 하는가에 집중해보면서 읽으시면 많은 도움이 될 것 같습니다.

도서명: 데이터 드리븐 리포트

출판사: 한빛미디어

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

요약

상사나 고객을 설득하기 위한 데이터 기반의 리포트

- 데이터 드리븐 보고란?

- 데이터 드리븐 보고를 위한 절차

- 데이터 드리븐 보고의 실전 사례

- 데이터 드리븐 커뮤니케이션

 

 

후기

몇년 뒤면 직장 생활을 한지 20년이 된다.

직장생활을 하면서 많은 회의를 진행하며, 필요에 따라 상사나 타부서 또는 고객을 설득해야 하는 경우가 많다.

이러할 때 가장 중요한 것이 자료를 기반으로 한 설득이며, 자료는 객관적인 자료이며 상대방이 납득할 수 있는 자료이어야 한다.

 

'데이터 드리븐 리포트'는 이러한 데이터 기반의 보고에 대한 책이다.

다만, 단순히 데이터를 기반으로 한 보고서를 넘어서

ChatGPT를 활용한 보고서 작성이나, 선형회귀분석, 분류예측 같은 ML적인 요소들도 다룬다.

또한 데이터를 어떻게 보여 주는지가 중요하기에 데이터의 시각화에 대한 내용도 포함이 되어 있다.

(개인적으로는 데이터도 중요하지만 데이터를 시각화 하는 인포그래픽도 굉장히 중요하다고 생각한다.

회사 내 고위직이나 중요 고객에 대해서는 많은 표와 데이터보다 적절한 인포그래픽이 훨씬 더 많은 것을 전달할 수 있다.)

 

추가로 커뮤니케이션에 대한 내용도 포함이 되어있다.

이 책의 목적 자체가 상사나 고객을 설득하기 위함이다.

설득을 하기 위해서는 어떠한 데이터를 추출하여 어떻게 시각화를 하고,

어떠한 도구를 써서 표현을 하며, 스토리텔링을 어떻게 할지에 대한 것을 다룬다.

아마 한국 사람들이 가장 어려워 하는 부분일 것이라 생각된다.

직장생활을 하다보면 아는 것은 많은 데, 그것을 정리하고 표현을 하는데 있어서 잘 못하는 사람을 많이 보곤 한다.

 

 

추천

직장인이면서 보고와 설득을 하기 위한 업무가 많은 사람

파이썬, ML, ChatGPT 등에 대해서 기초적인 지식을 갖고 있는 사람

데이터의 처리와 표현에 대해서 어려움을 겪는 사람

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

	

《데이터 드리븐 리포트》는 데이터 분석 실무에 중점을 둔 심도 있는 내용으로 구성된 책으로, 저자의 풍부한 경험과 이론적 지식을 통해 데이터 분석에 대한 체계적이고 자세한 소개를 제공합니다. 이 책은 데이터 분석을 공부하는 사람들에게 추천합니다.

책은 데이터 분석을 시작하는 사람들을 위한 책으로, 파이선 프로그래밍 언어와 통계학, 머신러닝, 딥러닝 등 다양한 주제를 아우르고 있습니다. 저자는 처음에 파이선이라는 프로그래밍 언어부터 시작하여, 통계학적 개념, 머신러닝 알고리즘, 딥러닝의 작동 원리, 신경망의 종류와 언어 등 다양한 주제를 다루고 있습니다.

주요 내용

데이터 드리븐 보고 : 책의 첫 장에서는 데이터 드리븐 보고의 개념과 5가지 원칙에 대해 설명합니다. 특히, 설명 가능성과 중립성, 문제 정의의 중요성, MVP 개념, 추론과 예측의 차이 등을 강조하며 데이터 드리븐 보고의 핵심을 소개합니다.

데이터 드리븐 보고 절차 : 두 번째 장에서는 데이터 분석을 위한 절차를 상세하게 설명합니다. 분석 목표 설정의 중요성과 실제 데이터 수집, 전처리, EDA, 시각화에 대한 실전적인 내용을 다루면서 이론을 실제 데이터와 코드를 통해 더욱 쉽게 이해할 수 있도록 합니다. 다만, 혼동 행렬에 대한 내용에서 일부 불일치가 있어 수정이 필요할 것으로 언급되었습니다.

데이터 드리븐 보고 실전 사례 with 챗GPT : 세 번째 장에서는 데이터 분석 기획부터 보고까지의 프로세스를 A부터 Z까지 다루며, 최근의 트렌드에 맞게 챗GPT와 같은 기술을 활용한 실습 사례를 제시합니다. 이를 통해 최신 동향을 반영하면서도 실무적인 능력 향상을 도모합니다.

데이터 드리븐 커뮤니케이션 : 네 번째 장에서는 데이터 분석 결과를 효과적으로 발표하는 방법에 대해 다룹니다. 그래프 활용, 대상별 전달 방식 등에 대한 자세한 내용을 통해 리포팅의 효과를 극대화하는 방법을 제시합니다. 단, 몇몇 부분에서 오해를 불러일으킬 수 있는 내용이 있어 주의가 필요하다고 언급되었습니다.

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

데이터 분석가에게 중요한 건, 데이터 드리븐 보고다. 분명 나는 고도의 분석 방법을 사용해서 예측력을 10% 상승 시켰는데, 막상 상사에게 보고 하면 '그래서?'라는 반응이 나온다. 데이터 드리븐 방식의 보고를 사용하지 않았기 때문이다. 데이터 드리븐 보고는 분석 결과를 전달하는 것이 목표가 아닌, 보고 받는 이가 그 가치를 인정받고 활용할 수 있게 만드는 것이다.

실무자와 의사결정권자에게 보고하는 방식은 각각 다르다. 실무자 보고는 서론 - 데이터 - 분석 - 인사이트 도출 및 해석 - 제언으로 구성되며, 의사결정권자 보고는 OREO를 사용한다. OREO란, Opinion - Reason - Evidence - Opinion(의견 - 이유 - 증거 및 예시 - 의견/제언)으로 구성한다.

통계 검정에 대해 알려준다. t-test, F-test, Anova 뿐만 아니라 비모수적 검정 방법인 크루스칼 , 만 휘트니, 윌콕슨 부호 순위 검정을 알려준다. 각각의 차이점은 무엇이며, 어떨 때 사용해야 하는지 쉽게 작성해두었다. 특히 Youtube, Facebook, Instagram 중 어떤 채널에 추가적인 마케팅 비용을 들여야 하는지 통계 검정을 사용해서 효과적인 방식을 알려준다.

데이터 드리븐 리포트 

- 데이터 분석 실무를 완벽하게 공부할 수 있는 명저 -

 

데이터드리븐리포트01.jpg

 

 

이번에도 아주 마음에 드는 책을 한 권 소개합니다. 

 

데이터 드리븐 리포트 라는 책인데요. 데이터 분석 실무에 대해서 이렇게 체계적이고 자세하게 소개한 책은 지금까지 없었기 때문에 데이터 분석을 공부하는 사람이라면 반드시 읽어야 한다고 생각하는 책입니다.

 

책을 처음 받고 나서 내용을 훑어 본 결과 너무 마음에 들었고, 최근 가르치고 있는 학생들에게도 사비를 털어 선물로 주었을 만큼 만족스러운 책입니다.

 

빅데이터, 인공지능이 중요해지고 chatGPT 같은 생성형 인공지능이 일상을 파고든 만큼 데이터 분석에 대한 관심은 더 높아지고 있습니다. 직접 데이터 분석이나 인공지능을 배우려는 사람들도 많아지고 있는데요. 데이터 분석을 공부하다 보면  배워야 하는 것이 너무 많아서 뭔가 많이 배우고 공부하기는 했지만 그래서 이걸 어떻게 써야 하는거지? 하는 의문이 생길 수 있습니다. 

 

생전 처음 접하는 파이썬이라는 프로그래밍 언어부터 시작해서 통계학도 공부해야 하고, 머신러닝 알고리즘의 특성과 사용법, 분석된 결과를 보고 다시 튜닝하는 작업, 딥러닝은 또 다른 세계라 딥러닝이 작동하는 원리 신경망의 종류와 언어, 이미지, 음성에는 또 어떤 신경망을 써야하는지 등 할 것이 너무나 많습니다. 그러다가 보면 정작 숲을 보지 못하고 나무만 열심히 파게 되고, 내가 지금까지 열심히 배운 것들로 도대체 뭐를 할 수 있지? 하는 의문이 생기게 되는 것이죠.

 

실제로 제가 데이터 분석 강의를 하면서도 가끔 학생들에게 받는 질문이기도 합니다.  

 

"선생님 그래서 지금까지 배운 머신러닝, 딥러닝으로 뭐를 할 수있는 거에요?"

 

실제로 받은 질문이고 처음에는 좀 충격이었습니다. 수업 초기에 데이터 분석의 필요성이나 실제 사례등에 대해서 설명하고 이론과 알고리즘 설명 그리고 코딩을 통한 실습을 하게 되는데 , 알고리즘이랑 원리를 설명하고 코딩으로 구현하는 것에 집중하다가 보니 학생들은 그것을 이해하기에도 벅차서 정작 데이터 분석을 왜 하고 어떻게 쓸 수 있는지는 잊어버리더군요. .

 

데이터 드리븐 리포트는 데이터 분석을 공부하다가 길을 잃어버린 분들에게  다시 숲을 보게 만들어주는 역할 즉, 왜 데이터 분석을 해야 하고 그것을 어떻게 활용할 수 있는지에 대한 답을 주는 책입니다. 

 

1. 누가 읽어야 하나요?

데이터 분석을 공부하고 있는 사람들에게 적극 추천합니다. 특히 데이터 분석을 공부하기는 했는데 어떻게 써야하는지 잘 모르겠는 사람들에게 아주 유용합니다. 

 

데이터 분석을 아직 공부하지 않았더라도 데이터 분석을 공부하면 어떤 일을 하게 되고 어떻게 활용할 수 있는지 알고 싶은 분들에게도 추천합니다. 

 

 

2. 데이터 드리븐 리포트의 주요 내용

 

데이터 드리븐 리포트의 주요 내용은 아래와 같습니다. 

 

1장 데이터 드리븐 보고

1장에서는 데이터 드리븐 보고가 무엇인지에 대해서 설명하고 구체적으로 어떻게 하는 것인지에 대한 내용이 나와 있습니다.  특히 1장 4절의 내용이 흥미롭습니다. 

 

데이터 드리븐 보고 5원칙

 

1. 설명 가능해야 한다.

2. 데이터 드리븐 보고는 중립적이지 않다.

3. 문제를 정의할 수 있어야 한다.

4. MVP(minimum value product) - 제품을 통해 해결하려는 문제와 가설을 명확히 하는 것 부터 시작하라.

5. 추론과 예측을 구분하라.

 

2장 데이터 드리븐 보고 절차

2장에서는 데이터 분석을 하고 의사결정에 활용되는 과정을 상세하게 보여줍니다.

특히 분석 목표 설정에 대한 중요성이 잘 강조되어 있습니다. 데이터 분석을 공부하는 학생들이 이것을 어떻게 써야 하는가?를 고민하게 되는 이유가 사실 분석 목표가 없기 때문인데, 그 부분을 명확하게 짚어주고 있습니다. 

 

데이터드리븐리포트02.jpg

 

그리고 세부적으로 데이터 수집, 전처리, EDA, 시각화 등을 실제 데이터와 코드를 통해 보여줌으로써 이론이 아닌 실전으로 이해하기 쉽게 설명하고 있습니다.

 

 

데이터드리븐리포트03.jpg

 

2장과 3장을 읽다가 이 책에서 좀 아쉬운 점을 발견했는데요,  분석결과를 검증할 때 많이 사용하는 혼동 행렬(confusion matrix)이 2장과 3장에서 다르게 나와 있다는 것입니다.

 

혼동 행렬의 결과는 예측값과 실제값의 위치, 그리고 True, Flase 값의 위치에 따라서 달라집니다. 그래서 처음 공부할 때 봤던 혼동행렬과 다른 그림이 나오면 아주 어려워 할 수 있습니다. 그런데 이 책에서는 2장에서 설명할때의 그림과 3장의 그림이 예측과 실제 값의 위치뿐만 아니라 True, False 값의 위치도 다릅니다. 

 

데이터드리븐리포트05.jpg

2장 혼동행렬 설명 부분에 있는 Confusion Metrix 

예측값이 좌측, 실제값이 윗쪽에 있고 True, False 순서로 되어 있다.

 

 

데이터드리븐리포트06.jpg

 

3장 분석 결과 해석에 있는 혼동행렬(Confusion Metrix)

사이킷런의 결과이므로 왼쪽에 실제값, 윗쪽에 예측값이 있고 False, True 순서다.

 

혼동행렬을 정확히 이해하고 있다면 실제값과 예측값 방향이 바뀌고 True, Flase 값의 위치가 다르더라도 Accuracy, Precision, Recall, Specificity, Error Rate, F1 Score를 정확히 구할 수 있지만, 아직 혼동 행렬을 정확히 이해하지 못한 사람에게는 가뜩이나 헷갈리기 쉬운 혼동행렬을 더 어렵게 만들 수 있어서 통일이 필요할 것 같습니다.

 

3장 실습 코드에서 파이썬의 사이킷런의 결과물로 혼동행렬(confusion matrix)를 설명하고 있으니 2장의 내용도 이것에 맞추어 수정하는 것이 혼란을 줄일 수 있는 방법이라고 생각합니다. 

 

3장 데이터 드리븐 보고 실전사례 with 챗GPT

3장은 데이터 분석 기획부터 보고까지 실무 프로세스를 A 부터 Z까지 경험해 볼수 있는 내용으로 구성되어있습니다. 그리고 특이한 점은 최근 챗GPT의 등장으로 코딩 스타일이 많이 바뀌었는데, 실무에서 챗GPT를 사용하여 어떻게 코딩 효율을 높일 수 있는지 잘 보여주고 있어서 최근 트랜드를 잘 반영했다고 생각합니다. 

4장 데이터 드리븐 커뮤니케이션

4장은 데이터 분석 결과를 보고할 때 어떻게 효과적으로 발표할 수 있는지에 대한 내용을 실제 사례를 들어 자세히 설명하고 있습니다.  특히 효과적인 전달을 위해 그래프를 어떻게 활용할 것인지에 대해서 자세히 나오고 누구에게 보고 하느냐에 따라서 내용이 어떻게 바뀌어야하는지도 잘 설명하고 있습니다. 

 

4장에서 조금 우려되는 부분은 책  내용이 자칫 오해를 불러 일으킬 수도 있다는 점이 있습니다. 

 

책 내용중 1.4.2 데이터 드리븐 보고는 중립적이지 않다. 의 내용에서 y축을 조작해 실제로 차이가 크지 않은 내용을 과하게 강조하는 내용이라던지, 4.3.1 에서 어떤 차트를 써야하는가에 대해서 설명 할 때 바 차트 부분 그리고 4.4.1에서 스토리 텔러의 핵심은 속임수? 부분은 조금 주의해서 봐야 할 필요가 있습니다. 

 

저자의 의도대로 객관적으로 분석한 결과를 가지고 어떻게 설득력 있게 전달 할 것인가를 고려하면 충분히 이해가 가는 내용입니다. 하지만 읽는 사람에 따라서 자칫 데이터 분석 결과는 객관적으로 전달해야 하는 것이 아니고 주관을 담아 과장하거나 축소해서 보고해도 된다는 오해를 불러 일으킬 수도 있을 것 같습니다.

 

데이터드리븐리포트07.jpg

 

책 내용에서 데이터와 분석은 객관적이지만 그것을 해석하는 것에 있어서는 주관이 들어갈 수 밖에 없다는 것은 충분히 설명하고 있지만 위와 같은 그래프 트릭은 주의해야 하는 부분임을 조금 더 강조해 주는 것이 좋을 것 같습니다. 

 

3. 마무리

데이터 드리븐 리포트는 데이터 분석 실무를 실제 사례를 들어 소개하는 책으로 데이터 분석을 공부하는 사람들에게 꼭 필요한 책이고 누구나 읽어봐야 하는 책이라고 생각합니다. 

 

제가 가르치고 있는 학생들에게 선물을 해주었을 만큼 만족스럽고 적극 추천하는 책입니다. 

 

다만, 2,3장의 혼동행렬을 설명하는 부분이 통일되었으면 좋겠습니다.

 

그리고, 데이터 분석 결과를 어떻게 의사결정자들에게 설득력 있게 전달해야 하는가? 하는 부분에 대한 내용은 이해 할 수 있으나, 자칫 결과를 전달하는 과정에서 분석가의 의도대로 과장해도 된다고 오해할 수 있는 부분은 좀 아쉽습니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 


[도서 소개]

무조건 안 된다는 상사, 데이터로 설득하라!

데이터를 근거로 의사소통해야 하는

모든 실무자를 위한 데이터 기반의 의사결정 가이드


경험 또는 직관만으로 의사결정자나 이해관계자를 설득할 확률은 0%에 가깝다. 상사나 고객을 설득하려면 데이터에 기반하여 소통해야 한다. 이 책은 데이터 분석을 실무적으로 다루며 방대한 데이터 속에서 핵심 인사이트를 찾아내 그 결과를 명확하게 전달하는 방법을 안내한다. 또한 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여섯 가지 사례를 통해, 분석 목표 파악부터 데이터 유형에 따른 적절한 분석 기법 선택, 분석 결과를 바탕으로 의사결정자를 설득하는 실무 과정까지 익힐 수 있다. 데이터 기반의 의사결정 절차를 살펴보면서 데이터를 효율적으로 분석하고, 그 결과를 근거로 원활히 소통하는 전문 역량을 키워보자.


[내용 구성]

1장. 데이터 드리븐 보고

일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.


2장. 데이터 드리븐 보고 절차

성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.


3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.- 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

- 회사의 중장기 인력구조 예측, 분석, 시각화하기

- 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

- 유학 컨설팅을 위한 해외 대학 합격률 분석하기

- 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

- 전 직원 대상 설문조사의 서술형 응답 분석하기


4장. 데이터 드리븐 커뮤니케이션

데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.


[대상 독자]

- 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 사람

- 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람

- 다양한 상황별로 적합하고 효율적인 분석 기법을 알고싶은 사람

- 분석 업무에 챗GPT를 활용하고 싶은 사람

- 데이터분석전문가(ADP), 빅데이터분석기사를 준비하는 사람



[주요 내용]

- 데이터에 기반한 보고 방법

- 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법

- 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법

- 실제 분석 업무에 적용할 수 있는 단계별 실습 사례

- 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법

- 선형회귀분석을 통한 고객 설득 방법

- 수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법

- 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법



[서평]


데이터 드리븐 리포트는 데이터를 기반으로 한 보고를 통해 의사결정자를 설득하고 효율적인 의사결정을 내리는 데 초점을 맞춘 책입니다. 이 책은 데이터 수집, 정제, 분석, 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 방법을 제시합니다.


ON AIR 분석 절차를 단계별로 설명하며, 성공적인 데이터 드리븐 보고를 위한 방법을 제시합니다. 또한, 실제 비즈니스에 활용되는 데이터셋을 통해 다양한 사례를 실습하며, 상황별 가장 적합한 분석 기법을 선택하는 방법을 알려줍니다.


데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내합니다. 이를 통해 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람들에게 유용한 정보를 제공합니다.


이 책은 데이터 분석 사고의 폭을 넓히고, 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있습니다. 또한, 데이터에 익숙하지 않은 사람들도 쉽게 이해할 수 있도록 구성되어 있습니다.


데이터 드리븐 리포트는 데이터 분석가의 필독서로 추천할 만한 책입니다. 데이터 분석에 관심이 있는 사람들에게 이 책을 추천합니다.



 "한빛미디어 리뷰어 활동을 위해서 책을 제공받아 작성된 서평입니다."

직급이 올라갈수록 대기업에서는 단순히 개발 실력만 요구하지 않게 된다.

슬프다... 하지만 별 수 있는가 그에 맞게 적응을 하고 앞으로 나아가야 한다. 개발 실력에서 나아가서 길러야 할 역량은 바로 커뮤니케이션이다. 

이때 커뮤니케이션에서 근간이 되는 것은 어조, 화법, 경청 등 태도는 기본이 되어야 겠지만,

특히나 남을 설득하거나 공감대 형성을 하는 과정에 필수적인 것은 바로 데이터를 기반으로 하는 것이다.

가령, 어떤 프로덕트를 Initiation을 해야 하는데, 트렌드에 엮어서 할수도 있지만 데이터를 활용해서도 근거를 만들어내어 할 수 있다. 구체적으로 데이터 엔지니어링을 하는데 데이터 품질이 ~ 부분에서 이렇고 정량적으로 측정하면 ~%가 떨어진다는 점을 근거로 내세워 데이터 품질 관리시스템 Initiation을 할 수도 있을 것이다.


이런 역량을 강화하는 데 특화된 책이 있다. 바로 '데이터 드리븐 리포트'이다.

제목에서도 알 수 있듯이 데이터 기반 보고서라는 의미를 지닌다. 그렇다면 이 책에서는 단순히 이론적인 것만을 다룰까? 아니다. Python과 ChatGPT와 같이 핫한 기술들을 이용해 실습 과정까지 다룬다.

또한, 저자의 이력이 특이해 내 눈을 사로잡았다. 저자는 HR에 열정적인 사람인데 대학원을 듀크대를 가면서 데이터 사이언스 쪽에 커리어를 기울인 분이다. 특이하지 않는가? 역시 깊이를 팔 수 있는 역량을 가진 분이라면 다른 분야에서도 충분히 깊이를 팔 수 있다는 것을 느낀다.


이야기가 딴데로 잠시 샜는데 내용 중에 아래와 같은 부분들이 인상적이었다.

1. Comm을 하는데 철저히 데이터 관점에서 바라보지 않는다. 설득 대상에 따라 다르게 접근하는 방법을 제시한다.

2. 단순 데이터 조작 기술을 다루지 않는다. 선형회귀 분석, 워드 클라우드와 토픽 모델링 방법 등 분석 방법론도 다룬다.

3. 이론적인 소개 뿐만 아니라 실제 분석 업무에 적용할 수 있는 단계별 실습 사례를 제시한다.


이런 내용들로 하여금 기획자, 사업가, 마케터 등 다양한 분야에 있는 현대인들에게 커뮤니케이션과 공감대 형성 능력을 기르는데 도움이 될 것이다.


    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


설득하기 위한 비빌 레시피 "데이터 드리븐 리포트"

 

[도서] 데이터 드리븐 리포트

 

 

1.jpg

 

 

 

설득을 하는 과정은 생각보다 힘듭니다.

설득이란 상대방이 생각하고 있는 관점을 바꿔야 하기 때문입니다.

설득하기 위해서는 데이터를 기반으로 소통 해야 신뢰가 높아지면서 설득의 가능성이 높아 집니다. 

 

데이터 드리븐을 통해서 설득을 잘 할수있는 데이터 보고서에 접근을 해보자

 

 


▶ 데이터 드리븐 보고란?     

올바른 문제 해겨을 위한 문제 정의부터 데이터 수집, 정체 분석을 거쳐 스토리텔링과 시각화로 설득을 끌어내는 일련의 과정을 말한다.

 

 

 

 

▶ 데이터 드리븐 리포트

출처 : 책내용 일부

  • 데이터에 기반한 보고 방법
  • 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법
  • 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법
  • 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법
  • 실제 분석 업무에 적용할 수 있는 단계별 실습 사례
  • 선형회귀분석을 통한 고객 설득 방ㄷ법
  • 수치형, 범주형 데이터에 적용하는 추론과 분류예측방법
  • 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법

 

2.jpg

 

 

 

▶ 데이터 드리븐 리포트 추천 독자는?

출처 : 책내용 일부

  • 파이썬 기초 문법을 알고 데이터 분석을 해분 적 있는 직장인
  • 상사와 고객을 설득해야하는 데이터 분석가
  • 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람
  • '해봤는데 안 돼 ','예전에 검토해봤어' 등의 이유로 상사에게 거절당한 경험이 있는 사람
  • 분석 업무에 챗 GPT를 활용하고 싶은 사람
  • 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람

 

 

 

▶ 데이터 드리븐 리포트의 책구성

출처 : 책내용 일부

  1. 데이터 드리븐 보고
  2. 데이터 드리븐 보고 절차
  3. 데이터 드리븐 보고 실전 사례 WITH 챗 GPT
  4. 데이터 드리븐 커뮤니케이션

 

.

 

▶ 데이터 드리븐 리포트의 실전 예시들

출처 : 책내용 일부

  • 행복에 영양을 미치는 변수와 국가별 행복 지수 분석하기
  • 회사의 중장기 인력구조 예측, 분석, 시각화하기
  • 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기
  • 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기
  • 전 직원 대상 설물조사의 서술형 응답 분석하기

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

우선 목차 부터 확인해보자.

 


|1장 | 데이터 드리븐 보고
1.1 일상의 보고 상황
1.2 데이터 드리븐 의사결정이란
1.3 데이터 드리븐 보고란
1.4 데이터 드리븐 보고 5원칙

|2장 | 데이터 드리븐 보고 절차
2.1 데이터 드리븐 보고 전략
2.2 분석 전 알아야 하는 용어
2.3 분석 목표 설정
2.4 계획서 작성
2.5 데이터 선정
2.6 분석 방법 결정 및 해석/검증
2.7 보고 대상자에 따른 보고 방식

|3장 | 데이터 드리븐 보고 실전 사례 with 챗GPT
3.1 데이터와 친해지자: EDA & 기술통계
3.2 데이터도 백문이 불여일견: 데이터 시각화
3.3 당신의 질문에 데이터가 답한다: 가설검정
3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석
3.5 합격이냐 불합격이냐: 분류예측
3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링

|4장 | 데이터 드리븐 커뮤니케이션
4.1 데이터 드리븐 커뮤니케이션의 필요성
4.2 데이터 드리븐 커뮤니케이션 구성 요소
4.3 데이터 드리븐 커뮤니케이션 방법
4.4 스토리텔링
4.5 데이터 드리븐 커뮤니케이션 체크리스트

 

위와 같이 구성되어있다. 해당 도서를 이번에 고른 이유는 내 첫 직장에서 일일 보고 리포팅을 굉장히 자주 했었다.

 

이를 수동으로 작성하는 작업자들이 있었고 이를 자동화 하는 업무를 중점적으로 일을 시작했던 기억이 있다.

 

하지만, 의사결정권자 분들이 원했던 일일 보고 데이터들은 과연 유의미한 데이터를 보고자 했던 것일까? 이러한 의문이 들고 데이터 드리븐이라는 말을 많이 들어보았지만 정확히 어떤 의미인지 모르는 상황에 좀 흥미로운 도서가 될 것 같아서 신청했다.

 

먼저, 데이터 드리븐 보고는 확증 편향을 제거하고 데이터를 기반으로 한 의사결정을 위한 보고 체계 또는 보고 프로세스라고 설명이 나와 있다.

 

데이터 드리븐 보고의 원칙 중 가장 인상 깊었던 부분은 '설명 가능성' 부분이었다.  AI를 조금 아는 사람들은 다 알만한 사실인데, 모델을 개발하고 모델의 결과가 어떻게 이 결과를 도출했는지에 대한 해설 즉, 설명이 불가능한 점이 존재한다.

 

이를 블랙박스라 표현하고 블랙박스와 같은 부분이 존재하는 것은 지양하게 되는 것이 데이터 드리븐 보고이다. 그렇기에, 설명 불가능한 딥러닝 모델은 데이터 드리븐 보고에는 적합하지 않다고 나와있다.

 

하지만, 조금은 열려있게 생각해야 된다고 생각한다. 데이터를 기반으로 한 의사결정을 위해 보고를 진행하는 것인데, 딥러닝의 결과는 보통 의사결정을 위한 참고자료로도 많이 사용된다. 그렇기에 나는 해당 부분이 의사결정권자가 원한다면 조금은 필요한 부분이라고도 생각이 된다.

 

그리고 생각보다 리포팅에 필요한 구성요소들에 대한 설명들이 잘 나와있었다. 기본 통계적 분석부터 시작해서 EDA에 관한 부분까지 나와있고 심지어 파이썬 코드도 잘 나와있는 부분이 인상적이었다.

 

그리고 보고서를 작성하는 프로세스다 보니 설계 부터 시작해서 체계적인 리포팅이 구성된다. 그리고 챕터 3 부터는 설명가능한 ML모델링도 모델링을 모르는 사람도 가볍게 보기 좋은 느낌이다.

 

각 사례들도 나오며 최신 책이라 그런지 챗 지피티로 EDA 를 하는 방법도 나와있는게 신기했다.

참고로 나도 EDA를 챗지피티로 귀찮은 코드나 시각화 코드 같은 것을 질의하며 진행한 적이 있기에 해당 방법을 추천하는 편이다.\

 

물론, 답으로 받은 코드에 대한 해석이 가능한 능력이 되었을 때 해당 방법을 추천한다.

이유는 해당 코드가 옳고 그름을 판단할 수 있는 역량이 되어야 올바르게 사용할 수 있기 때문이다.

어떤 데이터를 기반으로 보고를 할 때 "분석"이라는 과정이 필요하다. 분석과 보고는 결코 별개의 것이 아니다. 데이터를 분석하는 것은 이를 기반으로 하고자 하는 말을 전하기 위함이다. "데이터 분석"만 있고 "보고"가 없다면 그 데이터는 가치를 온전히 발휘하지 못하고, "보고"만 있고 "데이터"가 없다면 신뢰가 떨어지며, "데이터"와 "보고"만 있고 "분석"이 없다면 내용을 이해하기 어렵다.

"데이터 드리븐 리포트", 다시 말해 "데이터 드리븐 보고"에 대해 저자는 다음과 같이 정의한다.

 

이 책에서 정의하는 '데이터 드리븐 보고'란 올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 정제, 분석을 거쳐 스토리텔링과 시각화로 설득을 이끌어내는 일련의 과정을 말한다.

 

그리고 이를 해내기 위해 알아야 할 데이터 분석 기법 선정 방법, 추론 및 분류예측 방법, 고객 설득 방법 등을 안내한다. 또한 데이터 드리븐 보고 절차를 알아본 후에 다양한 실전 사례로 실습해볼 수 있는 예제를 넣음으로써 독자가 그저 읽는 게 아니라 온전히 익힐 수 있게 돕는다. 마지막으로 단지 보고를 위한 어떤 결과물을 만드는 것뿐만 아니라 결과적으로 상사, 고객 등 누군가를 설득해서 원하는 결과를 얻어야 한다는 게 중요한데, 그 커뮤니케이션에 대해서도 다루어 데이터 드리븐 보고를 위한 모든 준비를 가능하게 한다.

데이터 분석에 필요한 내용부터 분석 후 보고에 필요한 내용까지 모든 내용을 담고 있어 한 권의 책으로 여러 방면에서 유의미한 성장을 경험할 수 있는 것 같다. 

 

데이터 분석을 하여 보고하였을 때 노력한 것에 비해 보고 대상자로부터 좋은 반응을 얻지 못했다면, 이 책을 읽으며 적절한 보고 전략을 찾아가는 것도 좋을 듯하다. 데이터 분석에 ChatGPT를 활용해보고 싶었지만 어떤 식으로 사용해야 할지 헤매고 있다면 이 책의 실습을 따라하며 감을 잡을 수 있을 것이다. 목차 구분이 안 되어 있는 전자책이라, 현재 읽고 있는 위치가 어느 정도고 앞으로 어떤 내용이 이어지는지 중간중간 확인하고 싶은 사람은 전자책보다는 종이책으로 읽는 게 좋을 것 같다.

 

 

한빛미디어 〈나는 리뷰어다〉 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

우리는 사회 생활을 하면서 다양한 사람을 설득하게됩니다.

하지만 이과정에서 경험과 직관만으론 설득할 확율은 매우 낮다고 생각된다.

저자 이상석님의 "데이터 드리븐 리포트"는 이해관계자를 설득하기 위한 데이터 분석과 보고에 대한 모든 것을 담고있다.

이 책은 비즈니스 영역에서 데이터 분석의 궁극적인 목적인 효율적인 의사결정을 내리기 위한 방법을 상세하게 제시하고있으며, 문제 해결을 위한 올바른 문제 정의부터 데이터 수집, 정제, 분석 그리고 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 능력을 키우는 방법을 제시하고 있다.

또한, 이 책은 다양한 비즈니스 사례를 바탕으로 상황별 가장 적합한 분석 기법을 어떻게 선택하는지, 방대한 양의 데이터에서 핵심 인사이트를 찾아내고 이를 설득력 있는 보고로 만들어내는 방법, 그리고 상대방이 가진 편향을 고려해 효과적으로 의사소통하는 방법까지 제시하고 있습니다.

이 책은 총 4장으로 구성되어 있습니다.

1장에서는 일상에서 데이터를 기반으로 의사결정하는 사례와 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지를 설명하고,

2장에서는 성공적인 데이터 드리븐 보고를 위한 분석 절차를 단계별로 설명합니다.

3장에서는 실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 실습을 제공하며,

4장에서는 데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내합니다.

이 책은

데이터 분석가

빅데이터 분석기사를 준비하는 사람

파이썬을 활용한 데이터 분석을 해본 적 있는 사람

데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람

다양한 상황별로 적합하고 효율적인 분석 기법을 알고 싶은 사람

분석 업무에 챗GPT를 활용할수 있도록 쉽게 설명하고있다.

이 책을 통해 독자는 데이터 분석 사고의 폭을 넓히고 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있을 것입니다.

 

[한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다]

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
데이터 드리븐 리포트
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
데이터 드리븐 리포트
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
데이터 드리븐 리포트
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 책0