본문 바로가기

DATA SCIENCE/Review

Monthly Book Review 01 : 데이터 분석가의 숫자유감

골든래빗 출판사로부터 책을 제공받아 작성했습니다.

 

https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=276662690 

 

데이터 분석가의 숫자유감

직장에서 흔히 발생하는, 데이터를 오해하면서 일어나는 에피소드를 만화와 글로 담았다. 그래서 재미도 있고 지식도 있다. 인과관계와 상관관계, A / B 테스트, 평균값 등 데이터 시대에 직장인

www.aladin.co.kr

 

00. 리뷰 요약

- 디지털 마케팅 or 데이터 분석가의 역할과 업무에 대해 궁금한 사람에게 추천, 만화의 형태로 아주 쉽게 이해가능하다.

- 아래에서 볼 수 있듯 실제 책 소개에서도 2시간만에 300페이지에 해당하는 내용을 파악할 수 있다고 하는데, 나는 출퇴근 시간에 지하철에서 읽다보니 약 4~5일 정도 걸린 것 같다. 아무래도 만화 형식이라 틈틈히 보기에 부담스럽지 않아 좋았던 듯.

출처 : 알라딘

01. 추천하는 대상

- 디지털 마케팅, 빅데이터 마케팅을 배워보고 싶은 학생

- 디지털 트랜스포메이션에 발맞춰가고 싶은 직장인

- 책에서 소개하는 내용 자체가 어렵거나 무겁지는 않다. 그보다는 통계학, 데이터를 어떻게 마케팅에 접목시키는지를 누구에게나 쉽게 설명할 수 있는 책에 가깝다. 통계에 대한 지식이 없어도, 데이터라는 말을 들어보기만 한 사람이어도 쉽게 읽고, 이해하고 관심을 가져볼 수 있는 책.(물론 여기 나오는 내용을 등장인물처럼 비즈니스 영역에 잘 적용할 수 있느냐 여부는 또 다른 문제.)

 

 

02. 책의 구성

- 만화의 형태 + 이론 설명

- 이 책의 구성과 가장 유사하다 느낀 것은 어릴 적 읽었던 '~에서 살아남기' 시리즈. 실제 있을법한(조금은 판타지적인) 인물들이 등장하고, 그들이 겪어나가는 실사례를 보여주고, 그것을 기반으로 설명하고자 하는 것들을 전개해나가며, 마지막에는 몇 장의 간단한 요약정리로 해당 이론 부분을 간단히 이해하고 공부할 수 있는 구성.

- 또 마지막에는 앞에서 제시했던 여러 통계적 개념들이 총정리되어 제시되고 있음.

 

 

03. 책의 내용

- 책의 내용은 크게 두 가지로 구성. 하나는 통계학적/데이터적 개념과 같은 이론에 관한 것이고, 또 하나는 비즈니스 영역의 실무에 관한 것. 이러한 내용은 알고 싶다고 해도 검색해서 쉽게 나오지 않는만큼 '디지털 마케팅은 무엇인지?', '실제 통계학적/데이터적 내용을 실무에 어떻게 응용하는지?'에 대한 답을 얻기에 좋은 교보재 역할을 할 것으로 기대된다.

- 책에서 다루는 내용은 위의 목차 일부에서 확인할 수 있듯, 디지털 마케터로서 혹은 그에 대해 알고자하는 사람으로서 하나라도 몰라선 안되는 내용들이다. 상관관계/인과관계, MAU, 숫자 해석, 확률/분포, 조건부확률 등 경영대에서 부분적으로 배웠던 것들, 그리고 데이터 과학자로서 공부한 것들이 쉽게 정리되어 읽힌다.

- 실제로 데이터 분석가로서의 전향 혹은 취직을 바라는 사람이라면 A/B 테스트, cohort, funnel과 같은 말을 들어본 적은 있을 것이다. 만약 당신이 그에 대해 들어만 봤을뿐, 그 개념에 대해 알지 못한다면 이 기회에 그 첫 발자국을 떼보는 것도 좋을 것이다.

- 예를 들어보자. 조건부확률을 실 업무 영역에 어떻게 적용할 수 있을까? 이 책에서는 커머스 영역에서 쿠폰을 배포했을 때의 사례를 제시한다. 특정 상품에 대한 쿠폰 이벤트를 실시했고, 총 350명이 구입을 했다. 이 중 일반 이용자는 200명이었고, 쿠폰 사용자는 150명이었다. 이 상황에 대해 쿠폰 이벤트는 유의미한 이벤트였을까?

- 정답은 '알 수 없다'이다. 위의 내용은 결과만을 기준으로 마케팅 효과를 분석하고자 하는데, 이는 무척이나 고전적인 방식이며 데이터 분석과는 거리가 멀다. 제대로 된 데이터 분석을 위해서는 사람들의 유입이 어떻게 이루어졌는지 Google Analytics 등을 통한 funnel 분석이 동반되어야 한다. 즉 다음과 같아야 한다.

평균 1,000명의 인원이 매일 유입되고, 그 중에 500명이 해당 상품을 봤으며, 200명이 실제 구입을 했다. 반면 쿠폰을 배포한 300명의 인원 중, 250명이 유입되어 해당 상품을 봤으며, 150명이 상품을 구입했다. 조건부확률을 고려하지 않고무작정 결과만 보자면 일반 유입으로는 200명이, 쿠폰 배포로는 150명이 실제 행동으로까지 이어졌으므로, 쿠폰 배포의 효과가 크지 않다라고 판단할 수 있다(실제로는 해당 마케팅의 목적에 따라 다르게 판단할 수도 있다). 하지만 조건부확률을 통해 계산해보면 일반 유입 인원 중 50%가 상품을 확인하고자 들어왔으며, 20%가 실제 구입으로까지 이어졌다.

- 반면 쿠폰 배포자의 경우 무려 83%에 해당하는 인원이 유입되어 상품을 확인했고, 50%가 실제 구입으로까지 이어졌다. 이를 표로 정리해보면 다음과 같다.

비고 일반 유저 쿠폰 유저
홈페이지 방문 1,000 300
상품 확인 500(50%) 250(83%)
상품 구매 200(20%) 150(50%)

- 디지털 마케팅의 모든 과정과 전략은 평가되어야 한다. 그렇기 때문에 데이터 분석가로서의 자질은 얼마나 파격적인 전략을 제시할 수 있는가보다는, 실수없이 올바르게 전략을 평가할 수 있는가에 가까울 것이다(적어도 신입, 낮은 연차에서는 그렇게 보인다). 그런 의미에서 위의 내용을 실제 등장인물들 간의 티키타카를 통해 재밌게 보여주고, 쉽게 이해시키며, 이론적인 내용을 함께 담고 있는 이 책은 제법 매력적이다.

 

 

04. 아쉬운 점

- 이건 엄밀히 말해 책에 대해 아쉬운 점은 아니다. 내가 이 책이 타겟으로 하는 대상과 조금 다르기에, 기존에 디지털 마케팅에 대한 경험, 지식이 있는 사람일지라도 더 배울만한, 혹은 보다 어려운 내용까지도 함의하지 못한 것이 조금 아쉬울 뿐. 만약 이 책이 시리즈로서 레벨별로 내용이 제시될 수 있다면 그 또한 사서볼 정도로 매력적이다.

- 때문에 나와 같이 이미 디지털 마케터/데이터 분석가로서의 경험이 있는 사람이라면 이 책의 컨텐츠를 온전히 즐기기는 어려울 것이다. 이 책은 굳이 표현하자면, 비전공자/무경험자/초보자를 위한 책이고, 그 이상의 수준을 가진 사람들에겐 조금 아쉬울지도 모른다.(그 경계에 있는 나같은 사람에겐 리마인드 목적으로서 유용하긴 하다)