모든 걸 데이터로 해결하려니까 안되죠

모든 걸 데이터로 해결하려니까 안되죠

  • 박경하
  • 승인 2023.05.23 00:00
  • 댓글 0
이 기사를 공유합니다

사진: Claudio Schwarz / Unsplash
사진: Claudio Schwarz / Unsplash

“차트에 없는 내용을 얘기해도 되나요?”

간혹 데이터 분석에 대해 교육을 하다 보면 종종 듣게 되는 질문이다. 수강생이 제출한 분석 결과에 대해, “이렇게도 볼 수 있지 않을까요?”, “이런 식의 해석을 덧붙여보면 어때요?”라고 피드백을 드리면, 적지 않은 분들이 “저도 생각은 했는데 꼭 맞는 데이터를 찾지 못해서..”라고 답하면서 위와 같이 덧붙인다.

그럴 때 나는 한결같이 “그럼, 데이터에 상관없이 님의 생각을 담아보세요”라고 주문한다. 데이터에서 보이지 않는 부분에 대한 ‘추정’도 적어 보라는 것이다. 심지어 ‘추정’이라는 단어가 선명하게 전달되지 못할까 봐 아예 “소설을 쓰셔도 됩니다!”라고까지 덧붙이는 편이다. ‘추정’이라는 단어의 사전적 의미는 ‘미루어 생각하여 판단한다’는 의미다.

데이터 분석의 꽃은 흔히 ‘예측’이라고들 하는데, ‘예측’은 ‘미리 짐작한다’는 의미지만, 데이터 분석에서는 유의어인 ‘관측’, 즉 ‘관찰하여 측정한다’는 의미와 닿아 있고, 이를 ‘추정’이라는 단어와 구분하자면, 개인의 ‘판단’이나 ‘의견’에만 머무는 게 아니라 이해할 만한 ‘수치’를 제시하는 걸 흔히 ‘예측’이라고 부른다. 그래서 추정은 경험과 노하우에 기반을 두지만, 예측은 통계적 산술이나 과학에 기반을 둘 때가 많다. 추정은 추측에 가깝고 예측은 측정에 가깝다. 대체로 쓰임새가 그렇다는 것이다.

조금 돌아왔지만, “차트에 없는 내용을 얘기해도 되나요?”라는 질문에, (조금 무모하게 들릴지 모르겠지만) 이렇게 답하겠다. “네, 차트에 없는 내용까지 얘기할 줄 알아야 ‘찐’이니까요.”

데이터를 분석하는 사람들이 아주 가끔 간과하는, 매우 단순한 사실 한 가지가 있다.

데이터가 “항상” 모든 상황을 규명해주지는 않는다는 것이다. 데이터는 ‘증거’라기 보다 ‘단서’에 가깝다. 데이터 분석가를 사이언티스트(Secientist)로 부른다고 해서, 스몰데이터가 빅데이터가 되었다고 해서, 엑셀로 하던 걸 코딩으로 “있어 보이게” 뽑아낸다고 해서, 단서가 갑자기 증거로 돌변할 확률은 “거의” 없다.

데이터 분석가의 역할이자 역량은, 누가 더 흩어진 파편을 잘 조합해서 유의미한 해석을 내놓는지에 있다고 나는 생각한다. 흔히 데이터를 분석한다고 하면, 몇 개의 차트를 통해 “유레카!”를 외칠 것 같지만, 현실에서 그런 일은 “거의” 일어나지 않는다. 만약 분석가가 최종 보고서에서 10개의 차트를 활용했다면, 그건 이미 적어도 20개의 차트를 보고 걸러낸 결과라고 생각해도 과언이 아닐 것이다.

한 때 데이터 드리븐 마케팅의 사례로 한창 회자하던 게, 마트에서 ‘맥주 코너 옆에 안주를 놓으면 잘 팔리더라’, 내지는 ‘맥주 코너와 기저귀 코너를 같은 동선에 두면 잘 팔리더라’ 라는 게 있다. 모두 데이터를 통해서 발견했다는 것인데, 이 경우에 사람들이 “맥주 옆에 안주를 같이 놔주세요!”라고 말했을 것 같은가? 추정컨대 전혀 그렇지 않았을 것이다. 누군가 직접 그 사실을 얘기했다면, 아마 누구나 그 사실을 쉽게 알 수 있었을 것이다. 안주가 맥주 옆이 아닌 식품 코너에 자리하고 있을 때부터 함께 비례해 잘 팔린다는 것을 누군가 발견하고, 그들이 3040대 남자라는 점을 묶어서 ‘추측’했을 것이고, 내부를 끈질기게 설득해 결국 실행에 옮겼을 것이다. 이질적이고 동떨어진 단서를 엮어서 주장에 담았을 것이다.

이런 얘기를 하면, “그건 경험과 노하우가 필요한 것 아닌가요?”라고 반문할지도 모르겠다. 그리고, “그건 지금의 우리가 할 수 있는 범위는 아니잖아요”라고 응수할지도 모르겠다. 맞다. 사실 그렇다. 데이터에 안 보이는 얘기로 누군가를 설득하려면 실력 이전에 경험과 경력이 필요하다.

그런데 이런 부분은 경험과 경력이 쌓인다고 할 수 있는 주장도 아니다. 시간이 지나면 자연스럽게 되겠지 믿고 싶겠지만, 적어도 내가 겪어본 많은 사람은 그런 경우가 드물었다. 결국 데이터에서 보이지 않는 부분에 대한 소설을 쓰는 일도, 그 주장에도 연습과 훈련이 필요하다는 걸 꼭 얘기해주고 싶다.

내 경우에는 사회에 첫발을 내디딘 지 1년여가 조금 지났을 무렵부터 전혀 데이터에 기반을 두지 않는 얼토당토않은 얘기들을 문서에 담았다. 나 역시 내 주장과 꼭 맞는 데이터를 찾지 못했기 때문이었다. 나는, 데이터가 없어서 얘기 못 하는 것보다 근거 없이 떠들다가 수긍할 때까지 혼나보자는 쪽을 택했다. 지금 이렇게 얘기하면 꽤 있어 보이는 얘기로 포장이 될지도 모르겠는데, 돌이켜보면 내 얼토당토 않은 얘기들을 참고 들어주는 선배들이 있었기 때문에 그 시간이 무탈했던 것 같다. 그래서 나는 누군가를 가르칠 때 되도록 무엇이든 주장하고 그것을 담는 연습을 해보라고 권하는 편이다. 물론 앞뒤 다르게 내가 꼰대 같은 비난을 쏟아내더라도 말이다.

마지막으로 ‘소설을 쓸 때’ 반드시 기억해야 하는 부분이 있다. 소설을 쓰려면 작가가 되어야 하고 작가라는 직업은 단 한 줄의 창작을 위해서 그 누구보다 사전 조사를 철두철미하게 하는 분들이다. 데이터로 소설을 써야 하는 우리도 그렇게 해야 한다. 데이터가 보여주는 차트에만 매달리지 말고, 또 모든 걸 차트로만 해결하려고 하지 말고 시장과 브랜드와 제품과 심지어 마케팅을 공부하는 ‘치열한 치밀함’이 필요하다. 우리가 보는 데이터가 모든 걸 해결해 줄 수 없음을 인정하고, 산재해 있는 여러 데이터를 통해 단서를 찾되 관통하는 주장을 설계해야 한다.

데이터 분석에 대한 기대는 얼마나 정교하게 분석했는지가 아니라, 분석된 결과로 어떤 이야기를 하려고 하는가에 있다는 것을 명심하자.

 


박경하 엠포스 빅데이터실 실장



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.