데이터 드리븐 마케팅 이야기: 마케팅에서 통계가 필요한 이유 HSAD 공식 블로그 HSADzine

HSAD 공식 블로그 HSADzine

데이터 드리븐 마케팅이 화두가 되면서, 모든 의사 결정이 데이터를 기반으로 이루어지고 있습니다. 이로 인해 데이터 해석 능력의 중요성은 더욱 강조되고 있습니다. 이렇게 데이터 해석의 기반이 되는 것은 바로 통계적 지식입니다. 잘 아시겠지만, 흔히들 사용하는 ‘평균’은 가장 기초적인 통계입니다. 데이터를 해석하고 유의미한 결과를 도출하기 위해, 사실 ‘평균’ 이외에도 다양한 통계적 지식이 필요한 경우가 있습니다.

마케팅 관련 업무를 하다 보면 “광고 횟수랑 매출액이랑 상관이 있는 거야, 없는 거야?” 또는 “광고 후에 클릭 수도 증가하고 매출액도 정말로 올랐어?” 등등 마케팅 활동이 실제 매출에 어떤 영향을 미치는지에 대한 질문을 많이 접할 수 있습니다. 결과부터 말하자면 홍보 콘텐츠를 증가시키고 광고를 많이 하면 매출액은 대부분 증가합니다. 그러나 모든 사람이 정말로 궁금해하는 것은 ‘어떻게, 얼마나?’에 있습니다. 단순하게 관계성을 파악하는 것만으로는 의사 결정자를 만족시킬 수 없기 때문입니다. 위의 예시뿐만 아니라 국가 간 매출액 비교, 제품 런칭 전/후 비교, 매출 영향력 분석, 타겟 마케팅을 위한 군집화 등 수많은 마케팅 활동에 통계분석이 필요합니다.

이번 데이터 드리븐 마케팅 이야기에서는 멀고도 어렵게만 느껴지는 ‘통계’ 지식이 마케팅 분야에서 어떻게 쓰이는지, 그리고 이것이 꼭 필요한 이유는 무엇인지에 대해 살펴보겠습니다.

 

직관에서 증명으로

‘100페이지 전망 보고서’보다 직장 상사의 ‘감’이나 ‘느낌’이 더 잘 맞는 순간이 있습니다. 이러한 현상을 겪게 되면, ‘이게 정말 연륜이구나!’라고 인정할 수밖에 없게 됩니다. 이런 ‘감’이나 ‘느낌’을 좀 더 전문적인 용어로 표현하면 ‘직관’이라고 말할 수 있습니다. 직관은 경험을 기초로 합니다.

 

본인의 업무에서 오랫동안 쌓인 경험들은 특정한 기준을 만들게 되는데, 이런 하나하나의 경험들이 케이스(Case)가 되고 데이터(Data)가 됩니다. 결국 직관이라고 생각했던 것들도 결국 개개인의 ‘데이터’에 기반한 것이고, 이런 데이터를 바탕으로 머릿속에서 이루어진 통계적인 분석이 ‘직관’으로 나타나게 되는 것입니다. 과거에는 머릿속에서 이루어진 통계적인 분석을 굳이 정리하고 내놓지 않아도 의사결정을 내릴 수 있었습니다. 하지만 사회구조가 점점 더 고도화되면서, 내 생각을 밖에 꺼내 보여줘야 더 많은 사람이 믿어주는 세상이 되고 있습니다. 즉, 그 무엇인가 알 수 없이 신기하게 맞아 들어갔던 ‘직관’을 ‘눈에 보이는 통계적인 분석으로 내놓아야 하는 세상이 된 것입니다. 예전에는 ‘직관’에 의존했던 많은 업무영역이 현재는 통계분석을 통한 ‘증명’의 영역으로 이동하고 있습니다. 이것이 바로, 우리가 통계를 알아야 하는 이유입니다.

 

통계는 기술통계와 추론통계로 나누어집니다

통계는 크게 두 가지로 분류될 수 있습니다. 첫 번째로 주어진 자료를 수집하고 정리하여 도표나 수치로 요약, 정리하여 데이터의 특징이나 경향을 파악하는 ‘기술통계(Descriptive Statistics)’이고 두 번째는 수집한 데이터를 바탕으로 추론, 예측하는 ‘추론통계(Inferential Statistics)’입니다. 기술통계는 평균, 중앙값, 범위 등 데이터 자체의 속성을 ‘파악’하는 데 주안점을 두고 있습니다. 반면, 추론통계는 기술통계에서 얻어진 자료를 기초로, 전체 데이터나 미래에 일어날 일을 통계적으로 ‘추정’하는 것입니다. 예를 들어 선거 때마다 이루어지는 출구조사 결과, 지구 온난화로 북극 빙하 녹는 시기 추정 등 자료를 통해 미래를 예측하는 것들은 추론통계라고 볼 수 있습니다. 이처럼 통계는 우연에 의한 것이 아니라는 것을 증명해주고, 사실과 예측을 설명해주는 아주 좋은 도구입니다. 그렇다면 실제로 마케팅 분야에서 사용할 수 있는 기본적인 통계분석 방법에는 무엇이 있을까요?

 

참고: 기술통계와 추론통계(bit.ly/2RPyMRv)

 

마케팅 통계 분석은 ‘상관관계’로부터 시작됩니다

마케팅 분야에서 사용되는 가장 기초적인 추론 통계 분석은 ‘상관분석(Correlation Analysis)’입니다. ‘상관분석’이란 두 변수 사이의 관계가 있는지 없는지, 그리고 어느 정도 관계가 있는지를 설명하는 분석 기법입니다. 상관분석을 통해 두 변수 사이의 관계 정도를 수치로 표현할 수 있으며, 이 수치는 -1에서 1 사이의 값을 가집니다. 두 변수의 상관관계가 1에 가까울수록 관계성이 크고 0에 가까울수록 관계성이 작으며, 그 방향이 +라면 정(Positive)의 상관관계, -라면 음(Negative)의 상관관계가 있다고 할 수 있습니다. 예를 들어 TV의 광고 콘텐츠 수와 매출액의 상관관계를 분석했더니 +0.88이라는 상관계수가 나왔다고 가정합시다. 이는 광고 콘텐츠 수가 많아질수록 TV의 매출액은 증가하는 경향이 있다는 것을 의미합니다.

 

참고: 상관관계(bit.ly/3x214bz)

 

반드시 주의해야 하는 부분은 상관분석이 두 변수의 ‘관계’만을 분석하는 것이지, 두 변수 간의 인과관계를 설명하지는 못한다는 것입니다. 즉, 상관분석은 변수 간의 인과관계를 분석하기 전 실제 두 변수가 관계가 있는지 없는지를 선제적으로 분석하는 것입니다. 서론에서 설명한 것처럼 ‘어떻게, 얼마나?’를 확인하기 위해서는 또 다른 통계분석이 필요합니다.

A 회사의 매출액과 주가지수의 관계를 예를 들어 보겠습니다. 아시다시피 회사의 매출액이 높을수록 수익이 클 가능성이 크고, 수익이 클수록 해당 기업의 가치가 높아져 주가지수도 상승하게 됩니다. 이처럼 매출액과 주가지수는 상당히 높은 양(+)의 상관관계를 가지게 됩니다. 이때 매출액이 주가지수에 어떻게, 얼마나 영향을 미치는지를 살펴보는 것이 ‘회귀분석(Regression Analysis)’입니다. 회귀분석을 위해서는 독립변수와 종속변수가 필요합니다. 위의 예시에서 ‘주가지수’는 종속변수이고 ‘매출액’은 종속변수에 영향을 미치는 독립변수가 됩니다. 이렇게 종속변수와 독립변수 간의 회귀분석을 시행해, 회귀식을 산출할 수 있으며, 이 산출식을 통해 독립변수가 종속변수에 얼마나 영향을 미치는지를 추정할 수 있게 됩니다.

이에 더해, 마케팅 분야에서 빈번하게 사용되는 분석 기법 중 하나로 ‘판별분석(Discriminant Analysis)’이 있습니다. 판별이라는 용어는 말 그대로 판단하여 구별한다는 뜻으로, 개개인이 A, B, C 그룹 중 어디에 속하게 될지를 판단하는 근거로 사용됩니다.

 

예를 들어, 자동차회사에서 구매자의 연령, 가구소득 등의 데이터를 세단이나 SUV와 같은 ‘자동차 타입’별로 구축해 놓고 있다고 가정해 봅시다. 이러한 자료들을 바탕으로 새로운 고객이 등장하였을 때, 고객 데이터에 기반해 어떠한 자동차 타입을 선택할 가능성이 높다는 것을 통계적으로 추정할 수 있습니다. 판별분석은 단순히 상품의 선택뿐만 아니라 고객의 특성별 브랜드 선호도나 선거에서 정당 지지율을 예측하는 데에도 사용되고 있습니다. 또한, 이러한 판별분석을 활용할 경우 특정 고객이 A라는 상품을 선택하는 데 있어서 가장 큰 영향을 미친 변수가 무엇인지도 확인할 수 있습니다. 이렇게 고객의 특성을 분석할 수 있다면 각각의 유형에 맞는 고객을 타겟팅하여 더 효율적인 마케팅을 진행할 수 있습니다.

 

통계분석을 통한 마케팅 최적화, 효율화

통계는 분명 어렵고 전문 지식이 필요한 분야입니다. 그러나 이러한 지식은 마케팅 활동을 보다 정확하고 효율적으로 실행할 수 있게 합니다. 통계분석을 통해 내린 의사결정은 본인의 경험이나 직관에 의한 것보다 신뢰도가 높으며 시행착오를 줄일 수 있기 때문입니다. 예를 들어, 내년도의 모든 마케팅 전략을 수요 예측에 기반해 수립한다면 보다 명확한 방향성으로 효율적인 업무를 진행할 수 있습니다. 실제로, 국내 자동차 회사 A의 경우, 시계열 분석, 회귀분석, 컨조인트 분석 등 다양한 고급 통계 분석을 기반으로 자사 제품의 내년도 수요 예측을 시행하고, 이를 기반으로 제품 구성 전략, 판매 전략, 캠페인 타겟팅 및 캠페인 전략 수립 등의 마케팅 전략 전체를 수립합니다. 이러한 분석을 위해서는 올해의 신차 모델 수, 작년 자동차 수요, 타사 신차 출시 영향력, 자동차 개별소비세 인하율, 공장가동률, 소비자 지수, 금리 등의 거시적, 미시적 요인을 모두 고려합니다. 이렇게 도출된 수요 예측은 수요에 미치는 많은 변수들을 최대한 고려하기 때문에 설득력이 더 높고 불확실성을 감소시킬 수 있다는 장점이 있습니다.

지금까지 마케팅 활동에서 통계분석이 필요한 이유와 대표적인 통계분석 방법에 대해 살펴보았습니다. 급변하는 환경에서 통계 분석을 통해 마케팅 활동의 시간과 비용의 효율성을 극대화하고자 하는 시도는 계속되고 있습니다. 따라서, 통계분석의 중요성은 점차 강조되고, 그 활용 범위는 점점 더 커질 것으로 예상됩니다. 지금이라도 멀리하던 통계에 관심을 기울여야 합니다. 데이터 기반 의사결정에 통계가 항상 함께하기 때문입니다.

 

참고문헌
spss22 매뉴얼_이학식, 임지훈
사회과학을 위한 다변량자료분석_허명회

Posted by HSAD