데이터 드리븐 마케팅 이야기: 소셜 빅데이터 분석 HSAD 공식 블로그 HSADzine

HSAD 공식 블로그 HSADzine


약 10여 년 전, 사람들이 자신의 SNS에 무수한 생활의 단면을 남기기 시작하면서 고객을 연구해야만 하는 기업들은 소셜 데이터 분석의 중요성에 주목하기 시작했습니다. 당시 빅데이터 분석이 화두가 되면서 쉽게 접근할 수 있는 소셜 빅데이터는 한때 어마어마한 인기를 누리기도 했습니다. 그러나 소셜 빅데이터를 마법 지팡이로 생각했던 사람들이 그 한계를 경험하면서, ‘광고나 이벤트 등의 가비지 데이터가 많아서 쓸모가 없다’, ‘남에게 보여주고자 하는 모습만 기록하기 때문에 실제 데이터가 아니다’ 등 소셜 데이터의 유용성에 대해 많은 의문이 제기되기 시작했습니다. 정말 소셜 데이터는 빅데이터 계의 ‘계륵’과 같은 존재일까요?


소셜 빅데이터의 의미는 대체 무엇일까?

소셜 빅데이터든 구매 빅데이터든 사실 데이터는 그냥 데이터입니다. 이름을 불러주기 전에는 꽃에 지나지 않는 것처럼 의미가 부여되지 않으면 그냥 숫자나 글자에 불과합니다. 데이터를 다루는 저와 같은 데이터 사이언티스트들은 빅데이터를 광산에 비유하곤 합니다. 수많은 다이아몬드 원석이 묻혀 있는 광산에서 원석을 평범한 돌멩이와 구분하지 못하면 다이아몬드를 캐낼 수 없는 것처럼, 빅데이터에서 인사이트를 캐내기 위해서는 다이아몬드 원석과 일반 돌을 구분할 수 있는 시각(=관점)이 필요합니다. 이것이 사실 빅데이터의 ‘본질’입니다.

소셜 빅데이터도 마찬가지여서 수많은 텍스트 데이터 더미에서 인사이트를 추출할 수 있는 시각과 이를 가공해 다이아몬드로 만들 수 있는 기술이 필요합니다. 이를 위해서는 제대로 된 키워드 설계 및 분석 툴과 방법론이 필요한데, 키워드 설계는 인사이트를 추출할 수 있는 시각이며 분석 툴과 방법론은 가공 기술에 해당합니다.

인사이트 추출의 기반이 되는 키워드 설계 능력은 도메인 지식, 고객 분석 경험치, 실제 고객의 표현 언어에 대한 지식, 행간의 의미를 읽어내는 능력, 동시대의 사회 현상에 대한 이해력 등을 필요조건으로 합니다. 고객들이 실제로 사용하는 언어가 어떤 것인지 알고 있어야 하고, 분석 주제와 관련 없는 키워드는 어떤 것이 있는지 알아야 다이아몬드 원석을 찾아낼 수 있다는 뜻입니다. 더불어 분석 툴의 대시보드에서 제공하는 것 이외의 분석 방법론을 적용할 수 있어야 남들과 차별화된 세공을 할 수 있습니다. 이렇게 심층적인 분석 시각과 차별화된 분석 방법론을 간과한 채, 소셜 분석을 하게 되면 정말 아무것도 얻을 수 없습니다.

기존에 소셜 빅데이터 분석에서 이러한 실패를 경험한 사람들은 소셜 데이터보다 구매 데이터나 로그 데이터 등 직접적인 고객 행동 데이터를 더 중요하게 생각하기 시작했습니다. 물론 이러한 고객 행동 데이터는 정말 중요합니다. 그러나 고객 행동 데이터만으로는 실제 고객 행동의 이유 및 동기, 내재된 가치, 그리고 우리 브랜드에 대한 일반 고객들의 감정과 느낌, 경쟁 브랜드와 비교한 이미지 등을 확인하기는 어렵습니다. 그렇기 때문에 최근에는 소셜 빅데이터와 행동 데이터를 통합해 분석하는 것이 트렌드로 자리 잡고 있습니다. 이렇게 고객 행동 데이터를 보완할 수 있는 소셜 빅데이터는 정말 마법 지팡이가 될 수 있을까요?


소셜 빅데이터 분석에 대한 오해와 진실

사실, 소셜 빅데이터는 쉽게 얻을 수 있고 사용성이 뛰어난 분석 툴이 다양하게 존재하고 있기 때문에 초보자도 누구나 손쉽게 분석할 수 있다고 여겨집니다. 여기에서부터 비극은 시작됩니다. 분석하고 싶은 키워드를 분석 툴에 입력하면 뚝딱하고 인사이트가 나와야 되는데, 키워드랑 상관없는 얘기나 다 알고 있는 얘기만 잔뜩 나오니까요.


앞에서도 언급했지만 문제는 키워드 설계입니다. 키워드를 제대로 설계해서 입력하지 않으면, ‘가비지인 가비지아웃’ 현상이 발생합니다. 그래서 모든 상용 분석 툴들은 분석 주제와 관련 없는 데이터를 걸러낼 수 있도록 ‘제외 키워드’를 설정하게 되어 있습니다. 하나의 분석 주제에 대한 이러한 ‘제외 키워드 셋(=해당 분석 주제와 연관되는 제외 키워드들의 목록)’은 2,000자도 훨씬 넘는 경우가 다수입니다. 이러한 ‘제외 키워드 셋’은 소셜 빅데이터 분석가나 분석 회사의 축적된 지식이 되어야 하고 정기적으로 업데이트되어야 합니다. 이렇게 정교하게 키워드를 설계하면, 그 많던 광고나 가비지 데이터를 걸러내고 순수한 분석 대상 데이터(=Organic Data)를 확보할 수 있습니다.

이러한 데이터로 분석한 결과물은 항상 만족할 만한 것은 아닙니다. 왜냐하면 이미 다 알고 있는 얘기가 많다고 느껴지기 때문입니다. 사람들이 주변에서 일반적으로 많이 하는 얘기들이 큰 비중을 차지하는 담론이 되는 것이 너무도 당연하기 때문에 이런 현상이 나타납니다. 그래서 상위에 나타나는 담론의 순위 및 그 변화에 대한 고찰과 소수지만 비중이 급격히 증가하고 있는 담론에 주목하는 것이 중요합니다. 그리고 가끔 본인의 상식과 다르게 특이한 담론이 상위를 차지하는 경우에도 분석이 잘못된 것 같다는 의심을 하지 않아야 합니다.

소셜 데이터를 통해 고객의 마음을 읽을 수 있기 때문에, 설문 조사를 대체할 수 있다고 믿는 사람들도 있습니다. 그러나 소셜 데이터는 고객 설문조사의 대체재가 아니라 보완재입니다. 소셜 빅데이터를 분석하는 관점은 기존 설문 조사의 관점과 다르기 때문이죠. 고객 설문 조사가 ‘구조적’이라면 소셜 빅데이터는 ‘탐색적’입니다. 고객이 정해진 보기에서 선택하게 하는 것이 아니라 고객을 관찰하는 것입니다. 관찰은 상상하지 못했던 결과를 가져다주기도 합니다. 일례로 고객들은 우리가 경쟁상대로 삼고 있는 브랜드와 전혀 다른 브랜드를 우리의 경쟁상대로 여기기도 합니다. 설문조사의 보기에 포함되지 않던 경쟁 브랜드가 소셜 데이터를 통해 우리의 경쟁상대인 것이 드러나기도 하는 것입니다.


혹자는 소셜 데이터는 ‘남에게 보여주고 싶은 모습만 기록하기 때문에 실제 데이터와 거리가 있다’라고 말하기도 합니다. 일상이 아니라 주로 일탈이 기록되기 때문입니다. 하지만 소셜 데이터는 채널 별로 조금은 다른 특성을 보입니다. 일례로, 인스타그램은 대부분 남에게 보여주고 싶은 모습이 주로 기록되기 때문에 고객 욕망의 집합체라고 할 수 있습니다. 기업 입장에서 고객의 욕망과 그 변화를 잘 캐치하는 것은 정말 중요하며, 이를 위해서는 인스타그램을 잘 분석하면 됩니다. 반면, 브랜드나 제품에 대한 살아 있는 의견이나 라이프로그 등은 블로그나 커뮤니티, 쇼핑몰 리뷰 등에 잘 드러나는데요. 물론 이때도 돈 받고 게재된 게시글은 잘 걸러내고 봐야 합니다. 그리고 사회 인식이나 트렌드 변화는 트위터와 커뮤니티에서 잘 드러납니다.

또 어떤 사람들은 SNS에 글을 올리는 고객이 대부분 젊은 층이기 때문에 우리의 타깃 고객이 아니라고 얘기하기도 합니다. 사실 꼭 그렇지는 않습니다. 주로 사용하는 채널이 다를 뿐, 전 연령대가 소셜 채널을 이용하고 있습니다. 커뮤니티나 뉴스 기사 댓글을 이용하는 중장년층이 많음을 상기해보면 금세 이해할 수 있습니다. 때문에, 분석 주제에 따라 담론이 발현되는 채널의 비중이 전혀 달라집니다. 연예인 얘기는 트위터에 많지만 골프 얘기는 트위터에서 전혀 나오지 않고 커뮤니티에 많습니다.


기업은 소셜 빅데이터를 어떻게 활용하고 있을까?

소셜 빅데이터는 제대로 잘 활용하면 리얼타임으로 고객의 실제 이야기를 들을 수 있기 때문에 기업 입장에서는 정말 매력적인 데이터입니다. 최근 기업들은 자사 전용 분석 툴을 구축하거나, 상용 분석 툴 및 전문 가이드를 통해 소셜 빅데이터에서 수많은 인사이트를 발굴해 현업에 적용하고 있습니다. 예를 들어, SNS에서 화제가 되는 제품을 실제로 자사 상품화하거나 인기몰이를 하는 제품들의 특징을 분석해 신제품 개발에 반영하기도 합니다. 또한 SNS에서 이슈 몰이를 하는 콘텐츠나 밈(meme)의 속성을 분석하고 신규 커뮤니케이션 콘텐츠 제작에 적용해 성과를 거두기도 합니다.


이렇게 단순한 SNS 인기 제품이나 인기 콘텐츠 분석뿐만 아니라, 과거로부터 현재까지 이어지는 트렌드의 변화도 읽어낼 수 있습니다. 과거 데이터가 축적되어 있기 때문인데, 이는 설문조사로는 실행하기 어려운 분석과제 중 하나입니다. 예를 들어, 약 2년간의 가공유와 관련한 담론의 변화를 추적해, 최근 비중이 증가하고 있는 담론이 채식 및 친환경과 관련된 것임을 밝혀낼 수 있습니다. 그리고 우리 브랜드가 가공유 카테고리에서 고객의 고려상표군(Consideration Set)에 들어 있는지, 순위는 어떤지 등도 확인할 수 있습니다.

브랜드와 관련해서는 긍정 언급량 및 변화 추이뿐만 아니라, 자사 브랜드 소비자들이 가장 많이 언급하는 단어를 통해 고객에게 인지되고 있는 자사 브랜드 이미지(Perceived Brand Image)가 무엇인지도 확인할 수 있습니다. 이는 설문조사를 통해 보기의 단어 중에서 고르는 이미지가 아니라 고객의 날것의 언어에 드러난 이미지라는 측면에서 의미가 있습니다. 이에 더해, 경쟁 브랜드의 이미지도 확인할 수 있습니다. 사실 우리 브랜드와 자주 비교되는 브랜드가 무엇인지에 따라 경쟁 브랜드 자체를 새롭게 정의할 수도 있습니다.


더불어, 우리 브랜드를 구매한 소비자들을 프로파일링할 수도 있습니다. 우리 브랜드를 구매한 소비자가 자주 이용하는 카페 브랜드는 어디인지, 자주 가는 장소는 어디인지도 확인할 수 있는 것이죠. 이에 더해, 어떤 라이프스타일을 즐기는 사람들인지, 어떤 가치를 중시하는 지도 파악할 수 있습니다.

이 외에도 마케팅 실행 시점 전후의 브랜드 호감도 및 이미지 변화도 분석할 수 있습니다. 비슷한 맥락에서 특정 부정 이슈 발생 시점 전후의 여론 변화를 분석할 수도 있고, 부정 이슈가 브랜드에 미치는 영향이 어느 정도인지도 분석 가능합니다. 부정 이슈에 대한 실시간 관리도 가능합니다. 부정 이슈가 발생했을 때 시스템을 통한 실시간 알람 서비스로 즉각적인 대처를 할 수 있고, 빅마우스를 식별해 특별 관리를 실행할 수도 있습니다. 일례로, 한 치킨 회사에서는 새로 출시한 소스에 대해 부정적인 반응이 주를 이루자 이를 즉각 반영해 기존 소스로 다시 변경하기도 했습니다. 이 과정에서 부정적 의견을 다수 게시했던 소비자들에게 특별 키트를 제공해 브랜드 옹호자로 변화시키기도 했습니다.


이처럼 현재 활발히 활용되고 있는 소셜 빅데이터의 데이터 드리븐 마케팅에서의 역할은 무엇일까요? 모든 데이터 중에서 주인공을 차지하는 존재일까요? 아니면 계륵과 같은 존재일까요? 사실 소셜 빅데이터는 마법 지팡이도 정답도 아닙니다. 그렇다고 고객 행동 데이터가 정답도 아니죠. 우리가 분석할 수 있는 모든 데이터의 조각을 맞춰야 고객을 겨우 이해할 수 있습니다. 중요한 것은 소셜 빅데이터든 고객 행동 데이터든 비즈니스의 핵심에 대해 객관적이고 종합적인 통찰을 줄 수 있는 적절한 데이터를 찾는 것일 텐데요. 이를 위해, 여러 종류의 데이터들을 창의적인 시각으로 바라보고 해석할 수 있는 관점을 길러야 합니다. 데이터 사이언스는 과학과 인문학의 교집합입니다.


Posted by HSAD