Newsletter
더 나은 의사결정을 위한 데이터 마인드 기르기
등록일 2024-03-28
디지털 전환시대 조직의 주요 의사결정은 이제 개인의 경험적 판단이 아닌 데이터를 기반으로 이루어지고 있습니다. 구성원에게 요구되는 디지털 역량도 데이터를 잘 수집하는 것이 아닌, 데이터를 통해 세상을 이해하고 문제를 해결할 수 있는 '데이터 마인드'로 옮겨지고 있습니다.
이번 뉴스레터에는 데이터 활용 역량을 키우는 시작단계인 ‘데이터 마인드’에 대해 알아봅니다.
U:s letter 목차
1. 데이터는 기술이 아닌 마인드
2. 데이터 리터러시
3. 데이터 분석의 복병, 통계 이해하기
4. 셀프 데이터 분석
5. 데이터 기반 의사결정
6. 데이터 마인드
1. 데이터는 기술이 아닌 마인드
"앞으로는 석유나 금이 아닌 데이터가 지구 상에서 가장 값진 자신이 될 것”
– 트렌드 분석가 mark penn -
•문제를 정확히 인식하고 올바른 의사결정을 하는 것
데이터는
어떤 현상의 단면을 포착하여 수치화 혹은 기호화 하는 것을 말합니다. 좋은 데이터를 수집하고 분석하여
신뢰할 수 있는 결과를 도출할 수 있습니다. 이 때 데이터의 양은 별로 중요하지 않습니다. 의사결정에 도움이 되는 것이 중요합니다. 문제를 정의하고, 좋은 데이터를 수집하고, 분석하는 절차, 이것을 가능하게 하는 힘이 바로 “데이터 마인드”입니다. 데이터를 다룰 줄 알면 누구나 지금의 시대를 ‘현명하게’ 살아갈 수 있습니다. 여기서
현명(賢明)하다는 것은 문제를 정확히 인식하고 적절하게 의사결정 하는 것을 뜻합니다.
데이터
마인드를 기르는 가장 빠른 방법은 스스로 분석 경험을 많이 쌓는 것입니다. 운전
연습을 많이 하면 할수록 운전 실력이 향상되듯, 운전면허증만 있으면 모두가 운전할 수 있듯, 컴퓨터만 있다면 모두가 데이터를 분석할 수 있습니다. 데이터 마인드를
기르기 위해서는 생각하고, 생각하고 또 생각해야 합니다. 그리고
연습하고, 연습하고 또 연습해야 합니다.
2. 데이터 리터러시
"데이터를 읽고 쓸 줄 아는 능력 + 데이터를
다루는 능력”
•데이터 리터러시와 데이터 마인드
데이터를
다루는 것은 이제 선택이 아닌 필수가 되었습니다. 데이터를 읽고 쓸 줄 아는 능력을 ‘데이터 리터러시’라고 합니다. 문맥상으론
문해력을 뜻하지만, 뉘앙스가 읽고 쓰고 이해하는 범주로 제한되는 느낌이 있습니다. 그래서 데이터를 전반적으로 다룬다는 넓은 의미인 ‘데이터 리터러시’가 보다 적합합니다. 그리고, 데이터
리터러시를 포함, 데이터로 현상을 이해하고 문제를 해결하고 의사결정하는 과정 전체를 총괄하는 사고력을
‘데이터 마인드’라고 정의합니다.
•데이터 활용하기 위해 먼저 해야 할 것
데이터를 본다는 것은 무엇일까요? 나태주 시인의 “자세히 보아야 예쁘다”라는 말처럼, 무언가에 관심을 가지고 유심히 들여다보면 비로소 보이는 것이 있습니다. 자세히 본다는 것은 세심하게 관찰한다는 의미입니다. 관심을 갖게 되면 관찰하게 되고 관찰하게 되면 관계를 맺게 됩니다. 그러다 어느 순간 나만의 관점이 생기며 통찰에 이르게 됩니다.
모두가 데이터 분석가가 될 필요는 없습니다. 다만, 데이터를 활용하기 위해 무엇을 보아야 하는지, 즉 데이터를 통해 무엇을 할 것인가를 정하는 것입니다. 데이터로 새로운 비즈니스를 만들 수도 있고, 삶의 방향을 바꿀 수도 있습니다. 디지털 기반의 시대를 살아가는 우리는 데이터를 활용하는 사람과 그렇지 않은 사람으로 구분되어 있습니다. 살아남기 위해서는 데이터 마인드가 필요합니다. 하지만 두려워 할 필요는 없습니다. 데이터 과학자 수준이 아닌, 나의 의사결정을 도와주는 데이터 증거 확보라는 차원에서 작게 시작하면 됩니다.
따라서, 작은 문제에서 시작하여 데이터의 범위와 문제의 수준을 올리는 방식으로 알아나가면 됩니다. 해결해야 할 문제를 정의하고, 필요한 데이터가 무엇인지 결정하고, 어떤 식으로 수집할 것인지 파악하고, 수집 후 적절한 방법으로 분석하고, 의사결정에 활용하는 것까지, 시작은 나만의 관점을 만드는 것, 데이터의 주인이 되는 것에서 출발합니다.
•문제 정의가 먼저
데이터와 데이터 분석이 필요한 이유는
우리가 가지고 있는 어떤 문제를 해결하기 위한 것이지, 분석 그 자체를 위한 것이 아닙니다. 중요한 것은 데이터에 앞서 ‘해결해야 할 문제(또는 과제)’입니다. 문제가 무엇인지 정의하는 것이 선행되어야 합니다.
당면한 현업에 부딪혔을 때 핵심이 무엇이고 무엇으로부터 모든 것이 파생되는지부터 이해하는 것이 중요합니다. 풀어야 할 어떤 문제가 있다면 이 문제를 해결할 수 있는 데이터는 따로 있습니다. 구매 이력이나 고객 행동 데이터처럼 실시간으로 자동으로 수집되는 것도 있으며, 이런 데이터를 활용해 구매 확률을 계산해 낼 수도 있습니다. 물론 내가 풀고자 하는 문제와 연관이 있어야 합니다.
데이터가 있어 분석하는 것이 아니라, 비즈니스 문제를 해결하는데 필요한 데이터를 수집하고 분석한다는 사실을 잊어서는 안됩니다. 데이터 기반 의사결정을 위한 프로세서를 정리하자면 위 그림과 같습니다. 문제 정의가 데이터보다 앞에, 그리고 위에 위치한다는 사실에 유의하세요.
기업의 입장에선, 데이터를 보고도 현실을 제대로
읽어내지 못하고 의미를 파악하지 못한다면 손해는 불가피합니다. 그리고 조직 내 협업에서도 문제가 발생합니다. 데이터는 잘못을 범하지 않습니다. 현업 당사자가 자신도 모르게 잘못을
범하게 되는 것이죠. 데이터 과학자도 리서치 전문가도 아닌 일반 직원들이 올바르게 데이터를 읽고(이해하고) 의사결정할 수 있어야 진정한 데이터 활용이 될 수 있으며, 데이터 활용 기업이 되는 것입니다.
•스몰 데이터와 스몰 마이닝
빅데이터는 데이터의 양이 대규모이고, 종류가 다양하고, 실시간으로 수집할 수 있다는 특징이 있는 반면, 스몰데이터는 몸짓, 습관, 호감, 비호감, 말설임, 말투, 장식, 암호 등 한사람의 행동을 관찰하거나, 인터뷰나 설문조사처럼 짧은 시간에 데이터를 수집할 수 있습니다. 이러한 스몰 데이터로 변화를 감지하고 혁신과 가치를 충분히 만들어 낼 수 있으며 사업을 시작한다면, 이런 스몰데이터를 기반으로 사업을 시작하는 것이 효율적일 수도 있습니다.
예) 레고의 어린이 고객 인터뷰를
통해 매출 상승을 일으킨 사례 - 마틴 린드스트롬 <스몰데이터>
예) 삼성냉장고 설문조사를 통해
냉동고가 아래에 위치한 냉장고를 만들어 매출 상승을 일으킨 사례
스몰데이터에서 시장의 변화를 읽어낼 단서를 찾고 이를 통해 새로운 의미를 통찰하는 분석법을 스몰 마이닝이라고 합니다. 스몰 마이닝은 사업과 마케팅의 근간이 되는 잠재적이고 표현되지 않은 욕구를 발견하고, 이를 기반으로 제품이나 서비스를 혁신하고자 할 때 또는 새로운 제품이나 서비스를 개발하고자 할 때 유용하게 쓸 수 있는 방법입니다.
이러한 분석과 기획, 통찰을 바탕으로 콘셉트를 정리했다면 이젠 실행입니다. 신제품을 내놓든 기존 제품을 개선하든 무언가를 내놓아야 합니다. 실행으로
옮겨지지 않으면 아무리 분석한들 쓸 데가 없습니다. 레고의 위기 극복이나 삼성전자의 냉장고 혁신은 고객의
고통을 파악하고 이를 아이디어 삼아 새로운 제품을 내놓았습니다.
•쉽게 접근하는 데이터 활용 능력
설문조사 :
구글에서 제공하는 문서 양식으로 설문지를 만들어 문자로 소셜 미디어에서 응답 요청하기
통계분석 :
설문 데이터를 엑셀로 저장하여 엑셀 데이터 분석 메뉴 또는 KESS 프로그램 활용
시각화 :
엑셀 피벗테이블과 피벗차트, MS 파워 BI를
이용하여 그래프나 도표 등으로 시각화하기
트렌드 분석 :
최근 트렌드(시간별, 지역별, 관련 키워드, 검색어 등)를
알기 위해 구글 트렌드 분석을 활용
파이선 :
데이터 분석과 모델링을 다루는 통계학부터 딥러닝과 인공지능을 활용하는 곳까지 다양한 사용
R1 : 통계 계산과
그래픽을 위한 프로그래밍 언어이자 오픈소스 소프트웨어. 데이터 가공,
분석, 시각화가 용이하고 데이터 마이닝, 기계학습
분야를 위한 최신 이론들도 패키지로 제공되어 활용도가 높음
•나의 데이터 리터러시 역량 자가진단
총 15문항으로 간단하게 나의 데이터 리터러시를 진단할 수 있습니다. 나의 데이터 리터러시 역량을 간단하게 체크해 보고 바로 점수 확인을 통해 역량 수준을 확인해 보세요.
3. 데이터 분석의 복병, 통계 이해하기
"통계학을 몰라도 데이터 분석은 할 수 있습니다. 그리고, 통계를 이해하면 분석 결과를 좀 더 깊이 있게 추론할 수 있습니다.”
•기술통계와 추론통계
통계에는 변수의 특성과 분포를 파악할 수 있는 기술통계와 모집단으로부터 추출한 표본의 통계량을
이용하여 모집단의 모수(母數)를 추정하거나 모수에 대한 가설을 검정하는 추론통계가 있습니다.
-기술통계 :
특정 변수에 대한 분포를 알아보는 것으로 모든 분석에서 가장 기본적인 분석입니다. 수집된
데이터를 요약하고 설명하는 방식으로 평균값, 중앙값, 최빈값, 표준편차와 같은 요약 통계를 제공합니다.
사례) 학교 시험 점수 데이터를 분석하여 학생들의 성적 분포와 성적의 전반적인 경향 파악
-추론통계 :
표본 데이터를 사용하여 모집단에 대한 결론을 도출하는 분석입니다. 이 분석기법은
모집단의 매개변수에 대한 추정치를 제공하거나, 가설 검증을 통해 특정 가설이 통계적으로 유의한지를 판단합니다.
사례) 고객만족도
평가를 위해 무작위 설문조사 데이터를 분석하여 전체 고객집단의 만족도 파악
•인과관계와 상관관계 그리고 회귀분석
-인과관계 :
원인과 결과의 관계로 원인이 선행되고 그에 따라 결과가 나타나는 관계입니다. 인과관계를
입증하기 위해서는 단순히 두 변수 사이의 관계를 관찰하는 것을 넘어, 원인이 결과를 어떻게 변화시키는지를
실증적으로 증명해야 합니다. 실험 및 시계열로 데이터를 분석하고 회귀분석으로 파악합니다.
사례) 흡연과 폐암 사이에는 인과관계가 있습니다. 연구를 통해 흡연이 폐암
발병률을 증가시키는 주요 원인 중 하나임이 밝혀졌습니다.
-상관관계 :
두 변수 중에 어떤 변수가 원인이고 어떤 변수가 결과인지 알 수 없지만 두 변수 간에 어떤 관계가 있음을 말합니다. 상관관계의 정도는 -1에서 1사이의
상관계수로 표현되며, 이는 변수 간의 관계의 방향성과 강도를 나타냅니다. 회귀분석을 통해 상관관계를 분석하고 변수들 사이 관계를 수량화 합니다.
사례) 기온과 아이스크림 판매량에는 상관관계가 있습니다. 직접적인 연관성은
없지만, 기온이 상승하면 아이스크림 판매량도 증가하는 경향이 있습니다.
-회귀분석 :
변수 사이의 관계를 모델링하고 예측하는 통계방법입니다. 회귀분석을 통해 변수 사이의
관계의 강도와 방향을 추정할 수 있으며, 특히 인과관계를 가정하고 있는 경우 그 영향력을 분석할 수
있습니다.
4. 셀프 데이터 분석
"데이터 분석은 요리와 비슷하다. 신선한 식재료를 구하고 적절한 조리 도구를 사용할 때 맛있는 음식이 된다. 물론 식재료를 구입하기 전에 무슨 요리를 할지 정한다”
•데이터 분석 수준은 어디까지 갖추어야 하나?
첫번째, 문제의 중요도 인식을 위한 분석으로 탐색 혹은 기술 분석입니다. 어떤 문제가 일어났는지 혹은 왜 일어났는지 또는 일어날 것인지, 그리고 그 문제가 정말 살펴보아야 할 문제인지 탐구하는 단계입니다.
두번째, 문제 전개 과정의 규명으로 인과 혹은 예측 분석입니다. 왜 그리고 어떻게 문제가 일어났는지 혹은 일어나고 있는지, 일어날 것인지, 인과는 어떻게 되는지 파악하는 단계입니다.
세번째, 문제 처리 방안의 도출을 위한 분석으로 최적 혹은 처방 분석입니다. 어떻게 문제를 변화시킬 것인지, 원하는 결과로 변화시키는 조건 혹은 조치는 무엇인지 밝히는 단계입니다.
위 세단계를 기준으로, 현업 실무자는 최소한 첫번째
탐색 혹은 기술 분석까지는 할 수 있어야 합니다. 그리고
두번째 수준인 인과 혹은 예측 분석도 할 수 있도록 노력하면 좋습니다. 엑셀이나 무료 빅데이터 분석
플랫폼 등을 활용하여 셀프 분석할 수 있도록 합니다.
•목적에 맞는 분석 도구
검색 플랫폼에서 제공하는 데이터 분석 도구를 활용하여 분석. 현업
실무자로써 데이터 분석을 하고자 한다면 먼저 엑셀과 빅데이터 분석 플랫폼으로 시각화하여 그 다음 SPSS와
같은 통계 패키지를 이용하는 방향으로 나아간다면 효과적임.
빅카인즈 :
뉴스 검색, 연관어 분석 등 다양한 빅데이터 분석을 쉽게 할 수 있고 분석 데이터를
다운받아 텍스트마이닝 기법을 활용해 키워드 빈도와 연관어를 분석
SPSS : 그래픽 유저
인터페이스로 되어 있으며 약간의 학습 이후 사용가능. 엑셀과 같은 메뉴 구조로 익숙하며 통계분석, 데이터 마이닝 가능
R : 통계분석과
그래픽을 위한 프로그래밍 언어이자 다양한 패키지의 집합으로 구성된 데이터 분석 도구로 통계와 프로그래밍 지식이 필요
Python : 보다 빠르게
작업하고 시스템을 보다 효과적으로 통합할 수 있는 프로그래밍 언어이며 개발에 특화된 도구
RapidMiner : 드래그 앤
드롭만으로 프로그래밍 없이 분류와 패턴 발견 등의 복잡한 분석이 가능하며 초보부터 전문 분석가까지 이용할 수 있는 데이터분석플랫폼
PowerBI : 비즈니스 인텔리전스를
위한 대시보드이자 데이터를 수집 처리하여 도식화하는 도구로 아이디어를 탐구하고 정보를 전달할 수 있는 빠르고 효과적인 방법
5. 데이터 기반 의사결정
"모든 것이 데이터이다. 모든 새로운 데이터가 사람들의 거짓말을 꿰뚫어 볼 수 있다”
디지털 트랜스포메이션은
거부할 수 없는 거대한 흐름입니다. 비즈니스와 디지털 기술의 융합은 점점 더 확대되고 가속되고 있습니다. 그리고 그 한 가운데에 데이터가 있습니다. 거짓말을 하지 않는 진실한
데이터가 쌓이는 곳이 디지털 세상이며, 디지털 데이터를 제대로 분석하게 되면 누구나 시장의 변화와 트렌드를
진실 그대로 분석할 수 있습니다.
•데이터 분석을 통한 트렌드 예측 사례
· 롯데웰푸드 : 트렌드 예측 시스템 ‘엘시아LCIA’를 도입하여 수천만 건의 소셜 데이터와 POS 판매 데이터, 날씨, 연령, 지역별 소비 패턴 및 각종 내외부 자료를 종합적으로 판단하여 식품 트렌드 예측
예) ‘앙금+버터’의 키워드 분석 -> 빠다코코넛과
‘앙삐’를 결합한 콘텐츠 개발하여 매출 30% 증가
예) ‘맥주+과자’ 트렌드를 확인 -> 꼬깔콘
버팔로윙맛 출시하여 영향력 3위, 출시2개월만에 100만봉 판매
· 삼성카드 : 빅데이터 기반 소비트렌드를 분석
예) 젊은
층의 소비패턴을 파악하여 타겟팅한 ‘아이디ID카드’ 출시 -> 서비스별 다른 마케팅 전략
· 신한금융투자 : ‘싱글뷰’ 기반 실시간 분석 및 보고 체계 구축하여 업무처리 및 의사결정 프로세스 대폭 개선
*싱글뷰 시스템 : 고객 구매 여정을 한눈에 확인할 수 있는 통합 모니터링 시스템
· 농협은행 : ‘싱글뷰’ 기반 고객 정보, 투자 성향, 가입 현황 등 실시간 파악하여 금융상품 서비스 제공
•중소기업이나 개인의 트렌드 분석 방법
· 구글트렌드 : 전세계 혹은 관심지역 기준으로 검색어 입력하여 시간 흐름에 따른 관심도 변화를 그래프화
· 빅카인즈 : 형태소 분석 메뉴를 통해 내 텍스트 데이터를 복사하여 분석하여 상품 기획이나 프로모션 활용
· 썸트렌드 : 인스타그램, 트위터, 블로그, 뉴스 등 소셜미디어의 텍스트 데이터 활용하여 연관어 등 분석
6. 데이터 마인드
"존 스노와 나이팅게일 그리고 세종의 공통점”
1854년 영국 런던 소호가에 창궐한 콜레라로 많은 사람들이 희생당합니다. 당시 의사였던 존 스노는 현장을 방문하여 감염에 따른 사망자 수와 사망자의 주소를 수집한 ‘데이터를 맵 시각화’하며 문제점을 도출하였습니다. 오염발생원이 공기가 아닌 오염된 식수원임을 발견합니다.
같은해 영국인은 크림전쟁을 치르고 있었습니다. 야전병원의 위생상태가 열악하여 사망률이 전장에서의 사망률보다 높게 나타납니다. 나이팅게일은 이 문제를 해결하기 위해 입원, 부상, 질병, 사망 등의 데이터를 분석하여 로즈 다이어그램을 만들어 환자 사망원인이 병원의 위생상태에 있음을 통찰합니다.
조선의 세금제도가 낙후되어, 많은 폐단이 있었습니다. 세종은 전 국민을 대상으로(17만명 응답) 여론 조사를 하여 지역별 특성을 파악, 조세공평을 위한 지속적인 토론과정을 거쳐 1444년 공법을 확정시킵니다. 이후 공법은 조선 세법의 근간이 되었습니다.
위 세가지 세례에서 중요한 점은, 문제의 핵심 파악과 데이터화, 문제해결을 위한 현명한 의사결정입니다. 문제를 정확하게 읽고 이를 해결하려는 의지를 가진 사람이 있어야 합니다. 그런 다음 문제 해결에 적합한 데이터가 있어야 하며, 데이터 이면의 현실을 읽어낼 수 있는 통찰력을 갖추어야 함을 말해줍니다. 제대로 통찰하려면 분석적 사고, 통계적 사고, 전략적 사고 능력이 필요합니다. 이 세가지 데이터 사고력으로 데이터 마인드에 필요한 기본적인 능력입니다.
•데이터 사고력을 높이는 방법
1) 다양한 종류의 데이터를 다룰 수 있어야 합니다. 서베이를
통한 정형 데이터와 소셜에 있는 비정형 데이터를 통합적으로 분석하고 의미를 찾으려는 접근이 필요합니다.
2) 데이터 분석 방법과 시각화 결과물에 의심을 갖고 봐야 합니다. 오류를
최소화하기 위해 데이터가 가지고 있는 제약 사항을 염두에 두고 해석해야 합니다.
3) 표본조사의 특성과 오류 발생 가능성에 대해 알고 대비해야 합니다. 대표적인
오류인 선택 편향은 무작위 표본이 아님에도 무작위 표본인 것처럼 생각하고 사용하면서 발생되는 오류입니다.
4) 모든 통계가 아니라 나에게 필요한 통계를 알아야 합니다. 통계분석의
결과를 현실의 상황과 연결하여 대조해 보고 그 의미를 파악하는 등 통계기반 사고가 습관화되어야 합니다.
•데이터 마인드 습관 기르기
- 현상에서 데이터를 발견하기.
일상의 모든 상황과 순간들을 데이터화 한다고 생각할 때, 이를 어떻게 수집할 것인가를
고민합니다.
- 현상을 제대로 이해하기. 데이터 분석에 대한 기본 지식을 습득하여 어떤 문제나 과제에 대해 과학적인 문제 해결 접근법을 찾습니다.
- 현상을 개선하기. 기존의 상황보다 개선된 결과를 얻을 수 있는 의사결정을 하고, 보다 높은 가치를 창출하려고 노력합니다.
지금까지 데이터기반
의사결정을 하기 위해 길러야 할 ‘데이터 마인드’에 대해
살펴봤습니다.
데이터는 우리가 가진 기술이 아니라 마인드에서부터 시작됩니다. 나만의 관점을 바탕으로 데이터를
다루는 능력을 갖추고, 업무 경쟁력을 향상시키는 데 활용해 보시기를 바랍니다.
감사합니다.
-
이전글 데이터가 없습니다.