데이터 시각화가 이해와 분석을 개선하여 더 빠르고 의사 결정을 내릴 수 있는 방법

데이터 시각화로 어떻게 의사결정에 도움을 줄 수 있을까요? 분석결과를 더 잘 이해하는데 도움을 주는 데이터 시각화에 대해 알아보겠습니다.

데이터 시각화란 무엇일까요?( What is data visualization?)

데이터 시각화는 차트, 플롯, 인포그래픽, 애니메이션 등의 그래픽을 활용하여 데이터를 표현하는 것을 말합니다. 이런 시각화는 복잡한 데이터의 관계와 데이터 기반 통찰력을 이해하기 쉬운 방식으로 전달합니다.

데이터 시각화는 다양한 목적으로 활용될 수 있으며, 데이터 팀만을 위한 기능은 아닙니다. 데이터 사이언티스트와 데이터 분석가는 경영진이 이를 활용하여 조직과 계층구조의 패턴과 추세를 파악하는 데에 사용될 수도 있습니다. Havard Business Review는 데이터 시각화를 아이디어 생성, 아이디어 일러스트레이션, 시각화를 위한 아이디어, 데이터 시각화의 네 가지 주요 목적으로 분류합니다. 이에 대해서 자세하게 알아보겠습니다.

데이터 시각화는 일반적으로 팀 전체에서 아이디어 생성을 촉진하는 데에 사용됩니다. 다양한 관점으로 아이디어를 수집하고, 집단의 공통 관심사를 강조하여 프로젝트가 시작하는 시점에서 브레인 스토밍에서 쓰이거나, 디자인 씽킹 섹션에서 자주 활용됩니다. 이러한 시각화는 일반적으로 정의하기 어렵지만, 팀이 주요 이해관계자를 대상으로 문제해결을 목적으로 진행되는 프로젝트에서 사고의 기반으로 활용될 수 있습니다.

아이디어와 일러스트레이션은 데이터 시각화에서 실제 비즈니스 전개나 프로세스의 형식을 보여주는 데에 유용합니다. 특정 작업에 진행되는 의사소통이나 조직구조 내에서의 워크플로우를 표현하는 데에 사용할 수 있습니다. 따라서 워크 플로우를 설명하기 위해 일반적으로 사용되는 간트 차트나 워터폴 차트 등이 여기에 해당됩니다.

시각적 검색과 같은 일상에서 사용되는 데이터의 시각화는 데이터 팀과 더 밀접한 연관성을 가집니다. 시각적 검색은 데이터 분석가, 데이터 사이언티스트, 기타 데이터 전문가가 데이터 세트 내에서 패턴과 추세를 식별하는 데 도움을 주며, 이어지는 스토리텔링에 도움을 줍니다. 특히 시각화는 데이터 사이언스의 프로세스에서 중요한 부분으로 동료와 의사결정자에게 데이터를 보다 효과적으로 전달하는 데에 사용됩니다. 다만 염두에 두어야 할 점은 이런 데이터 시각화 기술이 데이터 팀에 국한되는 것이 아니라 조직 내에 확장되어야 하는 스킬 셋이라는 부분을 기억해야 합니다.

데이터 시각화 유형(Types of data visualizations)

데이터 시각화의 초기 형태는 17세기 이전의 이집트 시대에서 사용된 네비게이션 시스템에서 찾아볼 수 있습니다. 시간이 지남에 따라 이런 형식은 경제, 사회, 의료 분야에서 광범위하게 활용되기 시작하였습니다. 이 중 주목할 것은 Edward Tufre의 The Visual Display of Quantitative Information의 사례입니다. 개인이 데이터 시각화를 활용하여 더 효과적인 방식으로 데이터를 표시할 수 있음을 보여주고 있으며, 기업이 실시간 성과지표를 공유하기 위해 활용하는 대시 보드의 사례에서 다양한 데이터의 소스를 추적하고 시각화하는 것을 확인할 수 있습니다. 대시 보드에 사용되는 시각화 기술은 다음과 같습니다.

  • 테이블(Tables): 변수를 비교하기 위하여 행과 열로 구성된 데이터의 테이블을 구성합니다. 많은 양의 정보를 구조화할 수 있는 방식이며, 다수의 사용자에게 높은 수준의 추세분석을 간단하게 제공할 수 있습니다.
  • 원형 차트와 누적 막대 차트(Pie charts and stacked bar charts): 전체를 그룹화하여 섹션을 구분할 때에 사용됩니다. 각 항목간의 사이즈와 데이터의 구성을 직관적으로 확인할 수 있습니다.
  • 선그래프와 영역 차트(Line graphs and area charts): 시간의 흐름에 따른 일련의 데이터 변화량을 보여주는 데에 적합합니다. 선 그래프는 변화의 양상을 보여주는 데에 주목하고 있으며, 영역 차트는 데이터 요소를 선으로 구분하여 변수간의 차이를 색상 등을 통해 표시하고 있습니다.
  • 히스토그램(Histograms): 막대 차트를 활용할 때에 숫자의 분포를 표시하여 특정 범위에 속하는 데이터의 양을 찾아냅니다. 막대사이에 공백을 없애서 데이터 내의 이상치를 찾아내는 데에 주된 목적이 있습니다.
  • 산점도(Scatter plots): 주로 두 변수 간의 관례를 나타내는 데에 사용되며, 회귀분석 그래프에서 가장 자주 확인할 수 있습니다. X축, y축과 점이 찍히는 위치를 보며 추세를 예측하는 데에 사용되며, 버블 차트와 쉽게 혼동되곤 합니다.
  • 히트맵(Heat maps): 위치에 따른 행동 데이터를 시각화하는 데에 주로 쓰입니다. 지도나 웹 페이지에서 자주 쓰이는 방식입니다.
  • 트리 맵(Tree map): 계층화된 데이터를 중첩된 도형 집합(일반적으로 직사각형을 사용)으로 표시하며, 영역 크기를 통해 특정 범주 내의 비율을 비교하는 데에 사용됩니다.

다음 블로그 데이터 시각화(Data Visualization) – Technology 에서 시각화 도구와 적용 모범사례 (Best Practice)를 소개하겠습니다.

발췌원본