좋은 데이터시각화를 위한 세 가지 조건
PDCA·CPS, 데이터가 혁신의 단초임을 증명하다
글.신광섭 인천대 동북아물류대학원 교수
빅데이터의 힘, ‘가시성 확보’
빅테이터가 물류 혹은 공급사슬에 가져다주는 가장 큰 효용은 무엇일까? 많은 사람들이 ‘가시성(Visibility)의 향상’을 꼽는다. RFID(Radio Frequency Identification), 바코드를 포함한 IoT 기술이 발달로 실시간으로 데이터를 수집하고, 이를 통해 현재의 상황이 어떤지 알 수 있게 됐다.
▲ 삼성SDS의 글로벌관제센터(사진: CLO)
위 사진은 삼성SDS의 물류관제 시스템(Global Control Center)의 모습이다. 이 시스템의 가장 큰 기능은 고객사의 해외 물류 현황을 실시간으로 보여준다는 것과 배송 과정에서 발생하는 다양한 문제를 확인할 수 있다는 것이다. 대부분의 관제 시스템이 그러하듯 이 시스템도 ‘대시보드’ 형태로 돼있다. 그래프와 지도, 숫자 인터페이스를 통해 관리자가 현재 물류시스템의 상황을 직관적으로 이해할 수 있도록 도와주는 것이다.
비단 삼성SDS의 관제 시스템뿐 아니라 우리가 일상에서 자주 사용하는 자동차 계기판, 가정집 보일러 조절기, 주식 시황 그래프, 일기예보 등도 모두 관제(Monitoring)을 위한 시스템이라고 할 수 있다. 이러한 관제 시스템의 본질적인 특징은 현재의 상황을 ‘한 눈에 파악하기 쉽게’ 보여준다는 것이다.
관제 시스템은 기본적인 데이터를 그대로 보여주기도 하지만, 데이터의 가치를 극대화하기도 한다. 이번 호에서는 데이터를 통해 정보를 시각화하는 방법(Visualization)과 이와 관련해 주의해야 할 몇 가지를 간단하게 살펴본다. 그리고 나아가 데이터를 단순히 보는 것 이상으로 활용할 수 있는 방법에 대해 이야기할 것이다.
‘본다는 것’의 의미
무언가를 관리(Management)하기 위해서는 ‘보는 게’ 선행돼야 한다. “측정할 수 없다면 관리할 수 없다”는 말도 있지 않나. 관리란 현재의 수준을 파악하고, 문제점을 찾아 더 높은 수준의 성과를 내도록 하는 것이다. 즉, 측정을 해야 볼 수 있고, 볼 수 있어야 관리를 할 수 있다. 요컨대 관리를 위한 가장 기본적인 단계는 현재의 정량적 지표를 측정하고 파악하는 것이다. 최근에는 시스템이 복잡해져 정량적 지표를 측정하고 파악하는 데 오랜 시간이 걸리거나 아예 불가능하기도 하다. 하지만 사물인터넷(IoT: Internet of Things) 혹은 만물인터넷(IoE: Internet of Everything)의 발달이 이러한 문제를 근본적으로 해결해나가고 있다.
그런데 단순히 데이터를 확보한다고 해서 혁신을 위한 관리가 저절로 잘되는 것은 아니다. 이에 따라 최근에는 데이터를 통해 현재 시스템을 ‘정확하게 보여주는 방법’이 활발하게 연구되고 있는데, 이를 데이터 시각화(Data Visualization) 혹은 시각적 분석(Visual Analytics)이라 부른다.
역사 속 데이터 시각화
한 장의 그림은 천 개의 단어와 같은 가치를 갖는다. 실제로 이미지를 통한 정보 전달은 오랜 기간에 걸쳐 많은 사람들에 의해 사용돼 왔다. 아래 그림을 살펴보자.
▲ 프랑스의 러시아 원정의 데이터 시각화
조금 난해한가? 하지만 이 그림 한 장이 1812~1813년에 러시아 원정을 떠나는 프랑스 군대의 규모, 당시의 기온, 원정 경로를 나타내는 것이라는 것을 안다면 이야기가 조금 달라질 것이다. 이 그림을 통해 우리는 프랑스 군대가 어느 정도의 규모로 시작해, 어떤 경로를 따라 이동했으며, 또 어떤 경로로 모스크바에서 퇴각했는지, 당시의 기온은 전투에 어떠한 영향을 끼쳤는지 등을 알 수 있다.
또 다른 예를 하나 들어보자. 백의의 천사로 불리는 나이팅 게일. 그녀가 단순히 환자 간호에만 헌신적이었던 것은 아니다. 나이팅 게일은 영국군 사망 원인에 대해 체계적인 통계 분석을 하였고, 다음과 같은 그래프를 완성했다.
▲ 나이팅게일의 통계 분석 그래프
나이팅 게일은 이 그래프를 완성하기 위해 수년간 실제 현장에서 데이터를 수집했으며, “정보가 통계자료에 근거에 활용될 때만 국민의 복지를 향상할 수 있다”고 주장했다. 그녀는 이 그래프를 통해 전투에서 사망한 영국군보다 병원 내 감염에 의해 사망한 영국군이 훨씬 더 많다는 사실을 증명했고, 이를 기반으로 영국군의 간호사 훈련, 병원 관리, 보급 및 급식까지 모든 업무를 개선할 수 있었다.
이처럼 한 장의 그래프는 수많은 정보를 효과적으로 전달할 뿐 아니라, 현재의 체계를 혁신하는 근거로 사용되기도 한다. 하지만 중요한 것은 그래프를 어떻게 구성하느냐 하는 것이다. 잘못 구성된 그래프는 위의 사례와는 반대로 아주 사소하고 간단한 정보조차도 전달하지 못한다. 그렇다면 좋은 그래프, 좋은 데이터 시각화의 조건은 무엇일까?
좋은 데이터시각화의 조건
데이터 시각화를 하는 데 반드시 지켜야할 규칙이나 원칙이 존재할 수는 없다. 다만 필자는 개인적으로 다음의 세 가지만큼은 꼭 기억해야 한다고 강조하고 싶다.
① 목적에 어울리는 그래프를 고르라
강의 시간에 학생들에게 ‘가장 좋아하거나 가장 많이 사용하는 그래프의 종류가 무엇이냐’고 물은 적이 있다. 대부분 선형, 막대, 파이 차트라고 답했다. 그러나 사실 이 질문은 시작부터 잘못됐다. 데이터 시각화에 있어 가장 좋아하는 그래프는 별로 의미가 없다. 대신 목적에 가장 적합한 그래프를 선택해야 한다.
가령 꺾은선 그래프 등의 선형 그래프는 시간에 따른 변화를 나타내기 위해 사용한다. 막대그래프는 두 그룹의 차이를 표현하기 위해 사용하며, 파이 차트는 구성요소 사이의 비율을 비교하기 위해, 산점도는 두 변수 간의 관계 혹은 데이터의 분포를 파악하기 위해 사용한다. 이는 지극히 상식적인 기준이지만, 실제 그래프가 들어간 보고서를 보면 이 원칙이 무시되는 경우를 쉽게 발견할 수 있다.
▲ 다양한 그래프의 예시
② 4개 이상의 정보를 한 번에 담지마라
우리는 3차원 공간에 살지만 그래프는 2차원의 영역이다. 가로축과 세로축으로 만들어지는 2차원 그래프에는 기본적으로 두 가지 정보를 담을 수 있다. 여기에 색깔이나 모양, 크기를 달리함으로써 더 많은 차원의 정보를 포함시킬 수도 있다. 최근에는 최대한 많은 수의 색과 도형, 그리고 음영(Gradation) 등을 사용해 그래프를 화려하게 꾸미는 경우도 많다. 하지만 아무리 미적 감각이 뛰어난 그래프라고 해도 실제 보는 사람이 이해하기 어렵다면 무용지물이다. 우리에게 필요한 것은 추상화가 아니다. 물론 개인적인 의견이지만, 하나의 그래프에 4가지 이상의 정보를 담게 되면 구성이 복잡해져 그래프를 이해하기가 힘들어진다.
③ 사회통념에 맞는 색과 도형을 사용하라
마지막으로, 그래프에 사용되는 색과 도형 등 모든 구성요소의 배치는 상식적인 범위 내에서 이뤄져야 한다. 예를 들어 사회 통념상 붉은색은 위험 혹은 경고의 의미를, 초록색은 안전함을 뜻한다. 그런데 그래프에서 이를 반대로 사용한다면 원하는 정보를 제대로 전달하지 못하거나 혼란을 초래할 수 있다. 또한 일반적으로 글이나 그림은 좌측 상단에서 우측 하단의 대각선 방향으로 본다. 따라서 그래프에 구성요소를 배치할 때도 이러한 방향을 고려하는 것이 좋다. 즉 위에서 아래로, 왼쪽에서 오른쪽으로 순서에 따라 그래프의 구성요소를 배치해야 한다.
천 장 그림보다 하나의 인터페이스
좋은 데이터시각화를 위한 위의 세 가지 조건은 대시보드를 설계하는 데도 그대로 적용된다. 하지만 이 조건보다 더 중요한 게 하나 있으니, 바로 인터페이스(Interface)다. 한 장의 그림이 천 마디 말과 같다면, 하나의 인터페이스는 천 장의 그림과 같다. 요컨대 한 장의 그림에 담을 수 없는 다양한 정보를 효과적으로 전달하기 위해서는 그래프 사이의 관계에 따라, 특정 영역을 선택함에 따라 달라지는 ‘인터액티브(Interactive) 방식’을 이용해야 한다. 이러한 방식을 통해 여러 개의 그래프가 서로 유기적으로 연결되어 구성되는 시스템을 우리는 ‘대시보드(Dashboard)’라 부른다. 아래 그림은 다양한 성과지표(KPI: Key Performance Indicators)를 통해 물류서비스 수준을 한 눈에 파악할 수 있도록 만든 대시보드 사례이다.
▲ KPI를 통해 물류서비스 수준을 파악한 그래픽(자료: 데이터파인)
위의 그림처럼 명확한 메시지를 간결하면서도 정확하게 전달할 수 있는 대시보드를 만들기 위해 지켜야 할 사항은 다음과 같다.
반대로 대시보드를 만드는 데 피해야 할 사항은 다음과 같다.
좋은 대시보드를 만들기 위해 해야 할 것과 하지 말아야 할 것을 종합해보면 핵심은 바로 이것이다. “보다 정교하고 효과적인 대시보드를 만들려거든, 사람들이 원하는 정보에 집중해 최대한 단순하게 설계하라.”
그렇다면 과연 사람들은 무슨 정보를 원하는 것일까? 가령 앞선 KPI의 사례에서는 일반적인 매출과 비용을 포함한 현재의 물류서비스 수준을 집중적으로 보여주고 있으며, 시간에 따른 수익과 성과지표(소요시간)의 변화도 보여준다. 대시보드가 이러한 정보를 보여준 이유는 물류서비스의 수준을 결정하는 가장 중요한 요인이 바로 ‘배송에 소요되는 시간(Lead time)’이기 때문이다. 물론 여기에는 약속된 시간 내에 배송되는 비율(정시도착률)도 포함된다.
이렇듯 사람들이 원하는 정보는 매우 중요한 정보인 동시에, 지속적으로 관리하고 개선(Continuous Improvement)해야 하는 정보다. 가령 물류업체는 배송 리드타임을 시시각각 관찰하며 그 시간을 줄이기 위한 노력을 한다. 결국 대시보드는 ‘문제점을 파악하고 이를 개선해 현재보다 더 나은 성과를 내는 데 필요한 정보’를 집중해서 보여주어야 한다.
혁신으로 가는 길
그렇다면 다양한 그래프와 대시보드에 드러난 데이터를 활용해 지속적인 개선과 혁신을 할 수 있는 방법에는 무엇이 있을까. 우선적으로 생각해볼 수 있는 방법은 ‘PDCA(Plan Do Check Act) 사이클’이다. 특히 전통적인 PDCA와는 또 다른 PDCA(Problem finding, Display, Clear, Acknowledge) 사이클(위키피디아 참고)을 활용함으로써, 과연 모니터링한 내용이 개선과 혁신의 단초가 될 수 있는지 추측해볼 수 있다. 즉 모니터링을 통해 발견(Finding)한 문제를 가시화(Display)해서 이를 해결(Clear)한 뒤에, 이 노하우를 지식으로 축적(Acknowledge)하여 또 다른 개선에 활용할 수 있다. 여기서도 중요한 것은 현재 시스템의 상황을 ’어떻게 보여줄 것이냐’ 하는 것이다. 이게 잘 되어야만 문제를 발견해 그 근본 원인을 파헤치고, 문제해결 과정을 지식화해 시스템 개선에 활용하는 게 가능해진다.
▲ PDCA 사이클
한편 인더스트리4.0의 대표적인 개념인 CPS(Cyber-Physical Systems)는 모니터링의 결과가 혁신으로 전환될 수 있는 구체적인 방법을 제시한다. 다음 그림은 미국 NIST(National Institute of Standards and Technology)의 PWG(Public Working Group)에서 정의한 CPS의 개념도이다.
▲ CPS 개념도(https://pages.nist.gov/cpspwg/)
CPS 개념도에 따르면 장치(Device), 시스템(System), 시스템의 시스템(System-of-system)으로부터 확보되는 데이터를 기반으로 가상공간(Cyber)에서 최적의 의사결정이 이뤄진다. 위 그림에서 볼 수 있는 사이클은 물리적 시스템(Physical)에서 발생한 문제를 해결하기 위한 혁신안을 가상공간에서 검증하는 과정을 보여준다. 최적의 의사결정을 통해 가상공간에서 검증된 혁신안은 다시 현실의 물리적 시스템에 반영된다.
이렇게 최적의 해결방안을 도출하고 이를 가상공간에서 검증하기 위해서는 데이터 분석능력뿐 아니라, 최적화(Optimization)와 시뮬레이션(Simulation)을 원활하게 수행할 수 있는 능력이 필요하다. 우리는 다음의 기사를 통해 최적화 기능의 중요성을 확인할 수 있다.
“포스코는 제품별 수요예측에서부터 주문처리, 생산관리, 제품출하에 이르기까지 산업별, 고객사별로 다양한 주문과 출하 자료를 빅데이터 기법으로 분석해 질적으로 고도화된 주문·생산·설계·출하 모델을 개발하기로 했다. (중략) 인공지능을 활용해 고객에게 공급될 제품의 입고정보와 선박정보 등을 분석하여, 선적에서 운항에 이르는 일정을 최적화하는 알고리즘을 내년 상반기까지 개발 완료한다는 계획이다.”(포스코, 빅데이터·인공지능 적용해 경쟁력 강화, 폴리뉴스, 170309)
로지스틱스4.0의 시작은 모니터링에서부터
지금까지 살펴본 바와 같이 데이터의 가치는 단순히 현재 시스템의 상태를 더 잘 보여주는 ‘가시성 향상’에 그치지 않는다. 데이터의 진정한 가치는 현재 시스템을 객관적이고 정확하게 바라보게 하고, 이를 통해 시스템을 혁신하는 방법을 제공한다는 데 있다.
최근 산업계는 인터스트리4.0으로의 전환을 꿈꾸고 있다. 물류에서도 로지스틱스4.0으로 도약하기 위한 노력이 진행되고 있다. 많은 사람들이 롤랜드버거의 보고서를 인용하며, 로지스틱스4.0을 ‘IoT기술 발전으로 인한 인력 절감 및 인력 평준화’로 정의한다. 그렇다면 IoT의 진화는 어떻게 인력 절감을 이뤄낼 수 있는 것일까?
앞서 설명한 CPS가 그 실마리가 될 수 있을 것이다. 필자는 데이터에 기반을 둔 시스템 분석과 모니터링, 문제의 발견과 최적해를 이용한 해결, 시뮬레이션을 통한 검증을 거쳐 혁신적인 물류시스템이 만들어질 수 있다고 생각한다.
우리는 기술이 발전함에 따라 전혀 새로운 것들이 세상에 나타날 것으로 생각한다. 하지만 오히려 첨단의 기술은 우리를 가장 기본적인 것(The basic)으로 되돌아가게 한다. 앞서 말했듯 혁신을 향한 관리는 ‘보는 것’에서부터 시작한다. 무언가를 혁신하거나 관리하기에 앞서, 스스로에게 물어보자. 우리는, 우리 자신을 객관적이고 정확하게, 그리고 빈틈없이 모니터링하고 있는가?