글. 신광섭 인천대학교 동북아물류대학원 교수
신광섭의 빅데이터 뒤집기(1) 기본부터 시작하는 물류 빅데이터
“물류 빅데이터, 그거 먹는 건가요?”
빅데이터 ‘Why´와 ’How‘가 필요할 때
Idea in Brief
물류산업에 종사하는 사람들에게 “요즘 물류에서 빅데이터가 화두인데 어떻게 준비하고 계십니까?”라고 묻는다면 대부분 “물류 빅데이터가 존재하긴 하냐” 혹은 “데이터를 쌓긴 쌓는데 어떻게 써야될 지는 모르겠다”는 대답이 돌아온다. 그렇다면 빅데이터는 어디에, 어떻게 존재하는가. 그리고 빅데이터는 어떻게 활용할 수 있는가. 빅데이터 관련 기술이나 시스템을 도입하기 전에 우리가 우선적으로 생각할 점이 있다. 혹여 우리는 무조건 데이터만 확보하려고 하지는 않았는가. 우리는 왜 데이터를 분석하려 하는가. 빅데이터 활용 이전에 근본적인 질문에 먼저 대답할 때다. |
최근 아마존이 새로운 비즈니스 모델과 앞선 기술력을 바탕으로 물류산업에 본격적으로 진출하면서 물류 관련 빅데이터에 대한 관심이 급증하고 있다. 특히, 빅데이터를 중심으로 온디맨드(On-Demand) 서비스를 구현하기 위한 기술이 집중 조명을 받고 있다. 빅데이터를 기반으로 물류 서비스 수준을 향상 시키거나 새로운 비즈니스 모델을 설계하려는 시도가 계속되고 있으며, 그 결과 국내에서도 다양한 스타트업 기업들이 탄생하고 있다.
많은 사람들이 물류에서 빅데이터가 중요하다고 말하고 있다. 지금 글을 쓰고 있는 본인도 전적으로 동의하는 바이지만, 바로 그 다음에 따라오는 질문 “그래서 어떻게 하면 되냐?”에 대한 대답은 쉽지 않다. 그렇다고 10대들이 흔히 사용하는 ‘케바케 (Case by Case)’ 즉, 그 때 그 때 다르다는 말로 얼렁뚱땅 넘어갈 수도 없는 일이다.
바로 이 질문에 대한 대답을 하기 위해 지금부터 다양한 관점에서 논의를 시작해보고자 한다. 우선 가장 근본적인 질문부터 시작한다.
빅데이터, 어디서부터 시작하나
물류 산업에 종사하는 사람들에게 “요즘 물류에서 빅데이터가 화두인데, 어떻게 준비하고 계십니까?”라고 물어보면 대부분 다음과 같은 대답이나 질문을 받게 된다.
빅데이터요? 우리 회사에 그런 게 있나?
데이터를 쌓아 두기는 하는데 어디에 써먹을 지 모르겠습니다.
‘구슬이 서 말이라도 꿰어야 보배’라는 속담은 이제 식상하겠지만, 이 속담만큼 현재의 상황을 잘 표현하는 것도 없을 것이다. 빅데이터의 개념과 정의는 이미 많은 사람들이 이야기했고, 대부분 이해하고 있을 텐데도 왜 우리 회사에는 없다고 생각하는 것일까? 개인적으로는 빅데이터가 널리 알려지게 된 계기가 트위터나 페이스북과 같은 SNS 데이터 분석 결과였기 때문에 사람들의 머릿속에 “빅데이터 = SNS 데이터”라는 선입견이 자리 잡았기 때문이라 생각한다. 그러나 SNS 데이터가 분명 빅데이터의 전형적인 형태이긴 하지만, 그렇다고 전부라고 말할 수는 없다. 그렇다면, 빅데이터는 어떻게 찾을 수 있을까. 다음 데이터가 생성되는 방법의 변화에서 힌트를 얻을 수 있다.
전통적인 기업의 비즈니스 환경에서는 거래와 이를 내부적으로 지원하기 위한 문서 기반으로 모든 데이터가 생성되었다. 그 형태는 종이 문서에서 전자문서화되는 과정을 거쳐 발전해왔다. 그 다음 단계는 바로 문서를 생성하는 대신에 제품 혹은 장비가 가지고 있는 정보를 인식하는 방법으로 데이터가 생성되는 단계이다. 이는 바코드, QR코드를 거쳐 RFID로 발전하게 되었으며, 최근에는 사물 인터넷(IoT), 혹은 만물 인터넷(IoE)으로 대변되는 장비 간의 통신에 의한 데이터 생성 단계로 전환되었다. 데이터 생성 방식의 변화에서 가장 중요하게 살펴보아야 할 부분은 바로 사람이 관여하는 부분이 지속적으로 축소된다는 점이다. 따라서 데이터가 왜곡되거나 정보의 전달 과정이 단절되는 현상도 방지할 수 있고, 실시간 추적도 가능하게 된 것이다.
다시 우리 주변을 살펴보자. 지금이 통신 기반의 데이터 생성 시대라고 하더라도 우리는 아직까지 이메일, FAX 등을 이용하고 있으며, 스마트 폰이나 PDA를 통해 바코드를 인식하고 있다. 앞서 언급한 방식으로 지속적으로 데이터를 생성하고, 확인하고, 전달하고 있는 것이다. 때문에 어쩌면 우리가 인지하지 못하는 상황과 방식으로 이미 빅데이터를 만들어내고 사용하고 있다고 보는 것이 더 정확한 표현일 지도 모르겠다. 즉, 지금 우리가 만지고 생각하고 있는 것 모두 빅데이터라고 생각해야 할 것이다.
물류 빅데이터, 대체 어디에 있나
그렇다면, 물류 빅데이터는 무엇이고 어디에서 찾을 수 있을까. 그 누구라도 이 질문에 “어디에 가면 다 찾을 수 있어” 혹은 “어떻게 하면 자동으로 받을 수 있어”라고 확실하게 대답하기 어려울 것이다. 근본적인 이유로 물류 빅데이터가 무엇인지, 좀 더 정확하게 표현하자면 우리가 무엇을 필요로 하는 지 명확하지 않기 때문이다.
그렇다면 우리가 필요로 하는 물류 빅데이터를 찾으려면 어떻게 해야 할까. 2015년 공공 기관에서 제공하는 물류 관련 데이터를 직접 찾아본 경험이 있어 그 결과를 공유하고자 한다. 아래 표는 물류 관련 데이터를 확보할 수 있는 기관과 세부 목록 그리고 제공 방식을 정리한 것이다.
조사 결과가 물류와 관련된 모든 데이터를 포함하고 있다고 말하기는 어렵지만, 상당히 다양한 데이터에 쉽게 접근할 수 있음을 알 수 있다. 여기서 가장 중요한 것은 필요한 데이터를 확보하기 위해서는 데이터 제공 기관을 정확하게 알고 있어야 한다는 점이다. 네덜란드, 미국, 싱가포르 등의 국가에서는 물류관련 데이터 제공을 위해 물류통합정보센터 내 통합 데이터베이스를 구축하여 하나의 채널을 통해 데이터를 제공하고 있다.
그러나 몇 가지 아쉬운 점은 여전히 남아 있다. 우리나라 역시 ‘국가물류통합정보센터’가 존재한다. 하지만 아직까지는 서비스 수준과 데이터 범위 측면에서 부족한 것이 사실이다. 일부 데이터를 제외하면 대부분이 기초 데이터(Raw data)가 아닌 1차 가공된 통계정보이기 때문이다. 또 제공 방식이 대부분 웹에서 표 혹은 도식화하여 제공하거나, 문서 파일로 저장하는 방식이기도 하다.
만약, 어떤 물류 관련 기업이 그들이 필요한 데이터를 실시간으로 처리하는 비즈니스 모델을 만들거나 내부 어플리케이션을 개발하고자 한다면, 현재의 데이터 제공방식으로는 여러 가지 문제를 만들어낼 수밖에 없다. 이러한 방식보다는 국토교통부 교통정보 공개 서비스나 서울교통정보센터 등과 같이 필요 데이터를 실시간으로 확보할 수 있는 API를 공개하는 방식이 더욱 합리적이라 생각한다. 교통과 관련된 다양한 스마트폰앱이나 네비게이션 서비스 등이 발전하게 된 가장 큰 이유 중 하나가 바로 이 데이터의 개방과 접근성 향상덕분이라 말할 수 있다.
그나마 한 가지 위안거리는 대부분의 데이터를 무료로 제공받을 수 있다는 점이다. 그러나 일부 기관에서는 사용자가 웹사이트를 통해 데이터를 검색하거나 전자문서로 저장하는 방식이 아닌 온·오프라인을 통해 필요 데이터를 요청하면 관리자가 엑셀 등의 문서 파일로 제공하는 불편한 방식을 사용한다. 심지어 이에 대해 일정 금액의 수수료를 청구하는 경우도 있다. 서비스 요금을 청구하는 데는 여러 가지 이유가 있겠지만, 최근의 빅데이터 관련 정책과 해외 동향과는 아무래도 거리가 있어 보인다.
결국 물류 산업에서 빅데이터를 활용한 다양한 신규 서비스가 등장하고, 국내 물류기업의 경쟁력 강화를 위해서는 국가 차원에서 빅데이터를 확보하고 이를 비즈니스에 활용할 수 있도록 데이터 분석을 위한 통합 플랫폼을 제공할 필요가 있다.
빅데이터를 성공적으로 활용하려면
앞서 언급한 두 가지 문제 중 하나인 ‘빅데이터가 어디에 어떻게 존재하는 지’를 생각해보았다면, 이제 두 번째 문제로 넘어가자. “빅데이터로 무엇을 할 것인가?”
뉴벤티지파트너스(NewVantage Partners LLC)라는 기업에서 포춘(Fortune) 1000대 기업을 대상으로 한 빅데이터 확보 여부와 활용 계획에 대한 설문 조사를 했다. 그 결과를 우선 살펴보자면 흥미로운 사실과 두 번째 문제가 왜 중요한 지 이해할 수 있다.
이 설문 조사 결과를 살펴보면, 빅데이터 분야에 상당히 많은 투자가 이루어지고 있고 중요성에 대한 인지도도 상당히 증가했음을 알 수 있다. 그러나 실제로 현장 중심의 데이터를 확보하거나 빅데이터 분석 기반의 의사결정 체계를 갖추고자 노력하는 단계에 머물러 있는 것 역시 살펴볼 수 있다. 이 시점에서 한 번 더 짚고 넘어가야할 부분이 바로 앞에서 언급한 두 번째 질문이다. “빅데이터를 어떻게 활용할 것인가?” 다음 설문조사 분석 결과를 우선 살펴보자.
IT인프라 기업 콜트 테크놀로지 서비스가 실시한 설문 조사 결과에 따르면 300명의 CIO 중 71%가 데이터보다는 경험을 기반으로 내린 의사결정이 더욱 효과적이었다고 답변하였다. 특히 66%는 자신의 경험과 직감이 데이터 분석 결과와 상반될 수 있음을 인지하고 있었다. 기업 내에서 시스템과 데이터에 가장 가까운 위치에 있는 CIO가 왜 데이터가 아닌 직감과 경험을 바탕으로 의사 결정하는 것일까. 설문 조사 분석 기관의 클라우드 전문가 스티브 휴즈는 이러한 문제의 원인을 ‘데이터의 폭주(?)’에서 찾을 수 있다고 말한다. 빅데이터 분석 기술의 발달로 많은 CIO들이 엄청난 양의 데이터를 제공받고 있고, 게다가 그 데이터는 아주 빠른 속도로 변화하고 있다. 때문에 오히려 심사숙고할 시간이 없어 직관적으로 의사결정 할 수 밖에 없다는 것이다.
많은 기업들이 빅데이터가 중요함을 인지하고 있고, 빠르게 데이터를 확보하고 있고, 대규모 투자를 진행하고 있다. 그렇지만 무턱대고 데이터를 모으고 분석해서 실시간으로 제공하다가는 앞의 설문조사와 같은 상황이 발생할 것은 어찌 보면 당연한 결과이다.
랜디 빈(Randy Bean)은 이렇게 데이터에 매몰되는 상황에 빠지지 않기 위해서는 우선 적절한 평가 지표(metric)를 설계하고, 혁신을 위한 기회를 확인하고, 마지막으로 이를 위한 기업 문화를 구축해야 한다고 말한다. 일맥상통하는 이야기일 수도 있으나 가장 먼저 선행되어야 할 것은 ‘분석의 목적’을 명확히 하는 것이다. 왜 우리가 데이터를 분석해야 하는 지에 대한 조직 내 공통의 이해가 확보되지 않는다면 어떤 분석 결과도 의사결정에 활용되기 어려울 것이다. 분석의 목적은 바로 관리의 목적과 동일하게 해석될 수 있고, 바로 관리의 목적에 맞는 정량적 측정 지표(metric)를 설계할 수 있게 된다. 이 때야말로 비로소 지표를 측정하기 위해 필요한 데이터를 확인할 수 있게 된다.
가트너(Gartner)에 따르면 많은 기업들이 최근의 빅데이터 관련 기술의 발전을 통해 전통적인 데이터 관리 기법이 가진 한계를 뛰어 넘는 잠재적인 비즈니스 기회를 확인했다고 말한다. 때문에 데이터는 앞으로 더 많은 범위에서 전략적 의사결정 체계에 활용될 것으로 예상된다.
하지만 빅데이터 관련 기술이나 시스템을 도입하기 전에 생각할 점이 있다. 혹여 우리는 무조건 데이터만 확보하려고 하지는 않았는가. 우리는 왜 데이터를 분석하려 하는가. 빅데이터 활용 이전에 근본적인 질문에 먼저 답할 필요가 있다.
* 참고문헌 :
1. NewVantage Partners (2016), Big Data Executive Survey 2016, An Update on the Adoption of Big Data in the Fortune 1000
2. Randy Bean (2016), Just Using Big Data Isn’t Enough Anymore, Harvard Business Review
* 해당 기고문은 CLO 통권 69호(2016년 3월호)에 수록된 기사를 일부 발췌했습니다.