급변하는 물류시장, 경쟁력의 키는 데이터과학자의 손에
글. 신광섭 인천대학교 동북아물류대학원 교수
흔히 빅데이터의 시대라는 말을 한다. 이제 빅데이터라는 단어는 조금 구태의연하게 들리기까지 할 정도다. 빅데이터를 대체할 말로 ‘데이터 사이언스(과학)’라는 말이 떠오르기도 했다.
우리는 데이터의 홍수 속에 살고 있다. 하지만 그중 상당수는 불필요한 데이터이다. 유의미한 데이터 가운데서 우리에게 필요한 시사점을 발견하는 것도 쉬운 일은 아니다. 이러한 문제에 대처하기 위해 데이터 과학자가 필요하다.
그렇다면 물류에서는 어떨까? 하루가 다르게 변화하는 물류산업 현장에서도 데이터 과학자가 필요할까? 결론부터 말하자면 정답은 ‘YES’다. 그렇다면 물류산업의 데이터 과학자는 어떤 일을 하게 되는 것일까? 구체적인 사례를 통해 살펴보자.
물류센터 사례 분석(반복되는 주기의 데이터 검증)
다음 그림은 어느 물류센터의 하루 처리량의 변화를 30개월간 기록한 결과이다. 왼쪽 차트의 최소 물동량은 0이다. 토요일, 일요일 및 공휴일은 작업을 하지 않기 때문이다. 약 1000개 이하의 물량은 대부분 금요일까지 처리하지 못하거나 반송된 상품을 처리하기 위한 것이다. 반대로 다른 기간에 비해 비정상적으로 높은 값을 보이는 시점도 있다. 이 시점은 명절 전후이다. 1000거건 이하의 데이터를 삭제한 결과는 그래프의 오른쪽과 같다.
▲물류센터의 하루 물량 처리량 그래프(좌측)과 1000건 이하의 데이터를 삭제한 결과(우측)
대부분의 사람들이 이 데이터에서 일정의 패턴을 발견할 수 있을 것이다. 다만 그래프는 월별 주기가 있다고 말하기에는 상대적으로 짧은 시간 안에 증가와 감소를 반복하는 경향을 보인다. 오히려 시간이 지나면서 최대 처리 물량과 최소 처리 물량의 차이만 더 늘어나고 있다. 대신 요일별 특징을 파악하기 위해 다음과 같이 특정 요일의 물동량만을 확인해보았다.
▲물류센터의 요일별 물동량 데이터
여기서 우리는 월요일의 물동량이 다른 요일에 비해 월등히 높다는 것을 알 수 있다. 또한 화요일부터 금요일까지는 비슷한 수준을 보이는 물동량이 토요일과 일요일엔 그 업무의 특성상 0에 가깝게 나타나고 있는 것도 확인할 수 있다. 이러한 결과를 바탕으로 물동량은 일주일 단위로 반복된다는 결론을 내려 볼 수 있겠다. 그러나 이것은 심증에 불과하다. 조금 더 객관적인 근거가 필요하다.
이런 경우 실제로 동일한 패턴이 얼마의 기간을 주기로 나타나는지 검증하기 위해 ‘자기상관계수(Autocorrelation Function; ACF)’를 사용할 수 있다. 자기상관계수는 현재 데이터와 자신의 과거 데이터와의 상관관계를 의미하는 것으로, 만약 이 경우처럼 일주일 간격으로 비슷한 양상을 보인다면 ACF그래프에서 7만큼 지연된 시점(즉 현재로부터 7일 전)과의 상관계수가 상당히 높게 나타나야 한다. 만약 ACF그래프에서 7시점, 14시점, 21시점마다 높은 상관계수를 보인다면, 이는 물동량의 패턴이 일주일 간격으로 반복되는 경향이 매우 강하다고 할 수 있는 근거가 될 것이다. 그리고 이러한 근거를 바탕으로 현재의 상황을 개선할 수 있는 방안이 마련된다.
물류에 데이터과학자는 필요하다
다시 처음으로 돌아가 보자. 물류 현장에도 데이터 과학자가 필요한가? 분명히 필요하다. 데이터의 홍수 속에서 유의미한 데이터를 발견하고, 시사점을 파악한 뒤, 그것을 바탕으로 개선방안을 마련하는 것은 물류산업 현장에서도 반드시 필요한 일이다.
물론 이 과정에서 데이터 과학자의 개인적인 역량이 중요하게 작용할 것이다. 데이터 분석 과정에는 정해진 틀도, 정답도 존재하지 않기 때문이다. 분석하는 사람의 개인적 역량에 따라 조금 더 성능이 좋은 모형을 만들 수 있고, 그렇지 못할 수도 있다. 특히 데이터 과학자가 분석 과정 혹은 모델링의 결과를 논리적으로 도출하지 못하거나 이론적 근거를 확보하지 못한다면 성과의 연속성과 반복가능성에 한계가 드러나게 된다. 다시 말하면, 한두 번은 좋은 성과를 낼지 몰라도 그 성과가 지속되거나 유사한 데이터가 주어졌을 때 동일 수준의 결과를 보장하기 어렵다는 뜻이다. 데이터 과학자가 갖춰야 할 역량으로 ‘분석적 문제 해결 능력’, ‘수학 및 통계학적 지식’, ‘지적 호기심’ 등이 강조되고 있는 것도 이와 같은 맥락에서다.
한편 가트너가 발표한 자료에 따르면 2017년에는 자기 분석 서비스(Self Service Analytics)와 고급분석(Advanced Analytics)을 연결하는 역할을, 수학과 통계업무를 담당하지는 않지만 고급화된 분석이나 예측 모델을 만드는 일반 데이터 과학자(Citizen Data Scientist)가 주도할 것이라고 한다. 데이터 과학자 앞에 ‘일반’이라는 단어가 붙은 이유는 무엇일까? 비즈니스 현장에서 데이터 분석을 어느 누구 하나의 업무로 한정할 게 아니라, 비즈니스를 수행하는 모든 사람들이 데이터 과학자로서의 일을 해야 한다는 의미다. 전망이 이러하다면 우리도 준비해야 한다. 특히 물류분야에서는 현장을 중심으로 데이터 분석에 따른 의사결정이 이뤄질 수 있도록 다양한 도구 개발 및 교육 지원이 필요하다.
시간이 지날수록 물류를 중심으로 한 글로벌 물류시장의 변화의 속도는 더욱 빨라지고 있다. 다양한 내외부적 요인이 변화를 채찍질하고 있다. 따라서 우리는 주변을 둘러싸고 있는 환경으로부터 데이터를 신속하게 확보하고, 다양한 관점에서 분석된 결과를 바탕으로 경쟁우위를 확보하기 위한 전략을 도출해야만 한다. 그렇게 도출된 전략이 실제로 글로벌 경쟁에서 효과를 거둘 것인가 여부는 데이터 과학자의 손에 달려 있다.