[신광섭의 데이터바로보기] SCM의 시작 수요예측, 양파처럼 까보기

by 신광섭

2016년 12월 22일

- 양파가격 변동 기사를 통해 살펴보는 수요예측 방법론- 단기 수요예측에는 '지수평활법'과 '이동평균법'- 중장기 수요예측에는 회귀분석 기반 모델- 그럼에도 절대적 수요예측은 없다, 조금만 덜 틀리자

글. 신광섭 인천대학교 동북아물류대학원 교수 / 편집. 엄지용 기자

Idea in Brief

많은 사람들이 공급사슬의 상류에서부터 하류까지 이동의 시작은 원자재의 구매(Buy)를 통해 이루어진다고 생각할 수 있다. 그러나 이는 공급사슬 계획 실행의 첫 단계이다. 실제 재화의 이동을 결정하기 위해서는 누구로부터 얼마만큼의 원자재나 부품을 구입할 것인지 계획을 수립해야 하는데, 그 단계는 공급사슬의 하류에서부터 상류로 흐르게 된다. 결국 시장으로부터 제품이나 서비스가 얼마나 소비될 것인지를 예측하고, 그 결과를 바탕으로 판매와 저장, 생산, 구매 계획이 수립되는 것이다. SCM의 시작인 ‘수요예측 방법론’을 양파 가격과 재배 면적과 관련된 생활 예제를 통해 하나하나 살펴보겠다.

양파는 어느 해에 재배하는 것이 가장 좋을까? 양파 가격과 재배 면적에 대한 기사 한 편을 살펴보자. 지난 2015년 4월 29일 아주경제의 보도(마늘·양파 올해 재배면적 급감...지난해 가격하락 여파)에 따르면 양파 재배면적은 올해 급감했다. 지난해 가격하락의 여파로 인한 것이라는 분석이다.

또 하나의 기사를 살펴보자. 2016년 4월 28일 연합뉴스의 보도(양파 가격 뛰자 재배면적 늘었다)에 따르면 지난해와 올 초 양파 가격 상승이 이어지면서 양파 재배면적이 확대됐다. 동보도에 따르면 양파 재배면적이 늘어난 것은 지난해 양파 가격이 고공행진 했기 때문이다.

모두 양파의 재배면적과 관련하여 연도만 달리하여 동시기에 송고된 기사다. 그런데 두 기사는 완전히 반대되는 이야기를 하고 있다. 2015년은 전년도 가격 급락에 의해 재배면적이 급감했고, 다시 2016년에는 전년도 가격 폭등으로 인해 재배 면적이 급증했다. 두 기사로 살펴본 가격과 재배면적의 관계는 우리가 초등학교 시절부터 배워왔던 수요와 공급의 법칙을 넘어선 더 재미있는 사실을 보여주고 있다.

2015년 재배면적이 급감해서 생산량이 줄어들었으니, 수요공급의 법칙에 의거하여 그해 양파 가격은 폭등했을 것이다. 실제로 아래 그래프에서 보듯이 2016년 초반 양파 가격은 급등했다. 그러나 이후 발표 자료에 따르면 다시 2016년 재배면적이 늘어 2016년 9월 기준으로는 도매가격이 850원 수준으로 떨어졌다.

연도별 양파재배 면적과 평균 도매가

이정도 되면, 내년도 양파 재배면적은 줄어들 것인지 증가할 것인지 상상할 수 있지 않을까? 모두들 비슷한 의견이겠지만 개인적으로는 재배 면적이 감소할 것으로 예상된다. 그렇다면 양파를 재배해서 돈을 많이 벌려면 어떻게 해야 할까? 만약 필자가 양파를 재배하는 사람이라면 내년 초에는 양파를 심고, 그 다음해에는 양파가 아닌 다른 작물을 재배하고자 할 것이다. 물론 이 모든 것은 양파의 가격에 미치는 요인으로 생산량과 직접적인 영향을 가지는 재배면적만을 고려했을 때의 이야기다.

양파 외에도 마늘, 고추 등과 같은 농작물의 가격 파동은 매년 다양한 매체를 통해 자주 접할 수 있는 사례기도 하고, 정말 이상하리만큼 매년 반복되는 현상이기도 하다. 앞서 우리가 예상했던 다음 문장을 다시 한 번 생각해보자.

“내년도 양파 재배면적은 아마 줄어들 것이다.”

우리는 어떻게 이런 결론을 내릴 수 있었던 것일까? 그 이유는 단순하다. 두 기사를 통해 과거의 수치를 보니 격년으로 재배 면적이 증가와 감소를 반복하는 것을 확인했다. 가격은 그와 반대 방향으로 감소와 증가를 반복하는 것 역시 확인했다. 우리는 두 기사에 나타난 데이터를 보아하니 앞으로도 그렇게 반복될 것이라는 생각을 한 것이다. 이런 추론 과정은 우리 일상생활에서도 아주 자연스럽게 이뤄질 뿐만 아니라 물류 및 SCM 현장에서도 아주 중요한 역할을 하고 있다.

데이터 분석은 ‘과거의 사실을 통해서 앞으로도 이와 유사한 형태의 결과가 나타날 것’이라는 가정에서 출발한다. 이후 과거를 통해 수요, 가격, 공급량과 같은 미래의 현상을 예측(Prediction)하거나, 새로운 이벤트에 대한 결과를 분류(Classification)하는 방법을 활용하게 된다. 가령 정확한 재배 면적을 예상하는 것은 예측이다. 면적이 증가할 것인지 감소할 것인지 둘 중 하나를 택하게 된다면 분류의 대상이 된다.

공급사슬 계획의 시작은 ‘수요 예측’부터

이 글을 읽으시는 분들은 갑자기 뜬금없이 무슨 양파 이야기인가 할 수도 있겠다. 그러나 앞서 이야기한 것은 수요 예측이라는 영역에서 이루어지는 추론 과정과 그 사이에서 발생하는 여러 가지 한계점을 보여주는 대표적인 사례라고 할 수 있다.

그렇다면 공급사슬 운영 계획 수립과 실행이라는 관점에서 수요 예측은 어떤 의미를 가질까? 일반적으로 공급사슬관리(Supply Chain Management; SCM)를 구성하는 대표적인 활동과 의사결정을 구매(Buy), 생산(Make), 운송(Move), 저장(Store), 판매(Sell)의 다섯 가지로 구분한다.

이 다섯 가지 활동은 공급사슬 상에서 재화(Material), 정보(Information), 자금(Monetary)의 이동 방향과 규모를 결정한다. 많은 사람들이 공급사슬의 상류에서부터 하류까지 이동의 시작은 원자재의 구매(Buy)를 통해 이루어진다고 생각할 수 있겠지만, 이는 공급사슬 계획 실행의 첫 단계이다. 실제 재화의 이동을 결정하기 위해서는 누구로부터 얼마만큼의 원자재나 부품을 구입할 것인지 계획을 수립해야 하는데, 그 단계는 공급사슬의 하류에서부터 상류로 흐르게 된다. 다시 말하자면 시장으로부터 제품이나 서비스가 얼마나 소비될 것인지를 예측하고, 그 결과를 바탕으로 판매와 저장, 생산, 구매 계획이 수립된다. 따라서 공급사슬운영의 계획을 수립하는 첫 번째 단계는 바로 시장 수요를 예측하는 것이라 할 수 있다. 수요 예측은 비단 공급사슬의 운영 계획을 수립하는 과정뿐만 아니라 시장을 대상으로 하는 모든 비즈니스 영역에서의 계획을 수립하는 첫 번째 단계라고 볼 수 있다.

가까운 미래부터.. 단기 수요 예측

모든 책이 그런 것은 아니지만 생산운영관리 혹은 공급사슬관리와 관련된 자료에서 수요 예측 기법으로 가장 첫 번째로 안내하는 방식이 바로 이동평균법(Moving Average)과 지수평활법(Exponential Smoothing)이다. 실제로 주식 시장에서도 미래 주가를 예측하기 위해서 주로 사용하는 법이 바로 이동평균법이다. 주식 차트에서 볼 수 있는 ‘이평선’이라고 부르는 것이 바로 이동평균을 기록한 것이다. 개인적인 경험으로는 실제 현장에서 실무를 담당하시는 분들에게 미래 수요를 예측하기 위해서 어떤 방법 사용하는 지 질문하면 대부분 이동평균법이라고 대답한다. 그 이유는 가장 간단한 방법이며, 제법 잘 들어맞기도 하기 때문일 것이다. 다음 수식은 구간이 w일 때의 이동평균을 계산하는 식이다.

위의 수식은 미래 수요 (F^t+1)와 이전 w 기간 동안 수요(Y^i)의 평균과 같음을 의미한다. 실제로 구간을 3(w=3)년으로 설정했을 때 양파의 평균 도매가에 대한 이동평균을 계산한 결과는 아래 그림과 같다.

2010년부터 2012년까지는 어느 정도 비슷한 수준의 가격을 보이지만, 그 이후부터는 정확도가 떨어지는 모습이다. 실제로 2010년부터의 예측 도매가(이동평균)와 실제 도매가의 차이는 평균 26.5%의 오차를 보이고 있어 좋은 성능을 보인다고 말할 수 없다. 앞의 양파 가격이 2016년 초반에는 1600원을 초과하였으나, 실제 9월 기준으로는 800원대 중반에 형성되었다는 점을 감안하더라도, 2017년의 예측치 1091원이 어느 정도 정확하게 예측한 값이라고 할 수는 없을 것이다.

이동 평균법이 가진 강점은 계산하기 쉽고, 최근의 변화 추세(Trend)를 적극적으로 반영할 수는 있다는 점이다. 그러나 이동평균을 계산하기 위한 기간을 벗어나는 이전 시점의 수요는 반영할 수 없다는 한계가 존재한다. 이러한 한계점을 보완할 수 있는 방법이 ‘지수 평활법’이다. 지수 평활법을 이용한 미래 수요를 예측하는 식은 아래와 같다.

위 수식은 이동평균과는 달리 이전 시점의 예측 수요와 실제 수요와의 차이를 예측 수요에 일부 반영하여 보정하는 형태를 보인다. 알파(a)값을 0.15로 지정하였을 때의 도매가격에 대한 수요 예측 결과는 아래 그림과 같다.

이동평균에 비해 과거 수요를 더욱 잘 반영할 수는 있지만, 그만큼 최근의 추세를 반영하기는 어렵다. 따라서 수요가 최근 급격한 변화를 겪고 있거나 과거 시점보다는 최근의 추세를 반영하는 것이 더욱 적합할 때는 이동평균을 사용하는 것이 좋고, 그 반대의 경우라면 지수평활법을 사용하는 것이 더욱 적합하다.

그런데, 여기서 반드시 짚고 넘어가야할 부분이 있다. 두 가지 방법이 공통적으로 가진 한계점인데, t+1 시점부터의 수요는 모두 t+1 시점과 동일함을 가정한다는 것이다. 다시 말해 2016년과 2017년 가격을 예측했다면, 2018년, 2019년 모두 2017년과 동일하다고 가정하는 것이다. 물론 지수평활법 중에 추세(trend)와 계절성(seasonality)을 고려하는 모델이 있기는 하지만 기본적인 가정은 동일하다. 바로 이 한계점 때문에 이동평균법과 지수평활법은 단기적 수요를 예측하는 데 더욱 적합하다고 할 수 있다.

중장기적 수요 예측은 모델을 기반으로...

그렇다면, 상대적으로 지금보다 먼 미래의 수요를 예측하기 위해서는 어떤 방법이 있는지 살펴보자. 우선 앞서 이야기한 이동평균법과 지수평활법은 모두 과거 수요 데이터를 기반으로 미래수요를 예측하는 기법이다. 데이터 역시 ‘시간’과 ‘수요’ 두 가지뿐이다. 이러한 데이터를 시계열(Time Series) 데이터라고 부른다. 시계열 데이터를 통한 수요 예측은 과거 데이터로부터 추세와 계절성, 혹은 일정한 패턴을 찾아서 미래 수요를 예측하는 방법이다. 즉 데이터에 기반한 방법이라고 할 수 있다. 그런데, 상대적으로 먼 미래에는 바로 직전 수요를 의미하는 데이터를 확보할 수 없기 때문에 중장기적 수요 예측에는 적합하지 않다.

데이터 기반의 예측(Data Driven Prediction) 기법과는 달리 수요라는 종속변수와 독립변수 사이의 함수관계를 통해 수요를 예측하는 모델 기반의 예측(Model Driven Prediction)이 존재하며, 중장기적 수요 예측을 위해 주로 사용된다. 요즘을 빅데이터 시대라고 부른다. 우리가 필요로 하는 데이터는 어떠한 방법을 통해서라도 구할 수 있는 시대라는 의미다. 따라서 과거 수요 외에도 수요를 예측하기 위해 다양한 데이터를 확보할 수 있다면, 중장기적 수요 예측에는 모델 기반의 예측 기법이 더 적합하다 말할 수 있다.

앞의 양파 도매가를 예측한 문제에서는 양파의 평균 도매가격이 종속변수, 즉 예측의 대상이 되는 변수가 된다. 그렇다면 독립변수는 어떤 것이 있을까? 앞선 데이터에서는 ‘재배면적’이 적합한 대안이 될 수 있다. 다음 그림은 재배면적과 평균 도매가를 기준으로 산점도를 그리고 그 위에 추세선(trend line)을 1차식(붉은선)과 3차식(파란색 곡선)을 통해 표현한 결과이다.

만약 미래의 재배면적을 알 수 있다면 추세선의 함수를 통해 그 해 평균 도매가를 예측할 수 있다. 추세선은 1차식에서부터 지수, 로그, 다항 함수 등을 이용할 수 있다.

그렇다면 재배 면적 외에 다른 요인은 어떤 요인을 독립변수로 추가할 수 있을까? 많은 사람들이 지금 머릿속에 떠올릴 만한 것이 바로 ‘수확량에 영향을 미치는 요소’일 것이다. 수확량은 시장에 공급되는 양파의 양을 의미하고, 양파 소비량은 제한적이며, 가격은 수요와 공급의 법칙에 의해 결정될 것이니까 말이다. 수확량에 영향을 미칠만한 요소로는 평균 온도, 강수량, 태풍의 여부, 일조량 등과 같이 날씨와 관련된 요인을 떠올릴 수 있다. 평균 온도와 일조량을 포함한다면 평균 도매가(Y)는 재배면적(X1), 평균 온도(X2), 일조량(X3)이 변수로 포함되는 함수에 의해 결정될 것이다. 만약, 그 함수가 다음과 같이 일차선형결합의 형태를 가진다면, 우리는 이 수요 예측 모형을 다중선형회귀(Multiple Linear Regression)라고 부른다. 또 각 변수 앞의 계수(parameter)를 조정함으로써 최적의 모델을 얻을 수 있다.

다중선형회귀

가까운 미래이든 중장기적 미래이든 상관없이 재배면적과 평균온도, 일조량의 값을 알 수 있다면 우리는 평균 도매가를 예측할 수 있게 된다. 이러한 선형회귀식 외에도 인공신경망(Artificial Neural Network) 기법과 같은 다른 여러 가지 방법이 사용될 수 있다. 항상 어떤 방법이 더 높은 정확도를 보인다고 말할 수는 없다. 더 중요한 것은 어떤 변수를 포함시키느냐이다.

앞서 우리가 예측하고자 하는 변수를 종속변수, 그리고 예측에 활용되는 변수를 독립변수라고 불렀다. 재배면적, 평균 온도, 일조량이 독립변수가 되는데, 여기서 주목해야 할 단어는 바로 ‘독립(Independent)’이다. 변수가 서로 독립이라는 의미는 변수들끼리의 상호 연관성이 없어야 한다는 의미이다. 실제 현장에서 서로 관련없는 변수를 찾는 것은 불가능하다고 볼 수 있겠지만, 가능한 변수 서로 간 정보의 중복을 최소화할 수 있어야 한다. 만약 비슷한 형태를 보이는 변수를 동시에 독립변수로 포함시킬 경우 특정 변수에 의해 수요가 결정되는 왜곡된 모형이 개발될 가능성이 크다.

그렇다면 수요 예측을 위해 필요한 독립변수는 어떻게 찾을 수 있을까? 적절한 독립변수의 집합을 구성하는 교과서적인 방법이 무엇이냐고 질문한다면 본인은 그 즉시 “없다”라고 답할 것이다. 그만큼 예측의 목적과 데이터의 특성에 따라 변수는 매번 달라지기 때문이다. 그래도 한 가지 추천할만한 방법은 “사람을 먼저 이해하려고 노력하라”는 것이다. 수요 예측은 “우리 제품이나 서비스가 특정 기간 동안 시장에서 얼마나 소비될 것인가?”라는 질문에 답을 하는 것을 의미하기 때문에 데이터가 아닌 모델 기반의 예측 기법을 활용한다면 고객이 어떠한 성향을 가지는 지, 고객은 언제 우리의 제품과 서비스를 주로 이용하는 지 이해하는 데서 출발하는 것이 적합하다.

흔히들 우리나라 국가대표 축구팀이 저녁 8시에서 9시 사이에 경기를 가진다면 “오늘도 치킨집은 불티나겠구나”라고 이야기한다. 비가 오는 날이면 자장면보다는 짬뽕이, 칼국수가, 파전과 막걸리가 더 잘 팔리는 것과 같은 맥락이다. 과거 고객의 행동으로부터 패턴을 찾아가고, 그 패턴으로부터 필요한 변수를 도출하는 것이 가장 적합한 방법이 아닐까 한다.

정확한 예측은 없다, 조금만 덜 틀려보자

지금까지 수요를 예측하는 방법을 아주 간단한 예제를 통해 살펴보았다. 많은 시간과 노력을 투자해서 아주 좋은 독립변수의 조합을 구성하고, 충분한 데이터를 확보한다면 지금보다는 더 정확하게 미래를 예측할 수도 있다.

주의해야 할 점은 “더 정확하게 예측할 수 있다”가 아니라 “더 정확하게 예측할 수도 있다”라는 점이다. 아무리 많은 데이터를 모으더라도, 아무리 정교한 모델을 만들더라도 어떤 누구도 미래를 정확하게 예측할 수는 없는 법이다. 오히려 우리가 확보한 데이터를 맹신하고, 그 데이터에만 꼭 맞는 모델을 개발한다면 오히려 미래 수요를 예측하는 데 실패할 가능성이 높아진다. 이러한 현상을 과적합(Over-fitting)이라고 하는데, 이 문제를 회피하기 위해서는 무조건 더 잘 맞히려 노력하기 보다는 조금 덜 틀리려고 노력하는 것이 중요하다.

신광섭

현재 인천대 동북아물류대학원 부원장으로 재임 중으로 물류 및 SCM 분야에서 빅데이터 및 인공지능 활용 방안을 연구 중이다. ksshin@inu.ac.kr

다음 읽을거리

Menu 2

[신광섭의 데이터바로보기] SCM의 시작 수요예측, 양파처럼 까보기

[차이나 리포트] 중국 요식업계, B2C 아닌 B2B 성장동력으로

[Be a Demand Planner ③] "모든 수요가 이익은 아니다" 수요에 존재하는 우선순위

[Be a Demand Planner ②] “정확하지 않지만 합리적이다?” 수요예측은 대체 왜 필요한가

[Be a Demand Planner ①] 수요관리 프로세스의 기본 개념