TECH

[챗봇이 뜬다① IT편] 챗봇 기술의 현재, 심심이 아닌 ‘사만다’ 다가올까

by 임예리 기자

2017년 01월 10일

<기획연재> 챗봇이 뜬다① IT편페이스북, 구글, 애플이 함께 경쟁하고 있는 챗봇판, 국내 기술 현황은?핵심기술 자연어, 알파고의 딥러닝... 챗봇에 활용된다면아직까진 대두되는 기술의 한계, 앞으로를 기대하며

Idea in Brief
최근 유통, 금융 등의 분야에서 ‘챗봇(Chat bot)’이 주목받고 있다. 페이스북과 텐센트는 자사의 메시지 프로그램에 챗봇 서비스를 도입했고, 국내에서는 NH농협은행이 금융업무를 상담해주는 ‘금융봇’을 론칭했다. 카카오는 지난해 11월 15일 ‘비즈니스 컨퍼런스’를 통해 챗봇 개발에 집중하겠다는 계획을 밝히기도 했다. 챗봇은 특히나 고객응대(CS) 분야에서 상담원 활용에 비해 비용·시간적인 효율이 높다고 여겨지고, 향후 포탈 검색창의 자리를 대신할 것이라는 전망도 나오고 있다. 그렇다면 현재 챗봇 기술은 어느 정도까지 왔으며, 앞으로 어디까지 발전할 수 있을까.


챗봇(Chat bot)은 말 그대로 ‘채팅(Chatting)’과 ‘로봇(Robot)’의 합성어로써 사람처럼 대화(채팅)하는 로봇을 의미한다. 사실 챗봇 이전에도 채팅 상담은 존재했다. 그런데 왜 이제야 다시금 ‘채팅’이 주목받고 있을까. 카카오톡에 적용된 채팅상담 솔루션 ‘해피톡’의 개발사 엠비아이솔루션 김범수 이사(COO)는 그 이유를 “음성이 미처 전달해줄 수 없는 정보들을 채팅 커뮤니케이션을 통해서 전달할 수 있기 때문”이라 설명했다.

 

택배에 ‘챗봇’이 도입된다면

 

택배를 예로 들어보자. CJ대한통운, 한진, KG로지스 등 복수 택배사에 따르면 고객이 배송기사에게 전화로 가장 많이 묻는 질문은 “내가 주문한 택배가 언제 도착하냐”이다. 하지만 하루에 처리해야 할 물량이 200개에 달하는 택배기사는 자신의 트럭에 해당 물건이 실렸는지 그때그때 확인하기 어렵다. 이때 고객에게 채팅을 통해 도착시간 등에 대한 정보를 제공한다면 고객응대 효율이 높아질 것이라는 게 엠비아이솔루션의 설명이다.

 

김 이사는 “엠비아이솔루션 자체 조사에 따르면 고객이 택배를 직접 수령하는 비율은 20%가 채 되지 않았다”며 “고객이 정말로 알고 싶어 하는 것은 ‘정확한 도착시간’이라 추정할 수 있다”고 밝혔다.

 

물론 채팅을 통해 제공되는 정보가 정확하려면 정확한 기반 데이터가 필요하다. 택배의 경우를 예로 들자면 이는 ‘배송기사의 위치’나 ‘배송단계별 화물의 위치’ 등이 될 것이다. 엠비아이솔루션은 인공지능(AI)과 딥러닝(Deep Learning) 기술을 활용해 배송기사의 경로를 추적해 택배 도착시간을 예측하고, 택배문의가 들어왔을 때 챗봇을 통해 자동응대 하는 기술 개발에 집중할 계획이다.

 

물론 채팅이 기존 전화상담을 대체한다고 해서 물리적인 상담 시간이 줄어드는 것은 아니다. 그러나 전화상담의 경우 한 상담원이 한 고객의 응대를 하는 것만 가능하지만, 채팅 상담은 전화상담에 비해 훨씬 많은 고객 상담을 동시에 처리할 수 있다.

 

김 이사는 “음성상담이 100m 달리기 선수라면, 채팅 상담은 동시에 수십 명이 달리는 것과 같다”며 “지금은 채팅 응대가 전화 상담보다 느릴 수 있지만, 자연어 인식기술과 함께 챗봇 응대가 가능해진다면 현재의 상담 구조가 순식간에 바뀔 것”이라 강조했다.

 

챗봇의 시작 ‘심심이’, 핵심기술 ‘자연어’

 

챗봇은 인공지능을 기반으로 한 채팅 서비스로 알려져 있다. 인공지능이란 말을 얼핏 들어선, 지난해 이세돌 9단과의 바둑 경기로 화제를 몰았던 인공지능 프로그램 알파고(AlphaGo)를 떠올릴 수 있겠다. 하지만 챗봇은 알파고 이전부터 우리 근처에 있었다. 2002년 론칭한 채팅 서비스 ‘심심이’가 대표적인 예다.

 

물론 심심이가 ‘인공지능’ 기반의 시스템은 아니다. 심심이 운영에 바탕이 된 기술은 ‘키워드 매칭(Keyword Matching)’에 가깝다. 사용자가 심심이에게 여러 가지 표현을 보내면 심심이는 사용자의 말 안에서 키워드를 파악해 그에 해당하는 내용을 답변 형식으로 내보내는 식이다. 키워드 매칭의 특징은 기본적으로 질문에 대한 답변이 이미 정해져 있다는 것이다. 만약 같은 질문을 했음에 불구하고 다른 답변이 나온다면 이는 사전에 이미 입력시켜놓은 답 중 하나를 챗봇이 골라 답한 것이다.

 

심심이에 내장된 또 다른 기술은 ‘자연어 처리(NLP: Natural Language Processing)’다. 자연어 처리란 한 언어의 형태소 분석이나 고정밀 구문분석을 바탕으로 한 담화분석, 정보추출, 정보요약 등의 기술을 포함한 개념으로, 인간의 언어를 컴퓨터가 이해할 수 있는 형태로 만드는 기술이라 할 수 있다. 가령 한국어의 경우, ‘좋아하다’와 ‘좋아하니’는 어미의 형태에 따라 그 뜻이 달라진다. 때문에 어미를 떼어낸 뒤 품사 분석이나 기본형 동사를 추출하는 과정이 이에 해당한다. 따라서 심심이는 자연어 처리 기술을 활용한 챗봇의 1단계라고 할 수 있다.

사진= 기자와 심심이와의 대화. 단문의 질문 속에서는 키워드를 찾아 그와 관련된 말로 답을 했지만, 어려운 질문에는 제대로 답하지 못하는 모습이다.

 

자연어 처리에서 발전한 것이 자연어 이해(NLU: Natural Language Understanding) 기술이다. 해당 기술은 이미 앞 단계의 자연어 처리 능력을 포함하고 있다. 여기에 더해 품사 분석에서 끝나는 것이 아니라 해당 단어가 장소인지, 시간인지, 사람인지, 물건인지 혹은 메뉴인지 등을 분석할 수 있다.

 

즉, 사용자가 내뱉는 단어의 품사를 분석한 뒤 그것이 가진 특성을 뽑아내는 것에 의미가 있는 작업이다. 이는 알고리즘이나 딥러닝(Deep Learning), 혹은 데이터베이스(Data Base)와도 연계될 수 있다. 고객이 “A를 주문해줘”라고 말했을 때, A가 상품인지 인식하고 상품 데이터베이스를 조회해 그 안에 A가 있다면, 그 상품이 ‘어느 제조사의 어떤 상품이다’를 인식하는 식이다.

 

쇼핑몰의 진화로 바라보는 챗봇의 발전

 

하지만 현재 국내에서는 자연어 이해는커녕 ‘자연어 처리’ 기술조차 고도화되지 않은 상황이다. 쇼핑몰의 발전 과정을 그 예로 들어본다. 2000년대 초반 ‘1세대 쇼핑몰’들은 일단 포탈 혹은 자사몰에 상품을 올려놓고, 최대한 많은 고객을 끌어들여 상품을 구매하도록 유인했다. 사이트에 들어온 고객은 일정한 확률로 상품을 구매하기 때문에 결국 고객의 구매율은 방문율과 비례하는 것이 일반적이었다. 자연히 업체는 고객 방문율을 높이기 위한 광고에 많은 투자를 했다.

 

그러던 것이 2000년대 중후반 아마존처럼 고객이 과거 어떤 상품을 샀는지 분석해 해당 고객이 살만한 상품을 추천하는 고객 맞춤형 쇼핑몰이 나타났다. 현재 국내 소셜커머스업체 티켓몬스터 역시 동일한 방법을 활용하는 것으로 알려져 있다. 이를 ‘2세대 쇼핑몰’이라고 말할 수 있다.

 

그렇다면 현시대 3세대 쇼핑몰은 어떨까. 3세대 쇼핑몰은 2세대에서 진화한 형태로 고객이 한 상품을 계속 검색하거나, 열람하고 있으면 채팅창이 나와 쿠폰을 지급하거나 상품 정보에 관한 내용을 알려주고 상담하는 방식이다.

 

하지만 유입되는 고객이 많아질수록 위 모든 과정을 사람이 직접 수행하기는 어렵다. 따라서 3세대 쇼핑몰에서 등장하는 채팅창은 사람이 직접 고객에게 말을 거는 것이 아니라 고객이 페이지에 머무르는 시간 등을 고려해 그에 맞는 ‘챗봇’이 등장하는 개념이다. 고객은 온라인에서 쇼핑을 하고 있지만, 챗봇을 통해 마치 오프라인 매장에 있는 것과 같은 느낌을 받을 수 있다. 물론 이를 위해서는 챗봇이 고객의 의도를 이해하고, 이후 상황에 맞는 시나리오를 바탕으로 움직일 필요가 있다.

사진= 네이버 쇼핑에서 활용되는 네이버 톡톡. 고객은 네이버 톡톡을 통해 실시간으로 판매자에게 주문이나 상품에 대해 문의할 수 있다. 현재는 상담원이 직접 대화를 하지만, 향후 챗봇이 도입될 예정이다.

 

현재 국내에서 나온 대표적인 챗봇 서비스로 인터파크의 ‘톡집사’, NH농협의 ‘금융봇’, 머니브레인의 ‘얌얌’ 등이 있다. 위 서비스의 공통적인 특징은 기본적인 대화가 ‘메뉴’의 형태로 진행된다는 것이다. 이는 한국의 ‘자연어 처리’ 기술이 아직 일정 궤도에 오르지 못했기 때문이다. 따라서 챗봇을 이용하는 고객은 정해진 메뉴 안에서 어떤 서비스를 받을지에 대한 답을 고르는 경우가 대부분이다.

 

주문배달 챗봇 ‘얌얌’의 대화관리(DM)

 

대화관리(DM: Dialogue Management) 기술 역시 챗봇에 활용될 수 있다. 대화관리 기술은 사용자의 상황에 따라 다양한 문맥을 처리할 수 있다. 하지만 현재 대화관리 기술은 전 세계적으로 보아도 ‘일문일답’ 수준에 그치고 있다는 평가다. 가령 업계에서 가장 뛰어나다고 평가받는 애플의 시리(Siri)조차 하나를 물어보면 하나만 대답하는 것에 그쳐 사람과 대화하는 수준에는 미치지 못하고 있다.

 

최근 출시된 주문배달 챗봇 서비스 ‘얌얌’으로 주문을 한다고 가정해보자. 사용자가 얌얌에게 ‘햄버거’라고 하면, 얌얌은 자연어 이해를 통해 사용자 근처에 있는 햄버거 가게를 찾아내고, 메뉴를 사용자에게 제공한다. 그런데 갑자기 사용자가 햄버거가 아닌 피자가 먹고 싶어져 ‘안 먹을래, 피자 먹을래’라고 채팅창에 입력한다. 이때 얌얌이 사용자의 의도 변화를 이해하고 자연스럽게 근처 피자가게를 안내하는 것이 대화관리 기술이다. 하지만 자연어 처리와 마찬가지로 의도 분석(Intent Analysis) 역시 하나의 명령어에 한해서만 사용자의 의도를 파악하는 수준에 머물러있다.

사진= 주문 배달 챗봇 서비스 얌얌과의 대화. 메뉴에 따라서 챗봇이 주문 과정을 전개한다. 갑작스러운 요구를 하면 알아듣지 못한다.

 

얌얌 개발사 ‘머니브레인’의 장세영 대표는 “현재 국내 챗봇 기술 수준은 자연어 처리를 기반으로 발전해가는 상태”라며 “얌얌의 경우 메뉴 선택에 더해 다른 메뉴를 추천하는 등의 추가 대화는 자연스럽게 흘러가지만 고객의 다양한 심리 변화, 가령 방금 한 주문을 취소하고, 다른 메뉴로 바뀐 뒤에, 결제는 카드로 할께라고 하는 식의 복문을 이해하지는 못한다”고 밝혔다. 위와 같은 복문을 해석할 수 있는 챗봇 기술은 아직 전 세계적으로도 구현하기 어려운 상황이라는 게 장 대표의 설명이다.

 

얌얌은 현재 의도분석과 관련해 사용자가 입력한 내용을 인식했을 때, 사용자가 현재 배달을 원하는지 혹은 결재를 원하는지 그 의도를 더 정확히 파악해 그에 맞는 서비스를 실행에 옮기는 챗봇 기술을 연구중이다.

 

장 대표는 “챗봇의 의도분석 능력이 더 올라가고, 음성인식 역시 자연스러워지는 수준까지 도달하기에는 3~5년 정도가 걸릴 것으로 예상한다”며 “그 시기가 도래한다면 콜센터의 상담원을 통한 주문은 모두 챗봇으로 대체될 것”이라 밝혔다.

 

알파고의 딥러닝(DL), 챗봇에 활용된다면

 

딥러닝(Deep Learning) 역시 최근 챗봇에 활용되고 있는 기술 중 하나이다. 가령 상담 콜센터의 경우, 음성으로 저장된 고객 상담 데이터를 텍스트로 전환해 기록할 수 있다. 이 때 챗봇은 딥러닝을 통해 이전까지 모인 사용자들의 상담내역을 분석하여, 고객이 특정 질문을 했을 때 도출할 수 있는 가장 효율적인 ‘답변’을 찾아내는 식이다.

 

얼핏 딥러닝을 인공지능 스스로가 학습한다고 오해하기 쉽지만 사실은 그렇지 않다. 딥러닝은 머신러닝(Machine Learning)의 한 방법으로 최근 주목받는 러닝 알고리즘이다. 딥러닝은 기본적으로 ‘피처(Feature) 추출’, ‘모델링(Modeling)’, ‘러닝(Learning)’의 과정을 거친다.

 

꽃을 구분하는 딥러닝을 예로 들어보자. 꽃에는 장미, 국화, 튤립과 같은 다양한 품종이 있다. 꽃은 품종마다 색깔, 크기, 줄기 등에서 특정 품종만의 특징이 존재한다. 첫 번째 피처 추출은 꽃의 색깔은 무엇인지, 크기는 얼마나 큰지 등 꽃의 특징에 관한 속성을 공학적으로 만드는 것이다. 두 번째 모델링은 꽃의 색깔, 크기, 줄기가 어떤 상태일 때 그 결과가 무엇인지 규칙을 만드는 것을 의미한다. 모델링을 위해서는 당연히 많은 양의 데이터가 필요하다. 데이터는 학습의 재료가 되기 때문이다. 마지막으로 러닝은 실제 결과값을 도출하는 과정이다. 가령 1억 개의 각기 다른 꽃 그림을 인공지능에 입력시켜 통계적으로 러닝한다면 기계는 1억 개의 데이터를 바탕으로 A라는 꽃 그림에 대해 “이것은 98% 확률로 장미”라는 결과값을 도출하는 식이다.

 

즉, 이세돌 9단과 바둑대결을 펼쳤던 알파고는 사실 사람처럼 바둑을 둔 것이 아니다. 기존에 있던 바둑 기보들을 잘 모델링하여 알고리즘을 만들고, 그 알고리즘을 러닝시킨 결과가 알파고다. 알파고가 이세돌 9단과 치른 5번의 대결에서 4승을 할 수 있었던 이유는 알파고의 모델링이 잘 이루어졌기 때문이다. 따라서 알파고는 상대방의 특정수에 특정 방식으로 돌을 놓으면 알파고가 승리할 확률은 얼마나 되는지 자동으로 계산하는 알고리즘이다. 결국 딥러닝은 스스로 생각하는 것이 아니라 상황에 맞는 답변이 무엇인지 확률을 계산하는 것이다.

 

‘심심이’에서 ‘사만다’를 향해

 

영화 <그녀(Her)>에는 ‘사만다’라는 인공지능 운영체제가 등장한다. 사만다는 스스로 생각하고 느낄 수 있으며, 스스로 점점 더 많은 지식을 학습하고, 심지어 주인공과 사랑에 빠지기까지 한다. 인간이 닿을 수 없는 경지에 이른 사만다는 결국 주인공에게 이별을 고하지만 말이다. 이는 단순히 오락용으로 사용되는 ‘심심이’와는 비교할 수 없는 수준인 것은 확실하다. 과연 ‘심심이’는 ‘사만다’로 진화할 수 있을까.

영화 <그녀> 포토 예고편(네이버 영화)

 

현재 한국에서 활용되는 챗봇의 형태는 크게 세 가지가 있다. ‘고객이 대화를 요청했을 때 시나리오에 따라 응대하는 형태’, ‘고객의 행동을 추적해서 그것에 맞는 상황을 시나리오로 응대하는 형태’, 마지막으로 ‘고객의 자연어를 인식해서 응대하는 형태’가 그것이다.

 

현재는 이 세 가지 형태 모두 채팅 플랫폼을 통해서 이뤄진다. 하지만 국내 챗봇 기술은 아직 ‘쇼핑몰 이벤트 문의’, ‘환불 문의’, ‘택배 도착지 변경’ 등과 같은 시나리오 자동응대 형태가 대부분이다. 앞서 설명한 것처럼 아직까지 자연어 인식 기술이 상용화 수준에 도달하지 못했기 때문이다. 그렇기에 챗볼을 통한 자동 응대가 불가능한 상담의 경우 아직 상담원이 대답하는 것이 일반적이다.

 

한 업계 관계자에 따르면 현재 챗봇이 한국어 자연어 단문에 대해서 고객 의도를 인지하는 비율은 70% 정도라고 한다. 수치로 보면 높아 보이지만, 이는 사업용으로 사용하기에는 부족한 수준이다. 참고로 영어의 자연어 인식 비율은 93%에 달한다. 따라서 원활한 챗봇 상담을 위해서는 한국어 자연어 인식 비율이 적어도 90% 이상은 돼야 한다는 것이 업계의 의견이다. 키워드를 분석해 고객의 의도를 파악함과 동시에, 추가로 문장 속에 숨어있는 미묘한 뉘앙스를 해석해야 하기 때문이다.

 

긍정적인 것은 한국 업체의 챗봇에 대한 도전은 한창 진행형이라는 점이다. 네이버가 지난해 10월 인공지능 기반 대화형 인터페이스 아미카(AMICA)를 발표하며 아미카의 자연어처리 API를 공개했고, 카카오 역시 지난해 11월 비즈니스 컨퍼런스를 통해 인공지능과 자연어처리 기술이 결합한 챗봇을 카카오톡에 도입할 것이라고 밝혔다.

 

엠비아이솔루션 김범수 이사는 “현재 챗봇은 영화예매나 제품구매 등 명확한 시나리오가 있거나 인증과정을 처리하는 데 주로 사용되고 있다”며 “하지만 한국에서 자연어 처리리·이해 기술은 이제 막 발전하기 시작한 단계인 것을 고려하면 향후 챗봇의 적용 영역은 법률, 전자상거래 등으로 확장, 발전할 것”이라 전했다.

 

<기획연재>

챗봇이 뜬다① IT편챗봇이 뜬다② 커머스편챗봇이 뜬다③ 택배편



임예리 기자

三人行,必有我师。 페이쓰북




다음 읽을거리
추천 기사

잠시만 기다려 주세요...