'국내 최초' AI기반 음성통화 문자변환 서비스 출시
B2C외 회의 내용 기록 B2B 서비스로 보폭 확장
중국 버전인 ‘수지바오(Sujibao)’ 출시로 글로벌화 준비

리턴제로 이참솔 대표.[사진=리턴제로]
리턴제로 이참솔 대표.[사진=리턴제로]

[K글로벌타임스] 리턴제로(대표 이참솔)는 국내에서 최초로 통화 음성을 문자로 변환해 주는 서비스를 출시한 스타트업이다. 음성을 단순히 문자로 변환하는 것을 넘어 통화 내용을 검색하고 부분 재생 기능도 갖추는 등 기술 고도화에 성공했다. 이를 넘어 최근에는 비즈니스 환경에서도 활용이 가능한 회의록 작성 서비스를 출시, 인공지능(AI)업계 떠오르는 기업으로 주목받고 있다.

 

카카오 박차고 나온 자신감, '말하면 받아적는 AI' 현실화

음성을 AI로 인식해 문자로 변환해 주는 앱 '비토' 서비스 화면.[사진=리턴제로]
음성을 AI로 인식해 문자로 변환해 주는 앱 '비토' 서비스 화면.[사진=리턴제로]

리턴제로를 설립한 이참솔 대표는 한국과학기술원(KAIST) 동기인 정주영 현 리턴제로 최고기술책임자(CTO) 등과 지난 2010년 로티플이라는 모바일커머스 회사를 공동설립했다. 

로티플은 당시 소프트뱅크의 투자를 받을 정도로 기대감이 높은 기업이었으나, 당시 시장상황과 맞지 않았다. 결국 로티플은 카카오 1호 인수기업으로 이름을 올렸다. 그 과정에서 이 대표는 설립자들과 함께 카카오에 둥지를 새로 틀었다.

카카오에 합류한 이후 초기 서비스 개발에 힘을 보태며 국내 최대규모 정보기술(IT)기업으로 성장하는 데 기틀을 마련했다. 안정적인 직장인으로 위치가 바뀐 그는 그럼에도 비즈니스에 대한 열망이 사그러들지 않았다.

결국 2015년 퇴사 이후 3년 여의 공백기를 거쳐 1차 창업 멤버들과 다시 의기투합, 2018년 리턴제로를 설립하며 두번째 도전에 나섰다.

당시 알파고로 대표되는 인공지능(AI) 산업이 큰 주목을 받았고, 이 대표 역시 AI와 관련된 사업모델을 구상해 나갔다.

리턴제로의 보이는 통화 앱 '비토'.[사진=리턴제로]
리턴제로의 보이는 통화 앱 '비토'.[사진=리턴제로]

연구 끝에 지난 2020년 3월 개발해 낸 것이 눈으로 보는 통화 앱 '비토(VITO)'다. 비토는 전화 통화 내용을 실시간으로 문자로 출력하는 기술이 적용된 프로그램이다. 통화 음성을 실시간에 가까운 속도로 바꾸는 기술은 국내 최초였다.

아주 오래전 통화한 내용도 볼 수 있는 검색기능과 부분 재생 기능도 갖추면서 AI업계에서 단번에 떠오르는 기업으로 시선을 사로잡았다.

비토는 하루평균 2만 시간 넘게 통화 소리를 문자화하고, 누적 처리건수도 2억건을 넘어섰다. 출시 3년 여 만에 엄청난 성과를 거둔 것이다. 빠른 성장세와 더불어 무섭게 쌓이는 방대한 데이터는 곧 리턴제로의 경쟁력으로 자리잡았다.

이 대표는 "사용자 증가에 따라 더 많은 데이터를 확보하면 AI가 이를 학습해 서비스 고도화로 이어지는 데이터 선순환 구조가 형성된다"며 "타사와 달리 인터넷망이 아닌 통신망을 이용하기 때문에 더욱 안정적인 통화를 제공하는 것도 경쟁력"이라고 설명했다.

 

B2C 서비스 '전격 무료화', B2B로 수익흐름 이동

지난해 2월 B2C 전격 무료화를 선언한 리턴제로는 B2B를 새로운 수익모델로 설정했다.[사진=리턴제로]
지난해 2월 B2C 전격 무료화를 선언한 리턴제로는 B2B를 새로운 수익모델로 설정했다.[사진=리턴제로]

리턴제로는 기업과 고객(B2C) 서비스로 분류하던 비토를 구독 형태로 운영해 왔다. 그러나 지난해 2월 이를 전격 무료로 전환하면서 승부수를 띄웠다.

비토는 월 1만원 정도의 구독료를 내면 무제한으로 사용하는 방식의 구독모델을 도입해 수익을 올리는 구조였다. 그러나 리턴제로는 B2C시장의 크기가 제한적인데다 성장에도 한계가 있다고 판단했다. 비토의 전면 무료화는 이러한 상황 속 새로운 시장을 개척하겠다는 경영진의 의지표현이나 다름 없었다.

게다가 비토 출시 이후 네이버 '클로바'를 필두로 공룡기업들의 유사서비스가 대거 등장하면서 경쟁이 심화된 점도 새로운 수익모델 발굴을 위한 동기로 작용하기 충분했다.

리턴제로는 기술력을 그대로 활용하되 비즈니스모델을 전환하는 방식으로 돌파구를 찾았다. 최근 회의 내용을 자동으로 기록해주는 기업 전용(B2B) 서비스 ‘콜라보(CALLABO)’를 정식 출시하며 B2B시장에서 본격적인 승부수를 띄운 것이다. 

콜라보는 한마디로 화상회의를 아카이빙하고 보기 좋은 형태로 회의록을 만들어내는 솔루션으로 정의할 수 있다. 회의나 인터뷰 등 비즈니스 관련 업무 기록에 최적화된 기술력을 제공함으로써 최근 보편화된 온라인 원격회의 환경에도 대응할 수 있는 프로그램을 탑재했다.

리턴제로는 B2B서비스 '콜라보'를 통해 화상회의 등 변화하는 비즈니스 환경에 대응하는 음성인식 서비스를 제공하고 있다.[사진=픽사베이]
리턴제로는 B2B서비스 '콜라보'를 통해 화상회의 등 변화하는 비즈니스 환경에 대응하는 음성인식 서비스를 제공하고 있다.[사진=픽사베이]

오프라인 미팅에서도 정확도 높은 텍스트 변환 기능을 지원하고, 구글 밋(Meet)과 줌(Zoom) 등 화상회의 플랫폼과 연동할 수 있도록 편의성을 높였다.

구글 캘린더와 콜라보를 연동하면 캘린더에 등록된 온라인 화상회의 진행 시 자동으로 미팅이 녹화된다. 녹화된 내용은 회의 종료 후 30초 내외로 텍스트 변환돼 영상과 함께 한눈에 확인할 수 있다. 

회의 내용은 참석자 개개인의 목소리를 분류해 텍스트로 변환해 비즈니스환경에서 빠르고 간편하게 활용케 했다. AI를 활용해 참석자 별 발언 비율도 기록하는 등 비즈니스 환경에 적합한 편의 기능을 두루 제공해 수월한 업무처리를 돕는 역할을 한다.

크롬 확장 프로그램과 안드로이드 및 iOS 모바일 앱 출시로 서비스 채널을 확대해 공간제약이라는 장벽을 빠르게 허물며 B2B 시장을 빠르게 선점해 나가고 있다.

 

전문분야 및 해외시장 공략, 글로벌 플레이어 자리매김 포부

중국어 기반 AI음성인식 앱 '수지바오'.[사진=리턴제로]
중국어 기반 AI음성인식 앱 '수지바오'.[사진=리턴제로]

국내에서는 아직 AI를 통한 음성인식이 제한적으로 사용되고 있다는 것이 리턴제로의 판단이다. 해외의 경우 일반 세일즈를 비롯해 변호사, 경찰 수사를 비롯해 기자의 인터뷰 녹음 등 다방면에서 AI 음성인식이 활용되고 있는 상황이다.

리턴제로는 이 같은 해외 시장의 사례를 참고한 결과 국내 역시 다양한 분야에서 AI 음성인식이 사용될 것으로 판단하고 있다. 이를 대비하기 위해 다양한 분야의 전문언어를 딥러닝해 활용처를 다각화한다는 계획이다.

이미 기술력에 의문부호는 지워졌다. 카카오벤처스, 하나벤처스 등 굴지의 벤처캐피탈(VC) 등이 단행한 198억원의 투자액이 기술력의 우수성을 말해주고 있다.

어쩌면 리턴제로의 기술력을 활용하기에는 국내시장이 좁을 수도 있다는 평가까지 나올 정도다. 지난해 7월에는 세계적인 인공지능(AI) 기반 음향 이벤트 및 장면 인식 기술 경진대회 ‘DCASE Challenge 2022’에 참여해 우수한 성적을 거두기도 했다.

리턴제로는 이 같은 기술력에 걸맞는 더 큰 시장에 나가기 위한 준비작업도 이어가고 있다. 이미 지난해 비토의 중국 버전인 ‘수지바오(Sujibao)’를 출시하며 중화권 시장에 도전장을 내밀었다. 영어, 일본어 등 수요가 많은 언어 위주로 시장을 선점해나갈 계획이다. 또 동남아 일부 국가까지 진출을 염두에 두고 있다.

이참솔 대표는 "음성인식 모델이 한국어는 물론, 해외 다른 언어로도 확장이 용이하다는 것을 입증했다"며 "국경을 넘어 세계 곳곳에서 유용히 사용될 수 있도록 기술고도화와 개발을 이어갈 것"이라고 말했다.

[K글로벌타임스 김동현 기자] [email protected]

관련기사

저작권자 © K글로벌타임스 무단전재 및 재배포 금지