애플의 인공지능 비서 '시리'가 이 세상을 더 잘 이해하게 될까. 애플이 인공지능 기업을 한차례 더 인수했다.

애플은 ‘래티스’(Lattice.io)라는 인공지능 스타트업을 최근 인수했다. 이 기업은 데이터 마이닝과 머신러닝 기술을 갖추었는데 비정형 데이터를 처리하는 데 특화한 것으로 알려졌다. 포춘 지는 애플에 인수 사실을 확인했으나 인수 목적에 대해선 듣지 못했다고 전했다. 이번 인수 금액은 1억7천5백만 달러에서 2억 달러 사이로 알려졌다. 

래티스의 홈페이지엔 위 이미지뿐이다. '어두운 데이터'(dark data)의 가치를 연다고 했는데 여기에서 '어두운 데이터'는 비정형 데이터를 뜻한다. 래티스는 비정형 데이터를 정형 데이터로 바꾸는 기술을 갖추었음을 강조하는 문구다.[래티스의 홈페이지엔 위 이미지뿐이다. '어두운 데이터'(dark data)의 가치를 연다고 했는데 여기에서 '어두운 데이터'는 비정형 데이터를 뜻한다. 래티스는 비정형 데이터를 정형 데이터로 바꾸는 기술을 갖추었음을 강조하는 문구다.]


애플이 그동안 인수한 인공지능 기업은 적지 않다. ‘투리’, ‘터플점프’, ‘이모션트’, ‘퍼셉티오’, ‘보컬IQ’, ‘페이스시프트’ 등 꾸준히 사들였다. 애플은 공식적으로 래티스에 대한 평가나 인수 배경을 밝히지 않았으나, 래티스의 전신인 '딥다이브'라는 프로젝트와 창업자의 이력으로 애플을 매료한 포인트를 짐작해보자.

래티스는 스탠포드 대학교의 ‘딥다이브’라는 연구 프로젝트에서 출발했다. 이 프로젝트는 크리스토퍼 리 교수가 이끌었는데 비정형 데이터 관리 시스템을 연구, 개발했다.

래티스의 전신 '딥다이브'[래티스의 전신 '딥다이브']

우리가 흔히 접하는 데이터는 대부분 정돈되지 않았다. 기계가 쉽게 이해하려면 정리 과정이 필요한데 기업이 비즈니스 목적으로 쓸 게 아닌 이상엔 정리되지 않은 채로 남는다. 이를 비정형 데이터라고 하는데 우리 주변엔 정형 데이터보다 비정형 데이터가 더 많다. 시장조사업체 IDC에 따르면 2012년 기준 전세계 디지털 데이터량은 2.8ZB(제타 바이트, 1제타 바이트는 2의 70승 바이트)에 이르렀지만, 유용한 가치를 창출할 것으로 판단된 정형 데이터의 양은 23%, 즉 0.64ZB이다. 2020년에는 디지털 데이터량이 44ZB로 증가하며, 가치 창출이 가능한 정형 데이터는 최대 37%로 그 가치는 4,300억 달러에 이를 것으로 전망했다. 딥다이브는 이러한 대용량의 비정형 데이터를 실생활에 유용하게 쓰이도록 처리하는 기술을 연구했다.

미국 일부 주의 인신 매매 대응 부서가 쓰는 미믹스(memex)가 대표적이다. 미믹스는 웹에 흩어진 정보를 모아 인신 매매범이나 피해자에 관한 정보를 찾는다. 범죄 수사용 검색엔진인 셈이다. 이밖에도 고생물학 정보를 검색할 수 있는 ‘팔리오 딥다이브’, 지질학 관련 정보를 찾을 수 있는 ‘지오 딥다이브’ 등을 개발했다. 모두 구글이나 네이버, 위키백과처럼 정보 탐색용이다.

애플은 래티스를 인수하며 래티스의 멤버인 스무 명의 전문 인력을 확보할 것으로 알려졌다. 이중엔 하둡의 창시자인 마이크 카파렐라가 포함됐다. 카파렐라는 더그 커팅과 함께 ‘하둡'의 전신 격인 오픈소스 웹 크롤러 ‘너치’를 개발했다. 하둡은 빅데이터를 처리하는 오픈소스 소프트웨어 프레임워크로, 빅데이터의 대명사 격이다.

래티스가 창업 햇수로 2년밖에 안 되었음에도 애플이 2천억 원에 인수한 데에는 이러한 배경이 있다.

시리가 ‘잘 모르겠습니다’가 아닌 제대로 된 대답을 하는 그날까지 애플의 AI 기업 인수는 끝나지 않을 것 같다.




<저작권자ⓒ 더기어. 무단전재-재배포 금지.>