국내 인공지능(AI) 스타트업 업스테이지가 '유럽컴퓨터비전학술대회(ECCV) 2022'에서 두 편의 논문을 게재해 광학문자인식(OCR) 기술력을 입증했다고 11일 밝혔다.
ECCV는 표현 학습 국제 학회(ICLR), 국제 컴퓨터 비전 및 패턴인식 학술대회(CVPR)와 함께 세계 최고 권위의 인공지능 학회로 꼽힌다.
2년 주기로 개최되는 ECCV 학회는 논문 채택율이 30%가 채 되지 않는 톱티어 학회로 지난 2020년 개최된 ECCV 2020에서는 총 5천150편의 논문이 제출 됐으며 그 중 26%인 1천360편의 논문만이 채택됐다.
업스테이지가 발표한 두 편의 논문은 광학문자판독(OCR) 문자 인식 모델에 대한 연구와 머신러닝의 기반이 되는 학습전략에 대한 논문이다. 첫 번째 논문은 AI가 사진에서 문자를 인식할 때 언어·시각적 요소를 모두 한번에 인식하는 멀티모달 기술을 적용해 시각적 요소를 주로 활용해오던 기존 문자 인식모델 대비 높은 성능을 달성한 연구 결과를 발표했다. 즉 AI가 사진의 데이터를 인식할 때 시각·언어 등 여러 요소가 서로 상호작용하도록 디자인해 성능을 높이고 이를 여러 형태의 문서 등 다양한 분야에서 활용할 때 좋은 인식 결과를 얻어낼 수 있게 돼 OCR 성능 개선에 큰 기여를 할 수 있을 것으로 전망된다.
두 번째 논문은 사전에 학습된 모델을 특정 분야에 적용할 때 발생하는 문제점을 해결하는 맞춤 학습 전략에 대한 연구 논문이다. 해당 기술은 여러 형태의 문서 등 모델에 쉽게 적용하며 역시 OCR 성능을 개선하는 데 적용될 수 있다고 업스테이지는 덧붙였다.
해당 논문이 발표될 올해 ECCV는 오는 10월23일부터 27일까지 이스라엘 텔아비브에서 열릴 예정이다. 업스테이지 논문 두 편은 연구 트랙에 전문 게재된다.
업스테이지는 이번 논문 성과를 활용해 이미지에서 원하는 정보를 추출해 이용할 수 있는 솔루션 '업스테이지 OCR 팩' 개발에 속도를 낼 계획이다.
김성훈 업스테이지 대표는 "세계 최고 권위를 자랑하는 ECCV학회에서 두 편의 논문 채택으로 업스테이지의 인공지능 기술력을 국제적으로 인정받게 되어 기쁘다"며 "학술적 연구에서 그치지 않고 최고 성능의 서비스를 만드는 데 주요한 기반으로 활용, 고객들이 최고 성능의 AI를 현업에서 노코드로 활용할 수 있도록 최선을 다할 것"이라고 밝혔다.