로봇 훈련, 동영상으로 진화

기사 제공처 : 아이티인사이트 / 등록기자: 최현웅 [기자에게 문의하기] /

해당 기사에 관련하여 문의하기에 남겨주시면 "최현웅"기자에게 전송됩니다

이름

연락처

- -

이메일

로다 AI, 로봇 교육의 새로운 패러다임을 제시하다

인터넷에는 매일 엄청난 양의 동영상이 업로드되고 있습니다. 유튜브를 비롯한 각종 플랫폼에서 공개되는 이러한 동영상들이 단순한 정보 공유나 오락의 영역을 넘어, 산업용 로봇을 훈련시키는 데이터로 활용될 수 있다면 어떨까요? 최근 로다 AI(Rhoda AI)는 바로 이러한 가능성에 주목하며, 혁신적인 AI 모델 개발을 통해 대규모 투자 유치에 성공하며 업계의 주목을 받고 있습니다.

이들은 수백만 개의 공개된 인터넷 동영상을 활용해 로봇에 산업 작업을 지시하는 방식으로 기존 로봇 훈련의 한계를 뛰어넘겠다고 선언했습니다. 로다 AI가 목표로 삼고 있는 기술은 기존의 로봇 훈련 방식과는 전혀 다른 접근법을 취합니다.

일반적으로 로봇 공학 AI 모델은 텔레오퍼레이션(teleoperation) 데이터에 의존해왔습니다. 이는 인간이 원격으로 로봇의 움직임을 제어하면서 작업 데이터를 제공하는 방식입니다.

그러나 이러한 접근법은 로봇이 실험실 외부의 다양한 환경에 적응하는 데 필요한 충분한 양의 데이터를 확보하기 어렵다는 근본적인 한계를 가지고 있었습니다. 제한된 환경에서 수집된 데이터만으로는 실제 산업 현장의 복잡하고 변화무쌍한 상황에 대응하기 어려웠던 것입니다. 반면 로다 AI는 '비디오 기반 학습'이라는 독창적인 방법을 제시하며 이러한 문제를 해결하겠다는 목표를 내세웠습니다.

로다 AI 팀은 온라인에 공개된 방대한 양의 동영상이 로봇 텔레메트리(telemetry) 데이터를 효과적으로 보완할 수 있다고 믿고 있습니다. 텔레메트리란 로봇의 위치, 속도, 방향 등의 측정 데이터를 원격으로 수집하는 기술을 의미하는데, 이러한 기술적 데이터와 실제 작업 상황이 담긴 동영상을 결합하면 훨씬 더 풍부하고 다양한 학습 데이터를 구축할 수 있다는 것이 로다 AI의 핵심 아이디어입니다. 로다 AI의 CEO인 재그딥 싱(Jagdeep Singh)은 비디오 기반 접근 방식의 장점을 명확하게 설명했습니다.

그는 고체 배터리 제조업체인 퀀텀스케이프(QuantumScape Corp.)의 공동 설립자이자 전 CEO로서 기술 사업화에 대한 풍부한 경험을 가지고 있습니다.

싱 CEO는 "텔레오퍼레이션 방식에서는 전화 방향 변화와 같은 사소한 요인으로 인해 모델이 실패할 수 있습니다. 하지만 로다의 모델은 다양한 방향에서 객체의 많은 사례를 학습했기 때문에 일반화 능력이 뛰어납니다"라고 강조했습니다. 이는 동일한 작업이라도 다양한 각도, 조명, 환경에서 촬영된 수많은 동영상을 통해 학습함으로써 로봇이 예상치 못한 상황에서도 적절히 대응할 수 있게 된다는 의미입니다.

이번 로다 AI의 투자 유치 규모는 약 4억 5천만 달러(한화 약 6천억 원)에 달하며, 인도의 거대 기업 집단 위프로(Wipro)의 창업자 가문이 운영하는 Premji Invest가 투자를 주도했습니다. 이번 투자로 인해 로다 AI의 기업 가치는 17억 달러로 평가되었습니다. 이는 아직 초기 단계의 스타트업으로서는 상당히 높은 평가액으로, 투자자들이 로다 AI의 기술과 비전에 얼마나 큰 기대를 걸고 있는지를 보여줍니다.

이번 투자 라운드에는 실리콘밸리의 유명 벤처캐피털인 코슬라 벤처스(Khosla Ventures)도 참여했습니다. 코슬라 벤처스는 청정 에너지와 첨단 기술 분야의 혁신적인 스타트업에 투자하는 것으로 잘 알려져 있습니다.

또한 싱가포르 국영 투자사인 테마섹 홀딩스(Temasek Holdings Pte)도 이번 투자에 참여했는데, 테마섹은 아시아 최대 규모의 국부펀드 중 하나로 글로벌 기술 기업에 대한 전략적 투자를 활발히 진행하고 있습니다. 여기에 전설적인 벤처 투자가인 존 도어(John Doerr)도 함께했습니다. 도어는 구글, 아마존 등 초기 단계부터 투자하여 큰 성공을 거둔 것으로 유명하며, 그의 참여는 로다 AI의 잠재력에 대한 강력한 신뢰의 표시로 받아들여지고 있습니다.

기존 방식을 넘어서: 온라인 동영상 기반 학습의 가능성

로다 AI의 모델은 온라인에 공개된 수백만 개의 동영상을 활용하는데, 이러한 동영상들은 실제 환경에서 로봇이 직면할 수 있는 다양한 상황을 포괄적으로 담고 있습니다. 예를 들어, 공장에서 부품을 조립하거나 물건을 운반하는 작업, 창고에서 물품을 분류하고 정리하는 과정, 또는 다양한 도구를 사용하는 장면 등이 모두 학습 데이터가 될 수 있습니다.

로봇은 이러한 동영상을 통해 여러 각도에서 작업의 형태를 관찰하고, 다양한 조건 하에서 어떻게 움직여야 하는지를 스스로 학습하게 됩니다. 이는 텔레오퍼레이션 방식에서 흔히 발생하던 문제, 즉 일정한 각도와 조건에서만 작동 가능한 모델의 한계를 극복할 수 있는 강력한 강점을 가집니다. 기존 방식에서는 로봇이 특정 위치에서 특정 방향으로만 물체를 인식하고 조작하도록 훈련되었기 때문에, 물체의 방향이 조금만 바뀌거나 조명이 달라져도 제대로 작동하지 못하는 경우가 많았습니다.

그러나 비디오 기반 접근법을 사용하면 같은 물체라도 수십, 수백 가지의 다른 각도와 조건에서 촬영된 영상을 통해 학습할 수 있기 때문에, 로봇의 적응력과 일반화 능력이 비약적으로 향상될 수 있습니다. 로다 AI는 AI 기술의 최신 발전을 활용하여 로봇 내비게이션을 개선하려는 투자자들의 관심을 끄는 성장하는 스타트업 중 하나입니다.

로봇 내비게이션이란 로봇이 주변 환경을 인식하고 목표 지점까지 스스로 경로를 찾아 이동하는 능력을 의미합니다. 이는 자율주행 자동차부터 물류 창고의 자동화 로봇, 제조 공장의 협동 로봇에 이르기까지 다양한 분야에서 핵심적인 기술로 자리잡고 있습니다. 로다 AI의 비디오 기반 학습 접근법은 이러한 로봇 내비게이션 기술을 한 단계 더 발전시킬 수 있는 잠재력을 가지고 있습니다.

최근 인공지능 분야에서는 대규모 언어 모델(LLM)의 성공에 힘입어, 방대한 데이터를 활용한 학습이 모델의 성능을 극적으로 향상시킬 수 있다는 것이 입증되었습니다. 로다 AI는 이러한 원리를 로봇 공학에 적용하려는 시도로 볼 수 있습니다.

텍스트 데이터로 훈련된 언어 모델이 다양한 문맥을 이해하고 적절히 대응할 수 있듯이, 방대한 동영상 데이터로 훈련된 로봇 모델 역시 다양한 물리적 환경과 작업 상황에 유연하게 대응할 수 있을 것으로 기대됩니다. 공개된 인터넷 동영상을 활용한다는 점은 데이터 확보 측면에서도 큰 장점이 있습니다.

전통적인 방식에서는 각 기업이나 연구기관이 자체적으로 로봇을 조작하며 데이터를 수집해야 했기 때문에 시간과 비용이 많이 소요되었고, 수집할 수 있는 데이터의 양과 다양성에도 한계가 있었습니다. 반면 이미 인터넷에 공개되어 있는 수백만 개의 동영상을 활용하면 훨씬 적은 비용으로 훨씬 더 다양한 상황을 담은 대규모 데이터셋을 구축할 수 있습니다.

향후 산업 변화와 한국 경제에 미칠 영향

물론 이러한 접근 방식이 완벽한 것은 아닙니다. 인터넷에 공개된 동영상의 품질은 천차만별이며, 로봇 훈련에 적합한 형태로 가공하고 정제하는 작업이 필요합니다. 또한 동영상만으로는 로봇이 실제로 힘을 얼마나 가해야 하는지, 정확한 위치 좌표는 어떻게 되는지 등의 세밀한 정보를 얻기 어려울 수 있습니다.

바로 이러한 이유로 로다 AI는 동영상 데이터를 로봇 텔레메트리 데이터와 결합하여 사용하는 접근법을 취하고 있는 것으로 보입니다. 재그딥 싱 CEO의 이력도 로다 AI의 성공 가능성을 높이는 요소 중 하나입니다. 그는 퀀텀스케이프를 공동 창업하여 차세대 고체 배터리 기술 개발을 이끌었으며, 이 회사는 2020년 SPAC 합병을 통해 상장하면서 한때 시가총액 500억 달러에 육박하는 평가를 받기도 했습니다.

비록 이후 기술 상용화의 어려움으로 주가가 조정을 받긴 했지만, 싱 CEO는 첨단 기술을 사업화하고 대규모 투자를 유치하는 데 있어 검증된 능력을 보유하고 있습니다. 이러한 경험은 로다 AI가 기술 개발뿐만 아니라 실제 시장에서의 사업화 단계로 나아가는 데 큰 자산이 될 것입니다. 로봇 공학과 AI의 결합은 현재 기술 업계에서 가장 뜨거운 분야 중 하나입니다.

테슬라는 옵티머스(Optimus)라는 인간형 로봇을 개발 중이며, 보스턴 다이내믹스는 이미 상업화된 로봇 제품을 시장에 선보이고 있습니다. 아마존은 물류 창고 자동화를 위해 수많은 로봇을 도입했으며, 제조업 분야에서도 협동 로봇(cobot)의 활용이 빠르게 확산되고 있습니다.

이러한 맥락에서 로다 AI의 비디오 기반 학습 접근법은 차세대 로봇 AI의 핵심 기술로 자리잡을 가능성이 있습니다.

투자자들이 로다 AI에 17억 달러라는 높은 기업 가치를 부여한 것은 단순히 현재의 기술 수준만을 평가한 것이 아닙니다. 이는 향후 이 기술이 산업 전반에 걸쳐 가져올 수 있는 혁신과 시장 잠재력을 반영한 것입니다. 만약 로다 AI의 접근법이 성공한다면, 로봇 훈련에 필요한 시간과 비용이 대폭 절감되고, 로봇의 적응력과 범용성이 크게 향상되어 다양한 산업 분야에서 로봇 활용이 더욱 확대될 수 있을 것입니다.

결론적으로 로다 AI의 비디오 기반 로봇 훈련 모델은 현재 로봇 공학 AI 기술의 한계를 극복하려는 혁신적인 시도로 평가받고 있습니다. 4억 5천만 달러라는 대규모 투자 유치는 글로벌 투자자들이 이 기술의 잠재력을 높이 평가하고 있음을 보여줍니다.

Premji Invest, 코슬라 벤처스, 테마섹 홀딩스, 존 도어 등 저명한 투자자들의 참여는 로다 AI가 차세대 로봇 내비게이션 기술의 선두주자가 될 가능성을 시사합니다. 수백만 개의 공개 인터넷 동영상을 활용하여 로봇에게 다양한 산업 작업을 학습시킨다는 접근법은 기존의 제한적인 텔레오퍼레이션 데이터에 의존하던 방식을 넘어서는 새로운 패러다임을 제시하고 있습니다.

이서준 기자

[참고자료]

kr.investing.com