상세보기

구글, 자율 로봇 'Auto RT' 개발 LLM과 VLM 통해 자연스러운 동작 수행 가능 임찬웅 기자입력 2024-01-08 11:54:55

구글 연구팀이 로봇 시스템 Auto RT를 개발했다 / 사진. Google DeepMind

 

글로벌 IT 기업 구글(Google)이 대규모 언어 모델(Large Language Model, LLM) 기반으로 동작하는 자율로봇 Auto RT(이하 오토RT)를 개발했다고 4일(현지시각) 밝혔다.

 

오토RT는 LLM 및 시각언어모델(Visula Language Model,VLM)을 기반으로 주변 환경 정보를 수집해 작업을 수행한다.로봇은 VLM을 통해 카메라에 인식된 물체를 식별하며 '간식을 조리대 위에 놓기'와 같은 작업을 LLM을 통해 제시해 이용자의 명령에 따라 동작한다.

 

구글 연구팀은 7개월 간 사무실 등 환경에서 해당 로봇을 실증했다. 연구팀은 한 번에 최대 20대의 로봇 실증을 진행한 결과 약 6,650개의 명령에 따른 7만 7,000개 이상의 동작 데이터를 확보했다고 전했다.

 

연구팀은 오토RT의 예상치 못한 돌발행동과 이용자에게 위험이 될 만한 상황을 방지하기 위해 안전 규정을 만들었다고 설명했다. 연구팀은 해당 안정 규정이 아이작 아시모프(Isaac Asimov)의 '로봇 공학 3원칙'으로 부터 아이디어를 얻었으며, 추가적으로 로봇이 인간, 동물, 날카로운 물체 또는 전기 제품과 관련된 작업을 수행하지 못하도록 설계했다고 언급했다. 연구팀은 이러한 시스템과 더불어 오토RT 관절 센서에 가해지는 힘이 설정된 임계값을 초과하면 작동을 정지하도록 설계했다고 덧붙였다.

 

또한 연구팀은 오토RT가 LLM이 지시한 내용 수행할 때 효과적으로 동작하기 위해 RT-트레젝토리(RT- Trajectory) 시스템도 개발했다. 연구팀은 로봇 동작에 2D 스케치를 오버레이해 로봇 팔의 궤적이나 움직임을 가장 효율적으로 구현하는 동선을 설게한다. 이는 로봇이 동작하는 상황에 맞춰진 실용적인 움직임 구사가 가능하도록 돕는다. 연구팀은 히댕 시스템을 통해 훈련 데이터에 없는 41개 작업을 테스트를 수행해 로봇 동작 성공률을 29%에서 63%까지 향상시켰다고 전했다.

 

구글 연구팀은 "개인 서비스 로봇이 '집 정리'나 '요리' 같은 간단한 요청으로 작업을 수행하려면 높은 수준의 동작 이해가 수반되어야 한다"라며, "오토RT는 로봇이 더 빠르게 결정내리고 환경을 더 잘 이해하고 탐색하도록 지원한다"라고"말했다.

임찬웅 기자
로봇시대의 글로벌 리더를 만드는 로봇기술 뉴스레터 받기
전문보기
관련 뉴스
의견나누기 회원로그인