차세대 AI 로봇을 위한 파운데이션 모델 구현
이 연구 이니셔티브는 AI 로봇 공학의 경계를 넓히는 것을 목표로 하며, 파운데이션 모델의 힘을 활용하여 복잡한 실제 환경에서 효과적으로 작동할 수 있는 더욱 다재다능하고 지능적이며 적응 가능한 로봇 시스템을 만들고자 합니다
배경 및 근거
최근 파운데이션 모델의 발전은 인지, 의사결정, 제어를 포함한 AI 로봇 자율성의 주요 구성 요소를 크게 향상시킬 수 있는 변혁적 기회를 제시합니다. 제한된 작업 특정 데이터셋으로 훈련된 전통적인 딥러닝 기반 AI 모델은 다양한 응용 분야에서 적응성에 제약을 보였습니다. 반면, 광범위한 인터넷 규모의 데이터로 사전 훈련된 파운데이션 모델은 광범위한 문제 스펙트럼에 걸쳐 놀라운 일반화 능력을 보여주었으며, 때로는 새로운 도전에 대한 제로샷 솔루션을 제시하기도 했습니다.
대규모 언어 모델은 로봇 작업 실행을 위한 절차 프로그래밍과 상식적 추론 제공에 잠재력을 보였으며, 시각-언어 모델은 사전 정의되지 않은 스타일적 특징의 개방형 인식을 가능하게 합니다. 그러나 이러한 파운데이션 모델의 로봇 공학에서의 실제 구현은 여러 과제에 직면해 있습니다:
- 시공간 및 소리의 다차원적이고 통합된 인식
- 로봇 학습에 필요한 전문화된 트레이닝 데이터 부족
- 안전성 확보 및 불확실성 정량화
- 실시간 실행 능력 달성
연구 목표
우리 연구의 주요 목표는 차세대 AI 로봇을 위한 다목적 파운데이션 모델을 개발하는 것입니다.
- 1. 실제 시나리오에 적용 가능하고 다양한 형태의 AI 로봇 공학에 적응 가능한 보편적 파운데이션 모델 구축
- 2. 인지, 의사결정, 제어 분야에서 상황 인식 및 자율 AI 로봇을 위한 가능 기술 획득
연구 개발 단계
1단계: 초기 파운데이션 모델 개발 및 기본 로봇 제어 기술
- 1. 멀티모달 인식 파운데이션 모델:
- 개방형 어휘 객체 감지 및 분할기술 연구
- 소리와 음성을 통합하는 대화형 이해 및 합성 모델 연구
- 다중센서 및 모달리티 융합 인터페이스 기술 연구
- 2. 범용 로봇 제어:
- 로봇 동작 생성 및 재타겟팅 기술 개발
- 강화 학습 기반 멀티모달 의사결정 기초 모델 개발
- 3. 구체화된 AI 기초 모델 기술:
- 멀티모달 상식 및 윤리적 추론 역량 개발
- 장기 기억 및 도메인 지식 증강 기술 개발
- 멀티모달 기초 모델을 위한 세계 학습 기술 개발
2단계: 모델 정제, 실질적 응용 및 성능 최적화
- 1. 고급 멀티모달 인지:
- 개방형 어휘 객체 탐지 및 분할 기술 향상
- 소리와 음성을 통합하는 상호작용 이해 및 합성 모델 고도화
- 다중 센서 및 모달리티 융합 인터페이스 기술 개선
- 2.강화된 범용 로봇 제어:
- 로봇 동작 생성 및 재타겟팅 기술 고도화
- 강화 학습 기반 멀티모달 의사결정 모델의 실제 환경 적용
- 효율적인 로봇 행동 제어를 위한 모델 적응 및 양자화 기술 연구
- 3. 고급 구체화된 AI:
- 상식 및 윤리적 추론 모델의 실제 환경 적용
- 장기 기억 및 도메인 지식 증강 기술 고도
- 세계 학습 기술 발전
- 보완 학습을 통한 적응형 및 진화형 로봇 기초 모델 개발