세미나

비전과 인공지능을 위한 월드 모델: 베이즈가 답이다

2026년 6월 2일 · 앨런 율 · 존스홉킨스대
비전과 인공지능을 위한 월드 모델: 베이즈가 답이다

개요

거대언어모델과 비전-언어모델(VLM)이 의미 이해의 경계를 빠르게 넓혀가는 가운데, 앨런 율 존스홉킨스대 블룸버그 석학교수가 비전 연구가 앞으로 나아가야 할 방향에 대한 통찰을 공유합니다. 본 강연은 현재 인공지능의 발전을 가로막고 있는 것이 추론이 아니라 지각(perception)이라는 진단에서 출발해, 인간이 유아기부터 물리 세계와 상호작용하며 자연스럽게 습득하는 3D·4D 세계 지식의 중요성을 짚습니다. 율 교수는 1980~90년대에 정립된 베이즈 프레임워크가 분석(analysis), 합성(synthesis), 사전 세계 지식(prior world knowledge)을 결합해 지각과 추론, 행동을 하나로 통합하는 관점을 제시한다고 설명하고, 이를 뒷받침하는 세 가지 연구, 즉 3D 이해를 요구하는 시각적 질의응답에서의 VLM 성능 개선, CT 스캔과 영상 판독 보고서로부터 직접 학습한 종양 탐지 연구(MICCAI 최우수 논문), 그리고 체화형 에이전트를 위한 생성형 월드 모델 평가 벤치마크를 소개합니다. 나아가 세계의 3D·4D 속성을 추정하는 모델이 어떻게 지름길 학습에 덜 취약하고 더 해석 가능한 AI 시스템으로 이어지는지를 함께 살펴봅니다.

약력

앨런 율 교수는 존스홉킨스대학교 컴퓨터과학과 및 인지과학과 블룸버그 석학교수(Bloomberg Distinguished Professor)로, 2016년부터 재직하며 컴퓨터 비전과 인지과학을 아우르는 연구를 이끌고 있습니다. 2002년부터 2015년까지 UCLA에서 통계학과 교수(컴퓨터과학, 정신의학, 심리학 겸임)를 지냈으며, 그에 앞서 스미스-케틀웰 안과연구소(Smith-Kettlewell Eye Research Institute) 선임연구원, 하버드대학교 컴퓨터과학과 교수를 역임했습니다. 케임브리지대학교에서 이론물리학 박사 학위를 받았으며, 베이즈 이론에 기반한 컴퓨터 비전과 인간 시지각 연구 분야의 선구자로 널리 알려져 있습니다.

행사 정보

  • 연사자 앨런 율(Alan Yuille) | 존스홉킨스대 교수
  • 일자 2026년 5월 29일
  • 시간 오후 1:30
  • 장소 서울AI허브 3층 컨퍼런스룸 A