memory-conditioned inference (1) 썸네일형 리스트형 Mr. Steve: Instruction-Following Agents in Minecraft with What-Where-When Memory Minecraft와 같은 오픈월드 환경에서 범용적인 에이전트를 만드는 것은 인공지능 연구에서 큰 도전 과제 중 하나입니다. 이러한 환경에서 에이전트는 긴 시계열에 걸친 다양한 하위 목표를 수행해야 합니다. 특히, 최근엔 대규모 언어 모델(LLM)로 강화된 하이레벨 플래너를 사용해, 상위 계획(예: “나무를 베어 도구를 만들기”)을 생성하고, 이를 하위 레벨 컨트롤러(로우레벨 정책)가 실행하도록 하는 계층적 접근 방식이 각광받고 있습니다. 그러나 현재의 하위 레벨 컨트롤러들은 종종 과거 정보를 충분히 기억하지 못해 동일한 자원을 반복해서 찾아다니거나 이미 방문했던 장소를 헛되이 재탐색하는 비효율을 보입니다. 이로 인해, 비록 상위 플래너가 뛰어난 계획을 세워도, 하위 레벨 컨트롤러 때문에 전체 시스템이 발.. 이전 1 다음