Yao et al., 2023 – ReAct: Synergizing Reasoning and Acting in Language Models (ICLR)
언어모델이 단순히 추론(Reasoning)만 수행하는 기존 Chain-of-Thought 방식을 확장하여, 외부 환경과 상호작용하는 행동(Acting)을 함께 결합한 새로운 프롬프트 패러다임을 제안한다.
ReAct는 언어모델이 주어진 문맥 내에서 스스로 사고(thought)와 행동(action)을 번갈아 생성하며 문제를 해결하도록 하며, 위키피디아 검색 등 외부 도구를 활용해 사실 기반의 추론을 강화한다.
실험 결과, ReAct는 HotPotQA·FEVER 등 지식집약적 과제와 ALFWorld·WebShop 같은 의사결정 과제에서 기존 Chain-of-Thought나 Acting-only 방식보다 높은 성능과 해석 가능성을 보였다.
또한 ReAct는 단순한 프롬프트 설계만으로 내부 지식과 외부 환경 정보를 효과적으로 결합할 수 있으며, 이는 향후 언어모델이 인간처럼 사고와 행동을 통합적으로 수행하도록 발전하는 방향을 제시한다.