-
AI Agent conceptDEV 2024. 11. 15. 20:27
Agent
AI agent workflow가 올해 엄청난 AI 진전을 이끌 것이라고 생각합니다. 아마도 차세대 기초 모델보다 더 큰 진전이 있을 것입니다.
-앤드류 응(Andrew Ng)
기업의 대부분(82%)이 1~3년 내에 'AI 에이전트'를 통합할 계획
-2024.7 캡제미나이 "생성 AI의 가치 활용"에이전트는 개방적이고 느슨하게 정의된 목표를 추구하면서 자율적으로 행동할 수 있는 AI 시스템
일반적인 프로세스
사용자의 지시
에이전트 시스템이 작업을 계획, 할당 및 실행
- 프롬프트를 워크플로로 처리하여 작업을 쪼개고, 관리자 에이전트는 이를 다른 전문 하위 에이전트에게 할당.
- 필요한 도메인 지식과 도구를 갖춘 하위 에이전트는 이전 "경험"과 체계화된 도메인 전문 지식을 활용하여 실행
에이전트 시스템의 반복적인 출력 개선
에이전트의 작업 실행
assistants, copilots, and agents
assistants, copilots, agents를 구분하는 주요 차이점 → 자율성 수준
AI agent 개념
CoT (chain-of-thought: 생각의 사슬)
LLM의 가장 큰 문제 → 환각 → 원인은 아직 정확히 알 수 없지만 → 중요한 맥락을 놓쳤을 때 이 부분을 놓쳤다고 알려주면 반응을 바로잡고 훨씬 더 나은 결과 도출
환각에 대한 가능한 해결책 → 시스템이 반응하기 전에 더 많이 생각하게 하는 것
에이전트 개념을 만든 연구 중 하나는 "생각의 사슬 프롬프팅(CoT: chain-of-thought prompting)"이라는 개념을 도입한 2022년 Google 리서치의 Brain팀이 발표한 논문
- https://arxiv.org/pdf/2201.11903
이 논문은 LLM이 복잡한 문제를 더 작은 중간 단계로 나누고 각 단계를 차례로 수행하여 전체 문제를 해결할 수 있는 능력이 있음을 보여줌
AI 에이전트를 위해 연구를 한 것은 아니었으나, 생각의 사슬 기술이 LLM의 다단계 추론 및 계획 능력을 크게 향상 → 에이전트 행동의 핵심
CoT, ToT(Tree of Thoughts), AoT(Algorithms of Thoughts)....
ReAct (Reason + Act)
ReAct(Reasoning and Acting)도 CoT와 같이 AI 모델의 추론 과정에서 사용되는 전략 중 하나
추론(reasoning) + 행동(action), 에이전트가 사고와 행동을 동적으로 번갈아가며 수행
https://arxiv.org/pdf/2210.03629
CoT 사용하면 모델이 외부 세계에 기반을 두지 않고 모델 내부 표현을 사용하여 추론 생성 → 반응적으로 탐색하고 추론하거나 지식을 업데이트하는 능력이 제한
reAct를 CoT의 개선된 버전으로 볼 수도 있고, 생각의 사고(CoT)와 함께 ReAct를 사용하는 것이 가장 좋은 접근 방식이라는 결과도 있음
AI가 문제 해결 과정에서 Reasoning(추론)과 Acting(행동)을 번갈아 가며 수행하도록 하는 전략
AI가 주어진 문제를 해결하는 동시에 환경과 상호작용하여 문제를 풀어가는 방식
CoT와 ToT는 추론에 초점을 두는 반면, ReAct는 행동과 관찰을 포함
ReAct logic의 elements
Thought: 추론을 통한 다음 작업 결정
Act/Action: 어떤 도구를 어떤 매개변수로 사용할지 지정
Observation: action에 따라 도구 실행, 결과 도출
ReAct 패턴의 간단한 구현
A simple Python implementation of the ReAct pattern for LLMs
https://til.simonwillison.net/llms/python-react-pattern#user-content-the-code
ReAct → 자율에이전트 → 멀티 에이전트
agent design pattern
Reflection, Tool Use, Planning, Multi-Agent Collaboration
Andrew Ng 제안
https://www.deeplearning.ai/the-batch/how-agents-can-improve-llm-performance/
Reflection
피드백 루프를 통해 응답을 반복적으로 개선
Tool Use
데이터를 수정하거나 변환해야 하는 영역을 파악하기 위해 외부 도구를 활용
Planning
작업을 여러 단계로 나누고, 각 단계의 결과를 다음 단계에 제공하여 더욱 세부화
Multi-Agent Collaboration
전문 에이전트를 사용하여 서로를 자극하고 반복적으로 출력을 개선
다음글
2024.11.16 - [DEV] - AI agent frameworks
728x90'DEV' 카테고리의 다른 글
class에 단일 책임이 있는지 판단하는 방법 (0) 2024.11.18 AI agent frameworks (4) 2024.11.16 Multimodal RAG (2) 2024.11.14 ETL, ECL and vector DB (0) 2024.11.13 Chunking in RAG application (0) 2024.11.12