<AI Agent 구성 요소와 측정> 채팅방에서 좋은 질문이 나왔습니다 - 기분좋은 마곤

이 콘텐츠들은 텔레위키가 직접 업로드하는 것이 아닌 유저들이 수집하고 게시하는 것입니다. 문제가 있는 경우 [email protected]로 연락 주시면 조치하겠습니다.

Content Source & DMCA Safe Harbor Notice

All content on tele.wiki is collected and posted by users, not by TeleWiki itself. TeleWiki does not upload, create, edit, or pre-screen any of the content displayed on this platform.

TeleWiki operates as a neutral service provider and intermediary platform under applicable laws, including the U.S. Digital Millennium Copyright Act (DMCA) and similar international regulations. All responsibility for uploaded content lies solely with the original poster.

If you believe that your copyrighted work or other legal rights have been infringed, please submit a proper notice including sufficient details to:

[email protected]

Upon receipt of a valid DMCA notice or equivalent legal request, TeleWiki will promptly review and remove or disable access to the allegedly infringing material in accordance with Safe Harbor provisions.

TeleWiki maintains a policy for terminating repeat infringers when appropriate and complies with applicable copyright regulations.

TeleWiki makes no representations or warranties regarding the accuracy, legality, or completeness of user-generated content archived on this platform.

본 사이트(tele.wiki)에 게시된 모든 콘텐츠는 텔레위키가 직접 업로드하거나 생성한 것이 아닌, 유저들이 수집하고 게시한 자료입니다. 텔레위키는 해당 콘텐츠에 대한 사전 검열 또는 편집을 하지 않습니다.

텔레위키는 「정보통신망 이용촉진 및 정보보호 등에 관한 법률」 및 관련 법령상 중개자(플랫폼) 지위에 해당하며, 이용자가 게시한 콘텐츠에 대한 저작권 및 기타 법적 책임은 해당 게시자에게 귀속됩니다.

저작권 침해, 명예훼손, 개인정보 침해 또는 기타 법적 문제가 있다고 판단되는 경우, 권리자 또는 적법한 대리인은 아래 이메일로 구체적인 권리 침해 내용을 포함하여 통지해 주시기 바랍니다.

[email protected]

적법한 권리 침해 통지가 접수될 경우, 관련 법령(DMCA 포함 국제 저작권 규정)에 따라 신속히 검토 후 삭제 또는 접근 차단 조치를 진행합니다.

텔레위키는 반복적인 권리 침해가 확인되는 콘텐츠에 대해 차단 조치를 시행하며, 관련 법령에 따른 세이프 하버(Safe Harbor) 원칙을 준수합니다.

본 사이트는 제3자가 게시한 콘텐츠의 정확성, 적법성, 완전성에 대해 어떠한 보증도 하지 않습니다.

기분좋은 마곤 @magonia_b 📊 통계

2024-12-21

↪전달됨채널 1588820796

<AI Agent 구성 요소와 측정>

채팅방에서 좋은 질문이 나왔습니다.

"좋은 AI Agent 프로젝트에는 어떤 게 있나요?"

이 질문을 이해하기 위해서는 AI Agent는 어떻게 구성되고 있는가에 대한 이해가 필요합니다. AI Agent Survey 페이퍼를 4~5개 정도 읽고 있는데, 공통적으로 이야기하는 부분을 정리해 공유합니다.

제가 간략하게 쓰는 내용이니 논문과 같은 표현보다는 독자들이 직관적으로 이해할 수 있게 정리해서 작성해보았습니다. 궁금한 분들은 레퍼런스 논문들을 읽어보시는 것을 추천합니다. (* 제가 적은 내용은 매우 간략 버전이며 한 문장 한 문장이 논문 주제입니다.)

0️⃣ AI와 AI Agent는 다른 지표를 사용해야 한다.

AI Agent는 기존의 단일 AI와는 다른 형태를 보입니다. 기존 LLM 단순히 입력-모델-출력으로 구성된 결과물을 위한 인프라라면, AI Agent는 여러 AI 또는 인프라와 결합되어 복합적인 문제를 해결하기 위한 도구입니다. 범용 문제를 해결하기도 하지만 특정 문제를 해결하기 위해 테스크에 따라 과적합 되어 있을 수 있으며, 비용, 환경, 대상 등 다양한 추가적인 변인을 고려하여 벤치마크를 설계해야 합니다.

1️⃣ AI Agent에 대한 정의와 공통 요소

AI Agent에 대한 정의는 여전히 모호한 영역 중 하나입니다. agent가 무엇이냐? 라고 하기보다는 어떤 게 더 agentic 한지에 대해 스펙트럼으로 이해하는 게 중요할 것 같습니다. 이 부분에서는 크게 3가지 요소가 있습니다.

- 목표 및 환경: 에이전트의 활동 반경 및 실제 테스크의 복잡도가 높을 수록 Agentic하다. 상호작용 대상의 수 , 실시간 소통 등이 복잡함의 요소가 될 수 있습니다.
- UI & UX: 사용을 위한 입력이 자연어에 가까울 수록 Agentic하며, 인간의 별도의 추가 입력이 없이 자율적으로 목표를 수행할 수록 Agentic 하다.
- 시스템 디자인: 시스템을 사용하기 위한 제어 흐름이 자율적이고 동적일 수록 Agentic하다.

2️⃣ Agent의 설계 요소

Agent 설계를 위해 정말 다양한 요소가 있겠지만 크게 네 가지로 구분할 수 있습니다.

- Profile: 초기값 설정. 페르소나를 포함하여 전체 요소에 대한 전략 등에 대한 설정을 포함합니다.
- Memory: 메모리 구성 방식 (장기기억, 단기기억 등), 메모리 정보 저장 방식 (자연어, 벡터 등), 메모리 관련 모든 것을 포함합니다. 개인적으로는 메모리 관리에 대해 더 관심이 많아 [2]를 읽어보시는 것을 추천드립니다.
- Planning: Reasoning 방식(단일 경로, 복수 경로), 피드백 방식(환경, 인간, 모델) 등을 의미합니다.
- Action: 시스템을 통해 나온 결과물과 동작을 포함합니다. 대상, 환경, 횟수, 제한 등이 포함됩니다.

3️⃣ 평가 방법

- 벤치마크는 주관적 평가와 객관적 평가로 나뉩니다. 주관적 평가에는 잘 알려진 튜링테스트 등이 있고, 객관적 평가에는 각 task에 따른 수행 완료 등이 있습니다. 또한 주관적 평가에는 윤리 등이 들어갈 수 있습니다.
- 근데 재밌는 제안 중 하나는 비용과 연계된 지표를 사용해야 한다는 것입니다. 정확도를 기준으로 한다면 비용이 많이드는 최신 모델일수록 더 좋은 정확도를 가질 확률이 높기에 실제 Agent로 사용하기 어려울 수 있습니다.
- 그리고 단순히 베이스 모델만이 아닌 다운스트림 모델에 대한 측정을 개별로 해야합니다. 각 Agent가 다루는 주제(과학, 개발, 문화 등)에 따라 정확도와 비용이 달라질 수 있습니다. Agent의 종류는 정말 다양합니다. 대표적인 Agent는 다음과 같습니다. (i.e., General Agent, Tool Agent, Simulation Agent, Embodied Agent, Game Agent, Web Agent, Assistant Agent)

* 관련해서 Web2/Web3에 다양한 시스템 디자인들도 추후 공유해보겠습니다.

<References>

- Wang, Lei, et al. "A survey on large language model based autonomous agents." Frontiers of Computer Science 18.6 (2024): 186345.
- Zhang, Zeyu, et al. "A survey on the memory mechanism of large language model based agents." arXiv preprint arXiv:2404.13501 (2024).
- Kapoor, Sayash, et al. "Ai agents that matter." arXiv preprint arXiv:2407.01502 (2024).
- Durante, Zane, et al. "Agent ai: Surveying the horizons of multimodal interaction." arXiv preprint arXiv:2401.03568 (2024).

👁 1.9K↪ 25💬 0