AI Agent

An AI agent is an autonomous entity which observes through sensors and acts upon an environment using actuators.

— 인공지능 학계의 전통적이고 교과서적인 정의.

질문에 답만 하던 앵무새에서 벗어나, 스스로 계획을 세우고 도구를 쥐며 행동하는 자율형 인공지능. ~~그리고 무한 루프에 잘못 빠져 단 몇 분 만에 API 호출 비용 수백 달러를 날려 먹는 카드 한도 파괴자~~

1. 개요

[AI 에이전트](AI Agent)는 단순히 사용자의 텍스트 입력에 대해 정적인 답변을 주는 챗봇 수준을 넘어, 주어진 목표(Goal)를 달성하기 위해 스스로 계획을 세우고, 필요한 도구를 판단해 실행하며, 환경과 상호작용하여 문제를 해결하는 자율적 인공지능 시스템을 뜻한다.

대형 언어 모델)을 두뇌로 탑재한 현대의 AI 에이전트는 코딩 에이전트, 자율형 비서, 웹 브라우징 에이전트 등 다양한 형태로 실무에 도입되고 있으며, AI가 단순한 정보 탐색 도구에서 실제 업무를 수행하는 '일꾼'으로 진화하는 단계를 대변한다.

2. 주요 특징

2.1. 계획 수립(Planning)과 반성(Reflection)

에이전트는 어려운 목표를 만나면 이를 여러 개의 하위 태스크(Sub-task)로 쪼갠다. 이 과정에서 자신의 행동 결과를 모니터링하고, 에러가 발생하면 "아, 내 생각이 틀렸구나"라며 스스로 계획을 수정하는 반성(Self-Reflection/Criticism) 단계를 거친다. 대표적인 방법론으로 ReAct(Reasoning + Acting), Reflexion 등이 있다.

2.2. 단기 및 장기 메모리(Memory)

단기 메모리(Short-term Memory): 현재 진행 중인 대화나 콘텍스트 윈도 내에 존재하는 정보다.
장기 메모리(Long-term Memory): 이전에 수행했던 작업 결과나 외부 데이터베이스(Vectordb)에 저장된 정보로, 에이전트가 시간이 지나도 핵심 맥락이나 노하우를 잊지 않고 불러와 재사용할 수 있도록 돕는다.

2.3. 도구 사용(Tool Use)

에이전트가 일반 챗봇과 차별화되는 가장 큰 무기다. LLM은 자체적으로 연산을 하거나 인터넷 서핑을 할 수 없지만, AI 에이전트는 API나 [함수 호출](Function Calling) 기능을 이용해 계산기, 웹 브라우저, 코드 실행 터미널, 파일 시스템 등을 필요에 따라 도구로 꺼내 쓴다. 예를 들어 "오늘 날씨를 알아봐 줘"라고 하면 웹 검색 도구를 실행하고, "이 CSV 파일의 평균값을 구해줘"라고 하면 파이썬 실행 도구를 활용해 직접 연산한 뒤 결과를 알려준다.¹

3. 관련 밈 및 드립

3.1. 카드 한도 초과와 무한 루프

에이전트를 로컬 터미널에 띄우고 "이 프로그램을 디버깅하고 고쳐줘"라는 식의 자율 명령을 내렸을 때 가장 자주 일어나는 참사다. 에이전트가 버그를 고치다가 새로운 에러가 나면, 해결하기 위해 또 도구를 부르고, 그 도구에서 에러가 나면 또 부르는 식으로 무한 루프(Infinite Loop)에 빠지곤 한다. 이때 사용된 유료 API 요금은 고스란히 사용자의 카드로 청구되며, 아침에 일어나 보니 API 사용료로 수백 달러가 결제되어 지갑이 찢어지는 눈물겨운 인증샷이 개발자 커뮤니티에 심심치 않게 올라온다.

3.2. 세계 최초의 AI 개발자 'Devin' 소동

2024년 초, 스타트업 Cognition에서 세계 최초의 자율형 AI 소프트웨어 엔지니어 'Devin'을 발표하며 업계에 큰 충격을 주었다. 스스로 Upwork에서 외주 일을 따서 수행하는 홍보 영상을 보여주며 "개발자들의 시대는 끝났다"는 공포 분위기를 조성했으나, 이후 연출된 화면이나 자잘한 오류 수정 수준이었다는 과장 광고 논란이 일면서 밈으로 소비되었다.

"Devin이 내 일자리를 뺏어갈 줄 알았는데, 내 API 크레딧만 뺏어가고 있었습니다."

4. 여담

AutoGPT의 거품 소동: GPT-4 출시 초기, 스스로 목표를 해결하는 개념을 최초로 대중화시킨 전설적인 오픈 소스 프로젝트들이다. 당시 깃허브 스타(Star) 수 만 개를 받으며 큰 기대를 모았으나, 현실은 대부분의 작업에서 무한 루프에 빠져 헛소리만 늘어놓는 성능적 한계를 보여주며 빠르게 거품이 빠지기도 했다.
모래상자 격리 환경 필수: 에이전트에게 실제 컴퓨터의 터미널 실행 권한을 주면 매우 강력하지만, 악의적인 명령을 내리거나 오작동하여 중요 시스템 파일을 날려버릴 수도 있다. 이 때문에 에이전트는 반드시 격리된 가상 환경(Docker Sandbox 등) 내에서 실행하는 것이 정석이다.
멀티 에이전트의 대세: 최근에는 하나의 에이전트가 일하는 것이 아니라 기획자 에이전트, 개발자 에이전트, QA 에이전트 등 여러 역할을 맡은 AI들이 서로 채팅(회의)을 하며 소프트웨어를 완성하는 멀티 에이전트 협업 프레임워크(CrewAI, Autogen 등)가 인기를 끌고 있다.

5. 관련 문서

챗봇에게 덧셈이나 곱셈을 물어보면 '암산'을 하려다 오답을 내기 십상이지만, 에이전트는 '계산기 API'를 호출해 정답을 확실하게 구해온다. 도구의 활용 유무가 지능의 한계를 극복하는 열쇠인 셈이다. ↩