AI 에이전트, 사람이 방향 잡아야 일한다
AI·공부 · 약 4분
목차
요즘 ‘AI 에이전트(AI Agent)‘라는 말이 부쩍 자주 들린다. 결론부터 말하면, AI 에이전트는 목표를 주면 스스로 단계를 나눠 도구를 쓰고 결과를 확인하며 일을 끝까지 처리하는 AI다. “내일 회의 자료 정리해줘”라고 던지면, 캘린더를 열어보고 관련 문서를 찾아 요약하고 초안까지 만드는 식이다. 단순히 질문에 답만 하던 챗봇과 결정적으로 다른 지점이 여기에 있다.
에이전트라는 개념 자체는 새롭지 않다. 1990년대 AI 연구에서도 ‘환경을 인식하고 행동하는 주체’를 에이전트라 불렀다. 다만 그때는 정해진 규칙대로만 움직였다. 판을 바꾼 건 2022년 이후의 대형 언어모델(LLM)이다. 언어로 추론하는 능력이 생기면서, AI가 “다음에 뭘 해야 할지”를 스스로 계획할 수 있게 됐고, 그 위에 도구 사용 능력이 붙으면서 비로소 지금의 에이전트가 등장했다.
먼저 말해두고 싶은 게 있다. 이 글이 끝까지 전하려는 한 가지는 “에이전트는 스스로 일하지만, 결국 사람이 방향을 잡아줘야 제대로 일한다”는 것이다. 작동 원리를 살펴보는 이유도 결국 어디서 사람이 개입해야 하는지를 알기 위해서다.
Photo by Gabriele Malaspina on Unsplash
AI 에이전트와 챗봇은 무엇이 다른가
가장 흔한 오해가 “에이전트는 똑똑한 챗봇”이라는 생각이다. 둘의 차이는 똑똑함의 정도가 아니라 행동 여부에 있다.
챗봇은 한 번 묻고 한 번 답하면 끝이다. “맛집 추천해줘”라고 하면 글로 목록을 알려준다. 반면 에이전트는 같은 요청을 받고도 실제로 지도 앱을 검색하고, 영업시간을 확인하고, 예약 페이지까지 열어볼 수 있다. 말로 답하는 데서 멈추지 않고 외부 세계에 손을 대는 것이다.
또 하나의 차이는 ‘여러 단계를 스스로 잇는다’는 점이다. 챗봇은 한 번의 대화가 한 번의 처리지만, 에이전트는 한 목표를 위해 5번, 10번씩 스스로를 다시 호출한다. 중간 결과가 틀렸으면 방향을 바꾸기도 한다. 나는 이 부분이 에이전트의 진짜 핵심이라고 본다. 한 번에 완벽한 답을 내는 게 아니라, 틀리면서 고쳐 나가는 반복 구조가 사람이 일하는 방식과 닮았기 때문이다.
AI 에이전트는 어떻게 작동하나: 4가지 핵심 부품
복잡해 보이지만, 대부분의 AI 에이전트는 네 개의 부품으로 설명된다.
- 두뇌(LLM): GPT나 Claude 같은 언어모델이 판단과 추론을 맡는다. “지금 상황에서 다음 행동은 무엇이어야 하는가”를 결정하는 사령탑이다.
- 계획(Planning): 큰 목표를 작은 단계로 쪼갠다. ‘회의 자료 만들기’를 → 일정 확인 → 자료 수집 → 요약 → 초안 작성으로 나누는 식이다.
- 도구(Tools): 웹 검색, 계산기, 이메일 발송, 코드 실행 같은 실제 기능. 에이전트가 ‘손과 발’을 갖는 부분이다. 도구가 없으면 아무리 똑똑해도 머릿속 생각에 그친다.
- 기억(Memory): 앞 단계에서 무엇을 했는지 기록한다. 그래야 같은 검색을 반복하지 않고 맥락을 이어간다.
이 넷이 맞물려 돌아가는 흐름을 한 줄로 요약하면 이렇다. 생각하고(LLM) → 행동하고(도구) → 결과를 보고(기억) → 다시 생각한다. 이 고리를 목표가 달성될 때까지 돈다. 이 반복 패턴을 업계에서는 ReAct(Reason + Act)라고 부른다.
Photo by Alex Knight on Unsplash
실제로 어떻게 쓰이고, 무엇을 조심해야 하나
가장 가까운 예가 코딩 도구다. 개발자가 “이 버그 고쳐줘”라고 하면, 에이전트가 코드 전체를 훑고, 관련 파일을 찾아 수정하고, 테스트를 돌려보고, 실패하면 다시 고친다. 사람이 일일이 시키지 않아도 끝까지 가는 것이다. 고객 상담, 자료 조사, 이메일 정리 같은 영역에서도 같은 방식이 빠르게 자리 잡고 있다.
다만 만능은 아니다. 에이전트는 단계가 길어질수록 오류가 쌓인다. 1단계에서 5% 틀리면, 10단계를 거치는 동안 그 오차가 눈덩이처럼 불어난다. 또 도구를 잘못 쓰면 실제로 잘못된 메일을 보내거나 파일을 지우는 등 ‘진짜 사고’로 이어질 수 있다. 챗봇이 틀리면 말로 끝나지만, 에이전트가 틀리면 행동으로 남는다는 점이 양날의 검이다.
바로 이 지점에서 사람의 역할이 갈린다. 오류가 눈덩이처럼 불어나는 걸 막는 가장 확실한 방법은, 눈덩이가 작을 때 방향을 바로잡는 것이다. 끝에 가서 결과물 전체를 검사하는 게 아니라, 중간중간 길목에서 “지금 방향이 맞나?”를 확인하고 어긋났으면 즉시 틀어주는 것이다. 나는 에이전트를 쓰면서 이걸 자주 느낀다. 처음부터 완벽한 지시를 던지는 것보다, 일을 시작하게 한 뒤 첫 결과를 보고 “이쪽 말고 저쪽으로”라고 한마디 거드는 편이 훨씬 좋은 결과를 낸다. 에이전트는 운전대를 잡은 운전사이고, 사람은 옆에서 길을 일러주는 내비게이터에 가깝다.
Photo by Emilipothèse on Unsplash
결국 핵심은 ‘함께 방향을 잡는 일’이다
그래서 지금 단계의 현실적인 결론은 분명하다. AI 에이전트는 ‘맡기고 잊는’ 자동화가 아니라, 사람이 방향을 잡고 중간중간 길을 바로잡는 협업 도구다. 스스로 일하게 두되, 결정적인 갈림길마다 사람이 개입해 방향을 조정하는 구조가 가장 안전하고 효율적이다.
오해하지 말아야 할 건, 이 ‘개입’이 에이전트를 못 믿어서 하는 감시가 아니라는 점이다. 사람이 큰 그림과 의도를 쥐고, 에이전트가 손이 많이 가는 실무를 빠르게 처리하는 역할 분담에 가깝다. 작동 원리를 알면 어디까지 맡기고 어느 길목에서 손을 대야 할지 감이 잡힌다 — 그 감각, 즉 언제 방향을 잡아줘야 하는지를 아는 능력이 앞으로 에이전트를 잘 쓰는 사람과 휘둘리는 사람을 가른다.
댓글