2025년은 AI가 “질문에 대답하는 도구”에서 “스스로 일하는 동료”로 바뀐 해였습니다. 에이전틱 AI(Agentic AI)라는 이름 아래, AI 시스템이 목표를 부여받으면 계획을 세우고, 도구를 선택하고, 다단계 작업을 자율적으로 실행하기 시작한 거죠. 이 글에서는 에이전틱 AI가 어떻게 주류로 자리 잡았는지, 주요 사건들과 함께 정리해 봅니다.
“에이전틱 AI”란 무엇일까?
기존 AI가 질문에 답하는 응답형(responsive) 시스템이었다면, 에이전틱 AI는 목표를 부여받으면 스스로 계획을 세우고, 도구를 선택하고, 다단계 작업을 자율적으로 실행하는 시스템입니다.
기존 AI: “이 이메일에 뭐라고 답장할까?” → 답변 초안 생성
에이전틱 AI: “이번 주 회의를 준비해줘” → 캘린더 확인 → 참석자 이메일 발송 → 자료 정리 → 회의실 예약
차이가 느껴지시나요? 단순한 텍스트 생성이 아니라, 추론 → 행동 → 관찰 → 다시 추론의 자율적 루프가 핵심입니다.
타임라인: 에이전틱 AI가 주류가 되기까지
2025년 1월 — OpenAI Operator 출시
OpenAI가 Operator를 공개했습니다. 웹에서 사용자를 대신해 작업을 수행하는 에이전트로, 자체 브라우저를 사용하여 웹페이지를 보고 타이핑, 클릭, 스크롤로 상호작용합니다. Computer-Using Agent(CUA)라는 새 모델로 구동되며, GPT-4o의 비전 능력과 강화학습을 통한 추론을 결합한 것이었죠.
OpenAI 공동창업자 Greg Brockman은 “2025년은 AI가 챗봇에서 에이전트로 전환되는 해가 될 것”이라 예측했는데, 이는 그 해 내내 반복된 메시지가 되었습니다.
2025년 3~4월 — 개발 도구의 물결
- OpenAI Agents SDK (3월): Python/TypeScript 오픈소스 SDK로, 도구 사용·핸드오프·가드레일·트레이싱을 위한 빌딩 블록 제공
- Google ADK (4월): Cloud NEXT 2025에서 Agent Development Kit 공개. 멀티 에이전트 시스템의 엔드투엔드 개발 프레임워크를 오픈소스화
2025년 5월 — Claude의 “컴퓨터 사용” 본격화
Anthropic이 Claude 4를 출시하며 “컴퓨터 사용(Computer Use)” 기능을 GA(일반 출시)로 전환했습니다. SWE-bench Verified에서 72.5%, Terminal-bench에서 43.2%를 기록하며 코딩 에이전트 분야의 선두를 차지했죠. 수천 단계가 필요한 장기 실행 작업에서도 지속적 성능을 보여주었고, 수 시간 동안 연속 작업이 가능했습니다.
2025년 9월 — Anthropic이 에이전트 생태계를 정리하다
Anthropic이 Claude Code SDK를 Claude Agent SDK로 리브랜딩했습니다. Claude Code가 코딩 도구를 넘어 딥 리서치, 비디오 생성, 노트 테이킹 등 거의 모든 주요 에이전트 루프를 구동하기 시작했기 때문이죠.
“효과적인 에이전트를 만드는 것은 에이전트가 작동하는 환경을 설계하는 것이다. 환경이 좋을수록 에이전트가 취하는 행동도 좋아진다.”— Anthropic Engineering Blog (2025.09.29)
2025년 11~12월 — 프론티어 모델 전쟁
25일 동안 4개의 프론티어 모델이 연달아 출시되는 전례 없는 경쟁이 벌어졌습니다.
- 11월 17일: xAI Grok 4.1 (LMArena 1483 Elo)
- 11월 18일: Google Gemini 3 + Deep Think 모드
- 11월 24일: Anthropic Claude Opus 4.5 (SWE-bench 80.9%)
- 12월 11일: OpenAI GPT-5.2 (GPQA Diamond 93.2%)
출처: Anthropic Claude 4 / Claude Agent SDK (2025.09.29) / OpenAI Operator
에이전틱 AI의 핵심 프레임워크들
MCP — “에이전트의 USB-C”
2024년 11월, Anthropic이 Model Context Protocol(MCP)을 오픈소스로 공개했습니다. AI 에이전트가 다양한 도구와 데이터 소스에 접근하기 위한 표준화된 프로토콜로, 마치 USB-C가 다양한 기기를 하나의 포트로 연결하듯, MCP는 다양한 서비스를 하나의 프로토콜로 연결합니다.
2025년 중반까지 MCP는 Linux Foundation에 합류하여 업계 표준으로 자리 잡았고, OpenAI, Google, Microsoft 등 주요 기업들이 지원을 선언했습니다.
A2A 프로토콜 — 에이전트 간 통신
2025년 4월, Google이 Agent2Agent Protocol(A2A)을 공개했습니다. MCP가 “에이전트와 도구” 사이의 통신이라면, A2A는 “에이전트와 에이전트” 사이의 통신을 표준화하는 프로토콜입니다. 50개 이상의 기업이 초기 파트너로 참여했죠.
시장 규모: 숫자가 말해주는 것들
에이전틱 AI의 시장 성장세는 놀랍습니다.
| 지표 | 수치 |
|---|---|
| 2025년 에이전틱 AI 시장 규모 | 약 51.6억 달러 |
| 2030년 예상 시장 규모 | 780억 달러 (CAGR 44.8%) |
| “AI 에이전트” 구글 검색량 증가 | 2024년 1월 대비 2025년 5월 1,000% 이상 |
| 개발자의 정기적 AI 도구 사용률 | 약 85% (2025년 말) |
Gartner는 2028년까지 기업 소프트웨어 결정의 33%가 AI 에이전트에 의해 이루어질 것이라 전망했으며, 이는 2024년의 1% 미만에서 극적으로 증가한 수치입니다.
출처: Gartner / Grand View Research
“에이전틱 AI”는 얼마나 자율적일까?
중요한 구분이 있습니다. Anthropic의 정의에 따르면, 에이전틱 시스템에는 두 가지 유형이 있습니다.
- 워크플로우(Workflow): LLM과 도구가 미리 정의된 코드 경로를 따라 조율되는 시스템
- 에이전트(Agent): LLM이 동적으로 자체 프로세스와 도구 사용을 지시하는 시스템
현실에서는 이 두 가지가 혼합되어 사용되며, 대부분의 프로덕션 시스템은 순수한 자율 에이전트보다는 워크플로우와 에이전트의 조합입니다. Anthropic의 조언은 “가능한 한 단순하게 시작하고, 필요할 때만 복잡성을 추가하라”는 것이었습니다.
남아있는 과제들
에이전틱 AI가 주류가 되었다고 해서 모든 문제가 해결된 건 아닙니다.
- 신뢰성(Reliability): 에이전트가 장기간 자율 실행될 때 예상치 못한 동작을 할 수 있음
- 비용: 다단계 추론은 훨씬 많은 토큰을 소비하며, 비용이 빠르게 증가
- 보안과 프라이버시: 에이전트가 외부 도구와 데이터에 접근할 때의 권한 관리
- 컨텍스트 롯(Context Rot): 에이전트가 장시간 작업할수록 컨텍스트가 쌓이면서 성능이 저하되는 현상 (다음 글에서 자세히 다룹니다)
마무리
2025년은 AI가 “대화 상대”에서 “일하는 동료”로 변모한 해였습니다. OpenAI의 Operator, Anthropic의 Claude Agent SDK, Google의 ADK, 그리고 MCP와 A2A 같은 표준 프로토콜이 에이전틱 AI의 기반을 놓았고, 2025년 말의 프론티어 모델 전쟁은 이 변화를 가속화했습니다.
가장 중요한 시사점은 이것입니다: AI의 가치가 “더 똑똑한 모델”에서 “더 효과적인 에이전트 시스템”으로 이동하고 있다는 것. 모델의 크기와 벤치마크 점수도 중요하지만, 그 모델이 실제 작업 환경에서 도구를 사용하고, 계획을 세우고, 자율적으로 문제를 해결할 수 있느냐가 진짜 차별점이 되고 있습니다.
📚 주요 출처