AI 에이전트 기술 부채, 속도보다 통제 설계가 먼저다

AI 에이전트가 코드를 쓰는 속도는 팀의 생산성 지표를 단기간에 바꿔놓는다. 그런데 그 숫자 뒤에서 조용히 쌓이는 것이 있다. dev.to에 올라온 분석 글 Everyone Is Building AI Agents. Nobody Is Talking About the Technical Debt는 이 현상에 '에이전틱 부채(agentic debt)'라는 이름을 붙인다. 전통적 기술 부채가 코드 안에 있어서 린터와 리뷰로 잡을 수 있었다면, 에이전틱 부채는 프롬프트·컨텍스트 시스템·메모리 레이어·평가 파이프라인 안에 숨어 있다. 코드베이스가 아무리 깨끗해도 에이전트는 프로덕션에서 무너질 수 있다.

세 가지 부채 유형이 특히 눈에 띈다. 첫째는 프롬프트 부채다. 처음엔 두 줄이었던 시스템 프롬프트가 예외 케이스를 패치하다 보면 300줄 규칙 집합으로 불어난다. 팀원 누구도 특정 문장을 왜 지우면 안 되는지 설명하지 못하는 순간, 그 프롬프트는 누구도 손대지 못하는 레거시 SQL 스토어드 프로시저와 다르지 않다. 둘째는 컨텍스트 부채다. RAG 파이프라인에 PDF, DB 스키마, Slack 로그를 무제한 투입하면 LLM이 오히려 관련 정보를 놓친다. Lost in the Middle 논문이 실증했듯 긴 컨텍스트의 중간부는 모델이 제대로 참조하지 못한다. 2022년·2024년·2026년 세 버전의 환불 정책이 벡터 DB에 공존하면 에이전트는 그냥 순환한다. 셋째는 평가 부채다. 에이전트의 출력은 비결정적이어서 '입력 → 단일 정답' 방식의 테스트가 작동하지 않는다. 자동화된 평가 파이프라인 없이 배포하면, 프롬프트 최적화가 한 버그를 고치는 동안 다른 시나리오의 15%를 조용히 망가뜨리는지 아무도 모른다.

이 부채들을 설계 단계에서 통제하는 실용적 접근이 이미 현장에서 작동하고 있다. 22개 저장소에 15분마다 PR 리뷰를 자동 실행하는 Hermes Agent 사례(dev.to)는 에이전트 운영의 올바른 기본기를 보여준다. 핵심은 Human-in-the-Loop 원칙이다. 에이전트는 보안 결함, N+1 쿼리, 누락된 테스트를 분석하고 Telegram으로 버딕트를 요약하지만, 머지 결정은 사람이 한다. GitHub App 방식으로 토큰을 1시간마다 갱신해 권한 범위를 pull_requests: write와 contents: read로 최소화한 것도 주목할 지점이다. 에이전트가 잘못됐을 때의 '폭발 반경(blast radius)'을 설계 단계에서 제한한 셈이다.

코드 생성 속도가 올라갈수록 보안 검증을 사후로 미루는 관성이 강해진다. 스패로우가 출시한 Sparrow MCP는 이 관성에 정면으로 반기를 든다. Claude Code, Cursor 같은 AI 코딩 에이전트와 MCP(Model Context Protocol)로 연동해, 코드가 생성되는 즉시 소스 취약점과 오픈소스 라이선스·SBOM을 분석한다. LLM 학습 데이터에 포함된 보안 약점이 생성 코드에 그대로 반영될 수 있다는 구조적 리스크를 IDE 레이어에서 차단하는 방식이다. 에이전틱 부채의 맥락에서 보면, 이건 단순한 보안 도구 추가가 아니다. AI 생성 결과물이 평가 파이프라인에 도달하기 전에 걸러내는 앞단 품질 게이트를 워크플로우에 내재화하는 구조 설계다.

이 세 흐름이 가리키는 방향은 하나다. 에이전트를 켜는 결정보다 에이전트가 켜진 뒤의 통제 설계가 훨씬 어렵고, 훨씬 중요하다. 팀 리드 입장에서 내일 당장 적용할 수 있는 체크포인트를 꼽으면 세 가지다. 프롬프트를 코드처럼 버전 관리하라. 수정 이력 없는 프롬프트는 어느 순간 아무도 건드리지 못하는 레거시가 된다. RAG 데이터 소스에 TTL과 버전 태그를 붙여라. 컨텍스트 양이 아니라 컨텍스트 품질이 에이전트 정확도를 결정한다. 에이전트 배포와 평가 파이프라인은 동시에 설계하라. 황금 데이터셋 없이 배포된 에이전트는 드리프트를 감지할 수단 자체가 없다.

속도는 에이전트가 가져다준다. 통제는 설계에서 나온다. AI가 코드를 빠르게 생성할수록, 그 결과물을 검증하는 레이어를 먼저 설계하지 않으면 기술 부채는 더 이상 코드 안에만 있지 않다. 프롬프트 한 줄, 벡터 DB 한 컬렉션, 평가 스크립트 하나—이것들이 결국 프로덕션 안정성을 결정하는 숨겨진 아키텍처다.

AI 에이전트 기술 부채, 속도보다 통제 설계가 먼저다

출처