AI 코딩 에이전트, 믿기 전에 통제하라: 프로덕션 거버넌스 설계법

에이전트는 유능하다. 그래서 더 위험하다

Claude Code, Cursor, Copilot, Aider. 이 도구들이 코드를 생성하는 능력 자체를 의심하는 팀은 이제 거의 없다. 문제는 다른 곳에 있다. 에이전트가 무엇을 했는지, 왜 했는지, 누가 승인했는지—이 세 가지 질문에 답할 수 없는 팀이 여전히 대부분이다. 3주 전 diff를 열었을 때 맥락이 사라져 있거나, 에이전트가 어제 결정한 내용을 오늘 번복하거나, git push --force가 아무런 제지 없이 실행되는 상황. 이건 도구의 문제가 아니라 거버넌스의 부재다.

25년 엔터프라이즈 거버넌스가 발견한 공통 실패 패턴

dev.to에 공개된 Agentic Engineering Framework 사례는 흥미로운 출발점에서 시작한다. Shell에서 1,000건 이상의 IT 전환에 적용된 거버넌스 프레임워크를 AI 에이전트에 그대로 이식한 것이다. 저자가 관찰한 에이전트의 구조적 실패 모드는 네 가지로 압축된다.

추적 불가(No Traceability): 파일은 바뀌는데 이유가 없다. 태스크도, 의사결정 기록도, 감사 이력도 없다.
메모리 없음(No Memory): 세션이 끊기면 제로에서 재시작. 전날 결정한 내용을 에이전트가 다음 세션에서 뒤집는다.
리스크 인식 부재(No Risk Awareness): force push의 위험을 에이전트는 모른다. 구조화된 권한 모델이 없으니 무엇이 인간 승인 대상인지도 모른다.
학습 루프 없음(No Learning Loop): 실패가 기록되지 않으니 같은 실수가 반복된다.

이 목록이 낯설지 않다면 정상이다. 거버넌스 없이 운영된 모든 프로그램에서 반복되는 패턴이기 때문이다.

설계 원칙 1: 태스크 게이트—관례가 아닌 기계적 강제

Agentic Engineering Framework의 핵심은 단순하다. 태스크 없이는 아무것도 진행되지 않는다. 이건 컨벤션이 아니라 게이트다. Claude Code에서는 파일 수정 시도 자체를 인터셉트해, 활성 태스크가 없으면 블록한다. 컨텍스트 윈도우가 75%를 넘으면 자동 핸드오버가 트리거된다.

권한 모델도 명확하게 계층화된다.

계층	범위	승인 주체
Tier 0	`--force`, `rm -rf`, `DROP TABLE` 등 파괴적 명령	인간 필수 승인
Tier 1	모든 파일 수정	활성 태스크 필요
Tier 2	상황별 예외	1회성, 로그 기록
Tier 3	읽기 전용 작업	사전 승인

에이전트는 이니셔티브(Initiative)를 갖는다. 어떤 태스크를 선택할지, 어떻게 구현할지 제안할 수 있다. 그러나 권한(Authority)은 없다. 구조적 게이트를 우회하거나, 인간 소유 태스크를 완료 처리하거나, 파괴적 명령을 독자 실행할 수 없다. 이니셔티브는 권한이 아니다—이 구분이 에이전트 시스템에서 가장 위험한 실패 모드를 막는 핵심이다.

설계 원칙 2: 하네스 경량화—모델보다 스캐폴딩이 먼저다

8개월, 5개 프로덕션 앱을 운영한 실무 경험을 정리한 Agent Harness Engineering 사례는 다른 각도에서 같은 결론에 닿는다. Anthropic이 Opus 4.5에 더 나은 스캐폴딩을 적용했더니 벤치마크가 36점 올랐다. LangChain은 모델을 바꾸지 않고 하네스만 바꿔 코딩 에이전트 성능을 52.8%에서 66.5%로 끌어올렸다. 하네스가 모델보다 중요하다는 명제는 이미 데이터로 검증됐다.

문제는 하네스를 어떻게 설계하느냐다. 이 사례가 8개월간 직접 저지른 실수 세 가지는 팀이라면 반드시 먼저 읽어야 할 내용이다.

실수 1: 툴 12개 연결 → 실제 필요한 건 4개였다. MCP 툴을 12개 연결했더니 에이전트가 어떤 툴을 쓸지 결정하는 데 실제 문제를 푸는 것보다 더 많은 시간을 썼다. 툴 설명을 계약서 수준으로 정밀하게 다시 쓰고 8개를 제거했더니 툴 호출이 40% 줄었다.

실수 2: MCP 서버 대신 CLI 래퍼. 6개 MCP 서버를 표준 방식으로 통합하면 스키마 정의만으로 47,000 토큰이 소비된다. Manus는 MCP 툴을 CLI를 통해 bash로 노출시켜 같은 기능을 약 400 토큰에 해결했다. Vercel도 같은 실험에서 도구를 축소하고 bash 직접 접근을 허용했더니 성공률 100%, 속도 3.5배 향상을 기록했다.

실수 3: 한 번 만든 것은 절대 안 지운다는 착각. 2주 동안 만든 외부 메모리 서브시스템을 삭제했더니 응답 지연이 2.3초 감소하고 사용자 만족도가 올라갔다. 모델이 세션 내 컨텍스트를 충분히 유지할 만큼 발전해 있었는데, 메모리 레이어가 오히려 3개월 전 스테일 데이터를 주입하고 있었다. 하네스가 3개월째 줄어들지 않았다면 이미 너무 크다.

이 세 가지 실수의 공통 원인은 하나다. 모델에게 너무 많은 것을 너무 일찍, 너무 오래 준다. 해법은 점진적 노출(Progressive Disclosure)—지금 이 태스크에 필요한 것만 보여주고 나머지는 숨긴다. Cursor가 전체 가용 토큰의 47%를 특정 시점에 필터링하는 이유가 여기 있다.

설계 원칙 3: 7계층 스택—코딩 어시스턴트는 겨우 시작점

2026년 개발자 AI 도구 실사용 현황 분석(dev.to)은 불편한 현실을 수치로 보여준다. 개발자의 84%가 AI 도구를 사용하거나 도입 예정이지만, 대부분 IDE 코딩 어시스턴트 한 층에만 머물러 있다. 그러나 코딩 어시스턴트가 해결하는 건 하루 업무의 기껏해야 20%다. 나머지 80%—PR 리뷰 사이클, 배포 알림 대응, 태스크 조율, 문서 부채—는 여전히 수동이다.

프로덕션 수준의 AI-First 워크플로우는 실제로 7개 계층으로 구성된다.

IDE 코드 생성 (Copilot / Cursor)
AI 코드 리뷰 (CodeRabbit): 월 4,300만 건 PR 시대, 인간 리뷰어의 병목을 first-pass 자동화로 해소
워크플로우 자동화 에이전트 (Nebula): 규칙 기반 자동화가 처리 못하는 판단이 필요한 조율 작업
AI 컨텍스트 메모리 (Pieces): 세션 간 스니펫·결정·아키텍처 맥락 영속 보존
AI 네이티브 터미널 (Warp): 자연어로 명령 생성, 에러 자동 해석
지능형 프로젝트 관리 (Linear + AI)
AI 문서 작성 (Mintlify)

이 중 팀 거버넌스 관점에서 즉시 도입 가치가 높은 건 2번과 3번이다. AI가 생성한 코드가 늘수록 코드 리뷰 부하는 비례해서 증가하고, 에이전트가 조율 작업까지 맡기 시작하면 '누가 승인했는가'에 대한 가시성이 더 중요해진다.

팀 리드에게 필요한 시각: 도구 도입보다 거버넌스 설계가 먼저

세 사례를 교차해서 읽으면 하나의 패턴이 보인다. 에이전트를 도입하는 팀은 많지만, 에이전트를 통제하는 팀은 드물다. 그리고 통제 실패는 도구 선택의 문제가 아니라 설계의 문제다.

실용적인 출발점을 제안하면 이렇다.

지금 당장: CLAUDE.md에 태스크-퍼스트 원칙을 명문화하고, 파괴적 명령(force push, 대규모 삭제)에 대한 인간 승인 프로세스를 팀 컨벤션이 아닌 게이트로 격상시킨다.
이번 스프린트: 연결된 MCP 툴 목록을 감사하고, 실제 호출 빈도를 측정해 하위 50%를 잘라낸다. 툴 설명을 모호한 기능 기술에서 입력-출력-제약 조건이 명시된 계약서 형태로 바꾼다.
이번 분기: 에이전트 세션 간 컨텍스트 보존 메커니즘을 구축한다. 에피소딕 메모리든 CLAUDE.md 업데이트 루틴이든, 어제의 결정이 오늘 세션에 도달하는 경로가 있어야 한다.

전망: 하네스는 줄어들고, 거버넌스는 깊어진다

Manus의 Chief Scientist가 남긴 말은 짧고 정확하다. "모델이 강해질수록 더 많은 스캐폴딩을 쌓는 게 아니라, 모델의 길을 비켜줘야 한다." Anthropic도 같은 맥락에서 경고한다. 모델 역량이 높아지면 과거에 필요했던 도구들이 오히려 제약이 된다.

이 흐름이 의미하는 건 두 가지다. 하네스는 계속 경량화 방향으로 진화하고, 거버넌스는 반대로 더 정교해진다. 에이전트가 더 많은 권한과 더 긴 컨텍스트를 갖게 될수록 누가, 무엇을, 왜 결정했는가에 대한 추적 가능성의 값어치는 높아진다.

Gartner는 2028년까지 기업 애플리케이션의 33%에 에이전트형 AI가 포함될 것으로 전망한다. 그 시점에 팀이 경쟁력을 갖추려면 도구를 쌓는 것보다 거버넌스를 먼저 설계해야 한다. 에이전트를 믿는 건 거버넌스를 구축한 다음의 일이다.