컨텍스트 설계가 곧 AI 도구 비용이다

AI 코딩 도구 비용을 처음 마주하면 자연스럽게 '얼마나 많이 생성했는가'를 따지게 된다. 컴포넌트 몇 개, 테스트 몇 줄, 문서 몇 페이지. 그런데 실제 청구서를 뜯어보면 이 직관이 틀렸다는 걸 알게 된다. 비용의 무게중심은 출력이 아니라 입력, 즉 AI가 '이해하기 위해 읽은 것들'에 있다.

개발자 커뮤니티에서 회자되는 한 가지 실험이 이를 명확하게 보여준다. "날짜 포맷 유틸리티 함수를 만들어줘"와 "이 피처를 리뷰하고 개선점을 제안해줘"—두 프롬프트의 출력 길이는 비슷할 수 있다. 하지만 전자는 좁고 명확한 컨텍스트만 필요하고, 후자는 여러 파일을 탐색하고, 의존성을 파악하고, 기존 패턴을 비교하고, 해당 피처가 존재하는 이유까지 이해해야 한다. AI 에이전트가 자동완성보다 느리고 비싸게 느껴지는 이유가 바로 여기 있다. 에이전트는 코드를 쓰기 전에 읽는 데 대부분의 토큰을 소비한다.

Uber가 모든 직원의 AI 코딩 도구 월 지출을 1,500달러로 제한했다는 소식은 이 맥락에서 단순한 비용 통제 뉴스가 아니다. Uber는 2025년에 2026년 AI 예산을 세웠지만, 에이전트형 도구의 인기가 예상보다 빠르게 치솟으면서 4개월 만에 예산을 소진했다. 에이전트형 도구는 태생적으로 컨텍스트를 많이 먹는다. 리포지토리 인덱싱, 관련 파일 탐색, 터미널 실행 결과 처리—이 모든 것이 첫 번째 코드 줄을 생성하기도 전에 대량의 입력 토큰을 소모한다. Uber의 예산 초과는 에이전트 특유의 컨텍스트 소비 구조를 미리 설계에 반영하지 못한 결과다.

그렇다면 컨텍스트를 어떻게 설계해야 할까. CLAUDE.md 운용 경험에서 흥미로운 패턴이 드러난다. 프로젝트 규칙 파일이 4,000토큰을 넘어서자 에이전트가 오랫동안 잘 지켜오던 규칙들을 누락하기 시작했다—파일 상단 규칙이 아니라 중간에 묻힌 규칙들이 먼저 빠졌다. 에이전트의 주의(attention)는 입력 전체에 균일하게 분포하지 않는다. 파일 앞쪽이 훨씬 높은 신뢰도로 적용된다. 결국 CLAUDE.md는 단순한 규칙 목록이 아니라 토큰 예산을 배분하는 설계 문서다.

이 관점에서 각 규칙의 가치를 재평가하면 사고방식이 달라진다. '이 규칙이 유용한가'가 아니라 '이 규칙이 소비하는 토큰만큼의 가치를 매 세션마다 돌려주는가'를 물어야 한다. 분기에 한 번 프로덕션 장애를 막는 30토큰짜리 규칙은 압도적으로 남길 가치가 있다. 에이전트가 실제로 생성하지도 않는 패턴을 150토큰으로 설명하는 규칙은 나쁜 거래다. 통합(Consolidate), 압축(Compress), 스코프 축소(Scope down), 삭제(Delete)—이 네 가지 움직임은 리팩토링이 아니라 예산 회계다.

프론트엔드 개발자 시각에서 이 문제가 흥미로운 이유는 컨텍스트 설계가 UX 설계와 같은 구조를 띠기 때문이다. 사용자에게 불필요한 정보를 쏟아붓는 인터페이스가 인지 부하를 높이듯, AI에게 불필요한 컨텍스트를 던지는 프롬프트는 품질과 비용을 동시에 악화시킨다. "이 피처를 리뷰해줘" 대신 "이 두 파일의 인증 로직을 리뷰해줘"로 범위를 좁혔을 때, 뻔한 네이밍 제안 대신 미처 발견하지 못한 세션 무효화 엣지케이스가 돌아왔다는 사례는 이를 잘 보여준다. 좁은 컨텍스트가 더 깊은 답을 끌어낸다. 이건 비용 절감이 아니라 품질 향상이다.

실무적으로 몇 가지 원칙이 도움이 된다. 첫째, 로그 전체를 붙여넣는 대신 관련 스택 트레이스만 잘라낸다—대부분의 경우 답의 품질은 같다. 둘째, CLAUDE.md의 규칙 중 린트나 ESLint 플러그인으로 기계적으로 강제할 수 있는 것은 파일 밖으로 빼낸다. 린트는 토큰 비용 없이 규칙을 실행한다. 셋째, 프로젝트 루트의 규칙 중 특정 모듈에만 해당하는 것은 그 모듈 디렉토리의 CLAUDE.md로 옮긴다. 관련 없는 세션에서 공짜로 토큰을 소비하지 않는다.

Uber의 예산 초과 사태와 CLAUDE.md 규칙 누락 사고는 결국 같은 구조적 실패를 가리킨다. 컨텍스트를 설계하지 않고 쌓아두면, 비용은 예측 불가능하게 치솟고 품질은 소리 없이 떨어진다. AI 도구의 비용은 모델을 선택하는 순간이 아니라 컨텍스트를 설계하는 순간에 결정된다. 토큰 가격이 경쟁 압력으로 내려가더라도, 컨텍스트 설계 없이 에이전트를 운용하는 팀은 더 싼 토큰을 더 많이 낭비하는 방식으로 같은 실수를 반복할 것이다.

앞으로 AI 워크플로우를 설계하는 프론트엔드 팀에게 컨텍스트 아키텍처는 선택지가 아닌 필수 역량이 될 것이다. 어떤 정보를 언제 어떤 형식으로 AI에게 전달할지—이 결정이 응답 품질과 운영 비용을 동시에 결정한다. 코드를 잘 짜는 것만큼이나, 이제는 컨텍스트를 잘 설계하는 능력이 개발자의 실력을 가른다.

컨텍스트 설계가 곧 AI 도구 비용이다

출처