일본인 개발자가 한 가지 불편한 측정값을 공유했다. Claude Code, Cursor, Copilot을 약 1년간 쓰면서 프로덕션 수준의 결과물을 얻기까지 필요한 프롬프트 수정 횟수를 추적했더니, 일본어로 작업할 때는 평균 4~6회, 영어를 주로 쓰는 동료는 1~3회였다. 같은 AI, 같은 모델, 비슷한 태스크 복잡도—그런데 결과가 달랐다. dev.to에 올라온 이 관찰은 단순한 언어 차이 이야기처럼 보이지만, 실제로는 훨씬 더 근본적인 문제를 건드리고 있다.
핵심은 '고맥락(high-context) 언어'의 특성이다. 일본어는 주어 생략이 문법적으로 자연스럽고, 모호한 표현이 사회적으로 선호되며, 경어 구조가 의도를 겹겹이 감싼다. "적절하게 처리해주세요"는 인간 동료 사이에서는 완전한 지시지만, AI에게는 빈칸 채우기 문제다. AI는 그 "적절함"이 여섯 달간 팀이 쌓아온 암묵적 결정들을 의미한다는 걸 알 수 없다. 그냥 학습 데이터의 전체 분포에서 가장 그럴듯한 패턴으로 빈칸을 채울 뿐이다.
그런데 솔직히 말하면, 이건 일본 팀만의 문제가 아니다. 고맥락 문화의 암묵지 밀도가 높을수록 AI 출력과 팀 의도 사이의 간극이 커진다는 메커니즘은 어느 팀에나 적용된다. 해당 글이 정리한 '6가지 암묵지 사각지대'를 보면 낯설지 않을 것이다. 작성자마다 포맷이 다른 문서, 시니어 개발자 머릿속에만 있는 코딩 컨벤션, 개발 중엔 무시되고 릴리즈 직전에야 떠오르는 보안 가정, 구두로만 전달되는 우선순위, 해피패스만 테스트하는 관행, 장애 대응 노하우를 독점한 한 명. 이것들의 공통점은 '지식의 부재'가 아니라 '지식이 단 한 곳—특정인의 머릿속—에만 존재한다'는 것이다.
글에서 소개된 가상 시나리오가 뼈아프게 현실적이다. AI 지원으로 한 달 만에 의료 예약 시스템 MVP를 만들었는데, 세 명의 개발자가 각자 AI에게 "예약 충돌 처리해줘"라고 요청해서 세 가지 버전의 충돌 로직이 생겼다. AI는 각자에게 합리적인 구현을 줬다. 인가 검증 없이 환자 기록이 노출됐다. 프롬프트에 "이 사용자의 예약 가져와"라고만 했고, "요청자가 해당 환자 기록에 접근 권한이 있는지 확인해"라는 맥락을 아무도 주지 않았다. AI는 물어본 대로만 했다. 시스템은 오픈 첫 주에 내려갔다.
이 지점에서 두 번째 소스가 정확히 맞물린다. dev.to에 소개된 Agentskill은 저장소를 정적 분석해서 AI 에이전트가 실제로 쓸 수 있는 AGENTS.md를 생성하는 도구다. 핵심 가치는 단순하다. "이 저장소는 pytest와 black을 쓰는 것 같다"가 아니라, "이 저장소는 이 테스트 명령어, 이 포맷 컨벤션, 이 도구 설정을 쓰는데, 저장소에서 직접 감지했다"는 차이다. LLM이 추측하는 게 아니라, 저장소 구조·설정 파일·깃 히스토리·심볼 패턴을 실제로 파싱해서 근거 있는 지시문을 만든다.
테크 리드 입장에서 이 두 가지 접근을 합치면 실행 가능한 설계 원칙이 나온다. AI 코딩 어시스턴트의 진짜 병목은 코드 생성 품질이 아니라, AI가 접근할 수 있는 컨텍스트의 밀도다. CLAUDE.md, .cursorrules, AGENTS.md—명칭이 뭐든 이 파일들은 단순한 문서가 아니다. 팀의 암묵지를 AI가 읽을 수 있는 형태로 변환한 인터페이스다. 시니어 개발자가 코드 리뷰에서 조용히 걸러내던 결정들을 파일 하나에 명문화하면, 그 순간부터 AI는 그 컨벤션을 전제로 코드를 생성한다.
실용적인 시작점을 짚자면 세 가지다. 첫째, AI에게 중요한 태스크를 맡기기 전에 5분을 써서 시니어가 코드 리뷰에서 걸러낼 규칙 한 문단을 적어라. 완벽한 스펙이 아니어도 된다. AI가 기본값으로 채울 공백을 줄이는 것이 목표다. 둘째, 구현을 요청하기 전에 AI에게 스펙을 먼저 작성하게 해라. 입출력 타입, 에러 케이스, 보안 가정, 비즈니스 룰. 리뷰하고 나서 구현을 시켜라. 마찰이 추가되는 건 사실이지만, 그 마찰이 막아주는 버그는 훨씬 비싸다. 셋째, Agentskill 같은 저장소 분석 도구로 이미 코드베이스에 존재하는 컨벤션을 자동으로 추출해 AGENTS.md를 만들어라. 암묵지의 상당 부분은 이미 코드 안에 패턴으로 존재한다—그걸 AI가 읽을 수 있게 꺼내기만 하면 된다.
전망은 명확하다. AI 코딩 어시스턴트가 강해질수록, 컨텍스트를 얼마나 잘 설계했느냐가 팀 간 생산성 격차를 결정하는 변수가 된다. 모델 성능의 수렴 속도가 빠르다면 결국 같은 모델을 쓰는 팀들 사이에서 차이를 만드는 건 컨텍스트 설계 역량이다. '암묵지를 명문화하는 것'은 AI 시대에 팀이 해야 할 지식 관리의 핵심 업무가 됐다. 그리고 그 업무를 미루는 팀은, AI를 빠른 기술 부채 생성기로 사용하고 있는 것과 다를 바 없다.