AI 팀원은 왜 갑자기 이상한 짓을 할까
팀에서 AI 도구를 열심히 쓰다 보면 반드시 이 경험을 하게 된다. 분명히 잘 돌아가던 AI가 어느 날 전혀 엉뚱한 결과물을 내놓는다. 버그가 생긴 게 아니다. 모델이 나빠진 것도 아니다. 대부분의 경우 원인은 하나다. 컨텍스트가 끊겼다.
실패 사례 1: 900줄짜리 오작동
dev.to에 올라온 한 인디 개발자의 사례가 이 문제를 적나라하게 보여준다. Forge4D 프로젝트에서 SML 파서를 C#에서 C++로 포팅하는 작업이 성공적으로 끝났다. 속도가 15배 빨라졌다. 그런데 다음 세션에서 이 개발자는 Codex에게 "기존 C# 파서를 삭제해 달라"고 지시했다. 문제는 새 C++ 버전이 이미 있다는 사실을 컨텍스트에 포함하지 않은 것이다.
Codex는 논리적으로 추론했다. '기존 파서를 지운다 = 새 파서가 필요하다.' 그리고 GDScript로 900줄짜리 파서를 새로 작성했다. 결과물의 로직 자체는 나무랄 데 없었다. 전제가 틀렸을 뿐이다.
이 개발자가 사건 이후 정리한 규칙은 단순하지만 강력하다. "컨텍스트는 기억이 아니다. 기억은 컨텍스트가 아니다. 컨텍스트는 사람이 능동적으로 유지해야 한다." Human-in-the-loop는 선택이 아니라 아키텍처라는 것이다.
실패 사례 2: 도구를 바꿀 때마다 리셋되는 기억
더 일상적인 문제도 있다. Claude Code, Cursor, Codex CLI를 동시에 쓰는 개발자라면 익숙한 풍경이 있다. 도구를 바꿀 때마다 "지난 스프린트에 이메일 프로바이더 바꿨어요