AI가 죽이는 건 개발자 직업이 아니라 개발자 습관이다

진짜 위협은 해고 통보가 아니다

"AI가 개발자를 대체한다"는 헤드라인은 틀렸다. 하지만 그 헤드라인을 그냥 무시하는 것도 다른 종류의 실수다. dev.to의 분석이 정확하게 짚은 지점이 있다. AI 코딩 도구가 실제로 압축하고 있는 것은 잘 정의된 스펙을 실행하는 역할, 즉 보일러플레이트 작성, 반복 패턴 구현, 표준 인증 플로우 세팅 같은 작업이다. FastAPI 엔드포인트 하나를 20분에서 2분으로 줄이는 건 과장이 아니다. 현장에서 이미 벌어지고 있다.

문제는 그 시간이 어디로 가야 하는가다.

ZIRP가 만들어놓은 착각

GeekNews에서 화제가 된 seangoedecke.com의 글은 불편하지만 유용한 맥락을 제공한다. 2008년부터 2022년까지 이어진 제로금리 시대(ZIRP)는 기술 기업이 엔지니어를 수십 명에서 수천 명으로 늘릴 수 있게 했다. 이 환경에서 "그냥 안 된다고 하는 엔지니어" 원형이 번성했다. 변경을 막고, 복잡도를 줄이고, 코드가 적게 쓰이게 하는 역할이다. 생산성 손실이 크게 문제되지 않던 시절, 이 역할은 시스템이 무너지지 않게 잡아주는 기능을 했다.

ZIRP가 끝나자 이 보호막이 사라졌다. 금리가 오르고 기업은 매출을 증명해야 했다. 공교롭게도 이 시기에 ChatGPT가 등장했고, 기업들은 구조조정을 "AI 덕분에 절반의 인원으로 두 배 효율을 낸다"고 설명할 수 있었다. 원인의 순서가 뒤바뀐 채 서사가 만들어진 것이다. AI가 변화를 이끈 게 아니라, 경제적 유인의 변화 위에 AI가 얹혔다.

AI 산출물의 품질 문제: 보이지 않는 비용

그런데 "충분히 쓸 만한" AI 코드가 쌓이면 어떤 일이 생기나. 여기서 두 번째 기사가 중요해진다. dev.to에서 다룬 Promptolian 팀의 실증 벤치마크는 AI 에이전트의 컨텍스트 압축 품질을 수치로 드러낸다. Anthropic 내장 압축은 98.7% 압축률에 품질 점수 3.44/5, OpenAI는 99.3% 압축에 3.35/5다. 두 시스템 모두 레드존이다.

무슨 의미냐면, AI 에이전트가 메시지 30번째쯤 되면 데이터베이스 URL을 다시 물어보고, 50번째쯤 되면 세 턴 전에 논의된 설정값을 잘못 기억한다는 것이다. 압축 과정에서 postgres://db.prod/main이라는 구체적인 사실이 "데이터베이스 연결이 논의됐다"로 바뀐다. 정확하지만 쓸모없는 요약이다.

Factory.ai의 May 2026 측정에 따르면 사실 손실률은 Anthropic 기준 31.2%, OpenAI 기준 33.0%다. 세 번에 한 번꼴로 중요한 사실이 사라진다. 이 손실은 API 비용 청구서에 찍히지 않는다. 엔지니어가 다시 컨텍스트를 설명하고, 오류를 잡고, 작업을 반복하는 시간으로 나타난다. 시간당 $100 엔지니어 기준으로 컨텍스트 실패 한 건당 3.5분 이상 소비된다면, 최대 압축이 아니라 22% 압축이 실제로 더 저렴하다는 게 이 분석의 결론이다.

팀 리빌딩에서 진짜 설계해야 할 것

두 문제를 합쳐서 보면 테크 리드가 마주한 구조적 과제가 선명해진다.

첫째, 역할 공백을 명시적으로 채워야 한다. AI가 보일러플레이트와 반복 패턴을 처리한다면, 그 시간을 어디에 투자할지 설계하지 않으면 팀은 그냥 바빠진다. 시스템 설계, 아키텍처 결정, 비즈니스 컨텍스트 해석, 모호한 요구사항 탐색 — 이것들이 AI가 채우지 못하는 영역이다. 이 역할을 팀 내에서 누가 맡고, 어떤 기준으로 판단하는지 명시적으로 설계해야 한다. "시니어는 AI가 못 하는 걸 한다"는 말은 방향이지 설계가 아니다.

둘째, AI 산출물의 품질 감시를 파이프라인에 구조화해야 한다. "충분히 쓸 만한" 코드가 리뷰 없이 쌓이면 기술 부채는 조용히 커진다. 컨텍스트 압축 문제처럼, AI 에이전트가 무엇을 잊어버렸는지 아무도 측정하지 않으면 그 실패는 나중에 더 비싸게 돌아온다. 코드 리뷰 레이어에서 AI 생성 코드를 식별하고, 도메인 지식이 요구되는 부분을 인간이 검증하는 체계가 필요하다.

셋째, "안 된다"는 판단과 "빠르게 간다"는 판단 사이의 균형점을 팀마다 다시 조정해야 한다. ZIRP 시대의 게이트키퍼 문화는 이제 작동하지 않는다. 하지만 그렇다고 모든 AI 생성 PR을 그냥 머지하는 것이 답도 아니다. 금융, 의료, 인프라 레이어처럼 실패 비용이 높은 영역과 빠른 실험이 필요한 신기능 레이어를 구분하고, 각 레이어에 맞는 검증 기준을 명시적으로 정해야 한다.

앞으로 더 선명해질 것들

AI 코딩 도구의 ROI는 코드 생성 속도가 아니라 팀이 확보한 시간을 어디에 쓰는가로 결정된다. 컨텍스트 압축 품질 문제는 지금 대부분의 팀이 측정하지 않고 있지만, 에이전트 활용이 늘어날수록 그 비용이 수면 위로 올라올 것이다. Promptolian 같은 접근 — 사실을 요약하지 않고 인코딩하는 방식 — 이 실제 운영 환경에서 의미 있는 차이를 만드는지는 더 지켜봐야 하지만, 방향 자체는 맞다.

지금 팀 리빌딩을 설계하고 있다면 물어야 할 질문은 이것이다. "AI가 우리 팀의 어떤 습관을 죽이고 있나?" 그리고 "그 자리에 무엇을 의도적으로 심을 것인가?" 이 두 질문에 답하지 못한 채 도구만 도입하면, AI는 생산성 도구가 아니라 기술 부채 가속기가 된다.