AI가 빠르게 짤수록 내가 느려지는 이유

2026년 2월, Anthropic 소속 연구자 두 명이 조용히 논문 하나를 발표했다. 자사 AI 코딩 어시스턴트를 사용한 개발자의 코드 이해도가 그렇지 않은 그룹보다 17% 낮았다는 내용이었다. Cohen's d = 0.738, p = 0.010. 통계적으로 충분히 유의미한 수치다. 논문 저자들이 Anthropic 소속이라는 점이 이 데이터를 더 무겁게 만든다. 자사 도구의 부작용을 자신들이 직접 측정해 공개한 셈이니까.

실험 설계는 단순하고 명확했다. 주니어 개발자 52명이 낯선 라이브러리(Python 비동기 라이브러리 Trio)를 학습하는 과제를 받았다. 절반은 AI 어시스턴트와 함께, 나머지 절반은 검색과 공식 문서만으로. 작업 완료 시간? 두 그룹 간 유의미한 차이 없었다. 하지만 이후 진행된 코드 이해도 테스트—코드 읽기, 디버깅, 개념 설명—에서 AI 사용 그룹이 17% 뒤처졌다. 이건 단순히 '자신감이 낮아졌다'는 게 아니다. 자신이 직접 작성하고 배포한 코드를 설명하지 못했다는 의미다.

그런데 이 연구에서 가장 흥미로운 데이터는 그룹 간 비교가 아니라 AI 사용 그룹 내부의 분화다. 같은 도구, 같은 과제, 같은 시간—그런데 결과는 극명하게 갈렸다. "이 패턴이 왜 이렇게 동작해?", "이 방식을 문서가 권장하는 이유가 뭐야?"처럼 개념을 물어본 그룹은 이해도 테스트에서 65% 이상을 기록했다. 반면 "이 함수 작성해줘", "여기 코드 짜줘"처럼 코드 생성을 위임한 그룹은 40% 미만에 머물렀다. 25포인트 차이. 도구의 문제가 아니라 사용 방식의 문제라는 게 데이터로 증명된 순간이다.

이 결과를 UX 관점에서 읽으면 더 선명해진다. AI 코딩 어시스턴트는 현재 대부분 '코드 생성'을 기본 인터랙션으로 설계되어 있다. 프롬프트 창이 열리면 자연스럽게 "작성해줘", "만들어줘"를 입력하게 된다. 도구의 UX 자체가 코드 위임을 기본값으로 유도하는 구조다. 그런데 이해도를 유지하려면 정반대의 인터랙션—질문, 설명 요청, 비판 요청—이 필요하다. 현재 AI 도구들의 인터페이스는 사용자가 덜 배우는 방향으로 최적화되어 있을 수 있다는 불편한 가능성이 여기서 생긴다.

비슷한 신호는 다른 연구에서도 반복된다. METR의 2025년 7월 연구에서는 시니어 오픈소스 개발자 16명이 AI가 자신을 20% 빠르게 만든다고 '느꼈지만', 실제로는 19% 느려졌다. Cursor 도입 효과를 분석한 연구에서는 첫 달 코드 라인 수 +281%, 하지만 코드 복잡도 +40.7%, 정적 분석 경고 +29.7%가 함께 왔다. 복잡도가 100% 증가하면 장기 개발 속도는 64.5% 떨어진다는 추정치도 나왔다. AI가 만들어낸 속도는 단기 지표에서 잡히지만, 그 비용은 몇 주 뒤 버그 리포트와 함께 청구된다.

물론 반대 방향의 데이터도 있다. Copilot 효과를 측정한 대규모 연구(Cui, Demirer, Jaffe 외, Management Science 2025)는 4,867명의 개발자를 대상으로 +26.08%의 태스크 완료율 향상을 보고했다. 이건 무시할 수 없는 숫자다. 하지만 이 연구에서도 이득은 경험이 적은 개발자, 명확한 엔터프라이즈 태스크에 집중되었다. 시니어 개발자, 레거시 코드베이스에서는 효과가 훨씬 작거나 오히려 역효과를 보였다. 두 데이터는 충돌하는 게 아니라, 각각 다른 맥락을 설명하고 있다.

그렇다면 실천 레벨에서 무엇을 바꿔야 할까. Anthropic 연구가 제시한 방향은 단순하다. AI에게 코드를 쓰게 하지 말고, AI에게 질문을 던져라. "X와 Y의 차이가 뭐야?", "이 패턴이 Z 케이스에서 왜 깨져?", "문서가 이 방식을 권장하는 이유가 뭐야?"—그런 다음 코드는 직접 쓴다. 또는 먼저 직접 초안을 작성하고, AI에게 비판을 요청한다. 유지보수할 필요 없는 일회성 스크립트나 프로토타입이라면 위임해도 된다. 하지만 6주 뒤 버그 리포트가 내 이름으로 들어올 코드라면, 그 코드를 이해한 상태로 배포해야 한다.

AI 도구를 설계하는 쪽에서도 이 데이터는 중요한 질문을 던진다. 이해도를 유지하는 '개념 질문' 방식을 기본 인터랙션으로 밀어올리는 UX가 가능한가? 코드 생성 전 "이 함수가 왜 필요한지 먼저 설명해볼게요"를 유도하는 플로우는? 완성된 코드를 배포하기 전, 사용자가 해당 코드의 핵심 로직을 스스로 설명해야만 다음 단계로 넘어가는 게이트는? 이건 기술 문제가 아니라 프로덕트 철학의 문제다. 도구가 사용자를 빠르게 만드는 것과 사용자가 더 잘 이해하도록 돕는 것은 현재 구조에서 종종 반대 방향을 가리키고 있다.

'AI 10배 개발자'라는 프레임은 틀린 질문에서 출발한다. 지금 배포 속도가 얼마나 빠른지보다, 6주 뒤의 내가 오늘 배포한 코드를 디버깅할 수 있는가가 더 정직한 질문이다. Anthropic의 데이터가 조용히 말하는 것은 이것이다. AI는 당신이 더 빨리 '끝내도록' 도울 수 있다. 하지만 그 과정에서 당신이 무엇을 만들었는지 이해하지 못하게 만들 수도 있다. 어떤 쪽이 될지는 도구가 아니라, 당신이 AI에게 무엇을 묻느냐가 결정한다.

AI가 빠르게 짤수록 내가 느려지는 이유

출처