숫자 하나가 팀 구조 논의를 바꾼다
16.1%. AI 안전센터(CAIS)가 공개한 Remote Labor Index(RLI) 벤치마크에서 Claude Fable 5가 기록한 프리랜서 작업 자동화율이다. 3D 목업 디자인, 광고 영상 제작, 평면도 설계 같은 실제 유료 프리랜서 과제를 유료 고객이 수용할 만한 품질로 완수한 비율이다. 수출규제로 묶여 있던 2주 사이에 측정된 결과라는 점이 더 섬뜩하다.
비교해보면 감이 온다. RLI가 처음 공개됐을 때 업계 최고 수준은 2.5%였다. 8개월 전 기록인 Opus 4.6의 4.17%를 Fable 5는 네 배 가까이 뛰어넘었다. CAIS가 직접 "경제적으로 유의미한 AI 에이전트가 얼마나 빠르게 발전하고 있는지 보여주는 구체적 신호"라고 표현한 이유가 있다. 이건 벤치마크 경쟁의 문제가 아니다. 팀을 어떻게 구성하고, 누구에게 어떤 일을 맡길지를 다시 설계해야 하는 신호다.
84%가 여전히 사람의 영역이라는 해석의 함정
"아직 84%는 AI가 못 한다"는 반론은 절반만 맞다. 16%가 자동화됐다는 건 특정 유형의 작업이 통째로 빠져나갔다는 뜻이다. 데이터 분석 의뢰, 간단한 그래픽 작업, 영상 컷 편집—이런 단위 업무들이 프리랜서 마켓에서 AI로 대체되기 시작하면, 팀 내에서 같은 종류의 일을 담당하던 역할도 조용히 흔들린다. 문제는 속도다. 2.5%에서 16%까지 8개월이 걸렸다. 다음 8개월을 예측할 수 있는가?
테크 리드로서 이 수치를 보고 가장 먼저 하는 생각은 이거다: 지금 팀에서 반복 구현, 정해진 포맷의 문서 작성, 단순 데이터 가공에 시간을 쓰는 사람이 몇 명인가. 그 시간이 AI로 대체되고 있는 속도와 팀원의 역량 성장 속도 중 어느 쪽이 빠른가. 이걸 측정하지 않은 채 팀 구성 논의를 계속하는 건 방향 없이 달리는 것과 같다.
코딩 능력 기준이 흔들리는 이유
Velog에 올라온 한 개발자의 글이 이 맥락을 잘 짚는다. "AI가 메뉴판을 가져다주는 놈이고, 그거 먹고 배탈 나는 건 인간 책임"이라는 표현이 정확하다. AI는 A, B, C, D 방법을 다 제시한다. 문제는 그 다음이다. 운영 환경이 어떤지, 장애가 터지면 어디까지 번지는지, 팀원이 이 구조를 유지보수할 수 있는지—이건 AI가 책임지지 않는다.
이 관점에서 팀 구성 기준이 달라진다. 코드를 빠르게 많이 치는 사람을 우선 채용하던 시대는 끝나가고 있다. 대신 질문해야 할 기준은 이쪽이다: AI가 제시한 옵션들 사이에서 컨텍스트에 맞는 판단을 내릴 수 있는가. AI 출력물의 품질을 검증할 도메인 지식이 있는가. AI와 협업하며 작업 범위와 리스크를 빠르게 정의할 수 있는가. 코딩 테스트를 없애자는 게 아니다. 코딩 테스트만으로 이 능력을 측정할 수 없다는 뜻이다.
AI-First 팀 리빌딩에서 자동화율이 주는 실제 함의
자동화율 16%를 팀 구성 기준으로 변환하면 세 가지 실행 항목이 나온다.
첫째, 역할 정의를 '업무 단위'가 아닌 '판단 단위'로 바꿔야 한다. "이 사람이 담당하는 업무"가 아니라 "이 사람이 책임지는 판단"을 기준으로 JD를 다시 써야 한다. AI가 실행할 수 있는 업무는 점점 늘어나지만, 그 실행 결과에 대한 판단과 책임은 여전히 사람에게 있다.
둘째, 온보딩 설계에 AI 활용 능력 검증을 넣어야 한다. 신규 팀원이 AI 도구를 얼마나 잘 쓰는지를 입사 초기에 평가하고 보완하는 구조가 없으면, 팀 전체의 AI 활용 수준이 낮은 쪽으로 수렴한다. Copilot이나 Claude Code를 쓰는지 여부가 아니라, 어떤 프롬프트로 어떤 결과를 검증하는지까지 봐야 한다.
셋째, AI가 빠르게 처리하는 영역일수록 팀원의 성장 경로를 의도적으로 설계해야 한다. AI가 단순 구현을 대신하면서 주니어 개발자가 "낮은 계단"을 밟을 기회 자체가 줄어든다. 대신 AI 출력물을 리뷰하고 검증하는 과정에서 성장할 수 있도록 구조를 바꿔야 한다. 자동화율이 높아질수록 이 설계가 더 중요해진다.
속도에만 낙관적이면 안 되는 이유
냉정하게 짚고 넘어가자. Fable 5의 16.1%는 컴퓨터 기반 작업, 그래픽 디자인, 데이터 분석, 영상 작업을 포함한 결과다. CAIS도 "AI 능력 편차가 여전히 크다"고 지적했다. 벤치마크 환경과 실제 팀 운영 환경은 다르다. AI가 생성한 산출물을 그대로 납품할 수 있는 경우는 아직 제한적이고, 검증 비용이 생성 비용보다 클 때도 많다.
그래서 자동화율 16%를 보며 팀 해체나 대규모 역할 축소를 논의하는 건 지금 시점에서 섣부르다. 하지만 그 숫자가 8개월 전에 비해 네 배라는 사실—그리고 다음 8개월 이후가 지금과 같을 거라는 보장이 없다는 사실—은 팀 리빌딩 기준을 지금 다시 설계해야 한다는 충분한 근거가 된다. 준비하는 팀과 뒤늦게 반응하는 팀의 격차는, AI 자동화율이 오르는 속도만큼 빠르게 벌어진다.
지금 당장 팀에 던져야 할 질문
자동화율 수치를 팀 회의에 꺼내는 것만으로도 의미 있는 대화가 시작된다. 어떤 업무가 AI로 대체 가능한지, 어떤 판단은 여전히 사람이 해야 하는지, 그 경계를 팀이 명확히 합의하고 있는지. 이 대화 없이 AI 도구를 도입하면 도구는 빠른데 팀은 느린 기묘한 불균형이 생긴다.
16%는 숫자가 아니다. 팀 구성 기준을 다시 묻는 질문이다.