대기업 AI 전환이 놓친 것: 도구 도입보다 품질 설계가 먼저다

삼성이 6월 중 Gemini, ChatGPT, Claude를 전 관계사에 공식 도입한다. 전 사장단 50명을 대상으로 'AX 부트캠프'를 열고, 임원 2,300명 교육을 8월까지 완료한다는 계획이다. 이재용 회장은 신년사에서 "조직 DNA를 송두리째 바꿔야 한다"고 못박았다. LG CNS는 앤트로픽의 Claude Enterprise를 LG그룹 전 계열사 통합 계약으로 체결하며, AI 에이전트 기반 '디지털 직원' 환경 구축에 나섰다. 두 사례 모두 발표 무게감은 상당하다.

그런데 테크 리드 입장에서 이 두 뉴스를 보면 설레는 동시에 불안하다. 도구는 켰다. 예산도 붙었다. 위에서 밀어붙이는 의지도 있다. 그런데 정작 중요한 질문—AI가 만들어낸 결과물을 어떤 기준으로 검증할 것인가—에 대한 답은 발표문 어디에도 보이지 않는다.

삼성의 '8대 업무 프로세스 AI 적용'이나 LG CNS의 '반복 업무 자동화'는 좋은 방향이다. 하지만 '적용'과 '신뢰 가능한 적용'은 전혀 다른 이야기다. AI 도구를 조직 전체에 뿌리는 순간, 실제로 발생하는 문제는 생산성 저하가 아니다. 동일한 실수가 조직 전체에서 동시에 반복된다는 것이다. 한 명이 잘못 쓰면 한 명의 문제지만, 2,300명의 임원이 동일한 AI를 동일한 방식으로 쓰면 오류의 스케일도 그만큼 커진다.

이 문제를 가장 구체적으로 보여주는 사례가 코딩 에이전트 영역에서 나왔다. 오픈소스 도구 Selvedge의 v0.3.7 릴리즈 노트(dev.to)는 사소해 보이지만 핵심을 찌른다. AI 코딩 에이전트가 이미 수정된 버그를 반복해서 재현하는 이유는 에이전트에게 "이 코드를 누가, 왜, 어떻게 바꿨는가"라는 이력 컨텍스트가 없기 때문이다. 해결책은 prior_attempts라는 MCP 툴—에이전트가 코드를 수정하기 전에 먼저 이전 변경 이력을 조회하도록 강제하는 구조다. '쓰고 나서 기록'이 아니라 '읽고 나서 실행'으로 루프 방향 자체를 뒤집은 것이다.

이 설계 원칙은 기업 AX 전환에도 그대로 적용된다. 임직원에게 AI 도구를 열어주는 것, 즉 write 권한을 주는 것은 쉽다. 문제는 그 결과물을 누가, 어떤 기준으로 읽고 검증하느냐다. Selvedge가 prior_attempts 결과를 기본값에서 고신뢰도 결과만 반환하도록 설계한 이유도 여기 있다. "틀린 결과를 자신 있게 내놓는 순간, 에이전트는 그 도구를 영원히 노이즈로 분류하고 무시한다." 이건 AI 도구 설계 원칙이지만, 동시에 조직 AI 거버넌스 원칙이기도 하다. 잘못된 AI 결과물이 검증 없이 실무에 반영되는 경험이 쌓이면, 조직은 AI 자체를 신뢰하지 않게 된다.

그러면 테크 리드가 실제로 챙겨야 할 것은 무엇인가. 세 가지다.

첫째, 온보딩보다 검증 기준을 먼저 만들어라. LG CNS가 '개발·기획·분석·문서 작성 등 다양한 업무에 AI 적용'을 선언했을 때, 그 각각의 업무에서 AI 출력물의 품질을 어떤 지표로 판단할지 기준이 없으면 온보딩은 그냥 도구 나눠주기다. 삼성의 직무별 세부 운영 정책 마련 방침은 옳은 방향이지만, 그 정책에 '검증 기준'이 들어가 있어야 한다.

둘째, AI 결과물의 이력을 팀 레벨에서 관리하라. Selvedge의 접근처럼, AI가 생성한 코드나 문서가 왜 수정됐는지, 어떤 맥락에서 롤백됐는지를 기록하고 다음 작업에 컨텍스트로 주입하는 구조가 필요하다. 이걸 개인 기억에 맡기면 팀원이 바뀔 때마다 같은 실수가 반복된다.

셋째, 멀티 AI 전략은 비교 기준 없이는 비용 낭비다. LG CNS가 Claude, EXAONE 등 '멀티 AI' 체계를 운영한다는 것은 전략적으로 맞다. 하지만 업무별로 어떤 AI를 써야 하는지 판단 기준이 명확하지 않으면, 임직원은 가장 익숙하거나 가장 마케팅이 잘 된 도구 하나만 쓴다. 멀티 AI는 선택지를 주는 게 아니라 선택 기준을 설계하는 것이다.

대기업의 전사 AI 전환은 이제 시작 단계다. 삼성의 AX 부트캠프와 LG CNS의 Claude Enterprise 계약은 분명 유의미한 신호다. 하지만 진짜 경쟁력은 6월에 도구를 켠 것이 아니라, 6개월 후에도 그 도구로 만든 결과물의 품질을 통제하고 있는가에서 갈린다. 도구 도입 속도가 품질 설계 속도를 앞서는 순간, AI 전환은 오히려 리스크 확산 파이프라인이 된다. 조직 DNA를 바꾸겠다면, 그 DNA에 검증 루프가 포함되어야 한다.

대기업 AI 전환이 놓친 것: 도구 도입보다 품질 설계가 먼저다

출처