AI 에이전트 제품의 그로스는 종종 ‘모델이 더 똑똑해지면’ 해결된다고 착각한다. 그런데 dev.to에 공개된 Excel MCP Server의 90일 텔레메트리는 정반대를 말한다. 사용자들은 “스프레드시트 라이브러리로 .xlsx를 만지는 에이전트”가 아니라, 실제 Excel 앱(계산 엔진·VBA·Power Query·피벗 캐시 포함) 안에서 일하는 에이전트를 원했다. 즉, 성장은 모델이 아니라 툴 연동(통합)에서 터진다.
이 프로젝트가 흥미로운 이유는 기능 소개가 아니라 ‘관찰성’이다. 익명·옵트인 텔레메트리로 2,908명/86,090세션/48만+ 툴 호출을 수집했고, 주간 사용자가 84→1,209로 급증했다(dev.to 원문). 여기서 그로스 관점의 핵심은 숫자 자체가 아니라 “사람들이 어디에 시간을 쓰는가”가 드러났다는 점이다. 제품 팀이 상상한 사용법(셀 읽고 쓰기)과 실제 사용 패턴(시각 피드백·서식·매크로·쿼리)이 완전히 달랐다.
첫 번째 시사점은 ‘시각 피드백이 전환을 만든다’는 것이다. 스크린샷 캡처 7,700+회, 창 배열·상태바 메시지 호출까지 빈번했다. 에이전트는 headless로 “정답 데이터”만 뽑는 게 아니라, 사람이 하던 것처럼 시트를 렌더링해 보고 다음 행동을 결정한다. 이건 Activation 설계로 번역하면 명확하다: 온보딩에서 “첫 결과물”을 텍스트가 아니라 눈으로 확인 가능한 산출물(엑셀 화면/서식 포함)로 당겨야 한다. 사용자가 ‘작동한다’고 믿는 순간이 앞당겨지면 Time-to-Value가 줄고, 그게 전환율을 밀어 올린다.
두 번째는 레거시가 리텐션을 만든다. 텔레메트리에서 VBA 관련 작업이 2만+회(500+ 사용자)나 발생했다. “VBA는 죽었다”가 아니라 “엔터프라이즈의 실제 업무는 여전히 매크로 위에 있다”는 뜻이다. B2B에서 Retention은 ‘멋진 신기능’보다 기존 워크플로우를 끊지 않는 통합에서 나온다. 에이전트가 VBA를 읽고 실행하고 수정하지 못하면, 그 제품은 고객의 월말 결산 프로세스에 들어갈 자격이 없다.
세 번째는 사용량이 ‘데모’가 아니라 ‘업무 루프’에 들어갔다는 증거다. 중앙값이 65회 호출인데, 상위 1%는 3,000회, 어떤 사용자는 10,060회까지 갔다. 게다가 Power Query/데이터 모델 관련 작업도 2.5만+회로 “엑셀=로컬 BI 환경”이라는 현실을 그대로 반영한다. 이런 패턴은 Expansion(확장 매출)의 신호다. 팀 단위로 퍼지기 쉬운 반복 작업(리프레시·정리·리포트 패키징)을 에이전트가 대체하면, 좌석 확장보다 빠르게 워크플로우 단위로 과금/업셀이 가능해진다.
네 번째는 많은 제품이 놓치는 ‘마무리(프레젠테이션)가 절반’이다. 서식/표현 관련 호출이 약 6.8만 회. 데이터가 맞는 것에서 끝나지 않고 “보내도 되는 보고서”가 되어야 업무가 끝난다. 여기서 그로스 레버는 단순하다. 기능 로드맵을 ‘분석’이 아니라 전송 직전 품질(서식, 스냅샷, 내보내기)에 맞추면 D7/D30 리텐션이 올라간다. 사용자는 매주 보고서를 보내야 하고, 그 반복이 습관을 만든다.
또 하나의 교훈은 제품 운영 관점이다. 더 좋은 도구를 출시했는데도 레거시 툴 호출이 4.5만+회 남았다. 프롬프트/클라이언트가 특정 툴 이름에 의존하면 이름은 ‘API 계약’이 된다. 즉, 에이전트 툴 서피스는 기능이 아니라 SDK처럼 버전 관리해야 하고, 이 안정성이 곧 Churn 방지 장치가 된다(dev.to 원문).
이 흐름은 툴링 생태계로 확장 중이다. velog에 소개된 AWS Strands Agents SDK는 Prompt+Model+Tools 조합과 MCP 연동을 표준 패턴으로 만들고 있고, 디지털인사이트 기사에 따르면 Anthropic은 포토샵·블렌더 등 9종 크리에이티브 툴 커넥터를 공식화했다. 공통 분모는 하나다. 에이전트를 ‘앱 바깥’에서 말 잘하는 존재로 두지 말고, ‘업무툴 안’에서 실행되는 워크플로우 엔진으로 끌어들인다.
전망: 앞으로 에이전트 제품의 경쟁 우위는 모델 성능 격차가 아니라, (1) 어떤 보편 툴(Excel/Adobe/Jira/ERP)에 얼마나 깊게 들어가 있는지, (2) 그 통합이 얼마나 안정적으로 세션/상태를 다루는지, (3) 시각 피드백과 산출물 패키징까지 포함해 ‘업무 종료’까지 책임지는지에서 갈릴 가능성이 크다. 결론적으로 “툴 연동”은 기능 추가가 아니라 Activation(첫 가치)·Retention(반복 업무)·Expansion(팀/워크플로우 확장)을 동시에 건드리는 성장 레버다. 이제 남은 질문은 단 하나: 우리는 사용자의 ‘진짜 작업 장소’로 들어갈 준비가 되어 있는가?