대화형 AI 시장은 더 이상 ‘한 앱을 쓰는 게임’이 아니다. 뉴스스페이스가 인용한 BNP파리바·Similarweb·Apptopia 데이터가 보여주듯, 챗GPT 점유율은 내려오고(웹/앱 모두), 제미나이·클로드·그록이 각각 다른 무기로 사용량을 끌어올리는 다극 체제로 재편 중이다. 이 국면에서 스타트업의 CAC는 모델 성능보다 채널(배포력)과 제품(퍼널/리텐션)의 결합력에 의해 결정된다.
핵심은 간단하다. 선택지가 많아지면 사용자는 “최고”가 아니라 “가장 빨리 쓸 수 있는 것”으로 이동한다. 제미나이는 워크스페이스 통합 같은 기본값(default) 배포로 월 방문/사용을 밀어 올리고, 클로드는 코드·업무 도구로 B2B/프로 유저의 LTV를 끌어올리며, 챗GPT는 ‘우위 유지’라는 방어전으로 들어갔다(뉴스스페이스). 경쟁의 축이 독주→배포·니치·플랫폼 결합으로 분화된 것이다.
이제 CAC를 낮추는 레버도 3개로 정리된다. 첫째, 배포 레버(Distribution Arbitrage). 구글이 보여준 것은 기능이 아니라 “진입 경로의 소유”다. 스타트업이 빅테크처럼 OS를 갖긴 어렵지만, 원리는 동일하다: 사용자가 이미 매일 여는 곳에 붙어야 한다. 예) 이메일/문서/캘린더 플러그인, 크롬 확장, 슬랙/노션 앱, 모바일 키보드, 브라우저 새 탭, 고객센터 위젯. 목표 지표는 설치 수가 아니라 활성화율(Activation)과 채널별 CAC 회수기간이다. “광고비로 유저를 사는 채널”을 “워크플로우에 얹혀 오는 채널”로 바꾸면 CAC는 구조적으로 내려간다.
둘째, 온보딩·리텐션 레버(First Value to Retention). 다극화는 곧 ‘무료 대안’이 상시 존재한다는 뜻이고, 이때 CAC를 결정짓는 건 유입이 아니라 유입 이후의 잔존이다. 온보딩의 목표를 “기능 소개”가 아니라 TTV(Time to Value) 단축으로 재정의해야 한다. 체크리스트는 3개: (1) 첫 세션에 1개의 ‘와우 결과물’(요약/초안/분석/자동화) 생성, (2) 24시간 내 재방문 트리거(템플릿/히스토리/알림), (3) D7에 습관 고리(업무 루틴/협업 공유) 연결. 대시보드에서 봐야 할 건 DAU가 아니라 D1/D7 코호트와 churn 원인(무료 대안 이동, 기능 특화 앱 이동)이다. 뉴스스페이스가 언급한 “churn 데이터야말로 핵심 신호”는 스타트업에 더 잔인하게 적용된다.
셋째, 체감성능 레버(Perceived Performance). 퍼널 초입의 최대 적은 ‘기다림’이다. dev.to가 제안하듯 스피너 대신 로딩 스켈레톤을 쓰면 실제 로딩 시간이 같아도 사용자는 더 빠르다고 느끼고, 불확실성이 줄어 이탈이 감소한다. 이건 UI 미학이 아니라 CAC 실험 주제다. 추천 실험: 랜딩/첫 결과 화면에 스켈레톤 적용 → 지표를 첫 응답까지 이탈률, 회원가입 CVR, 첫 세션 완료율로 본다. 특히 AI 앱은 모델 호출/툴 호출로 지연이 흔하니, “완벽히 빠르게”가 아니라 “빠르게 느끼게”가 먼저 ROI를 만든다.
시사점은 명확하다. 뤼튼 사례(네이트 보도)는 대규모 마케팅·무료 제공으로 유저를 빠르게 늘릴 수 있음을 보여주지만, 동시에 손실이 커지는 구조도 드러낸다. 지금 같은 경쟁 구도에서 ‘광고로 점유율을 방어’하면 CAC는 쉽게 인플레가 난다. 반대로 배포 경로를 제품화하고(레버1), 온보딩으로 TTV를 줄이고(레버2), 체감속도로 퍼널 초입을 다듬으면(레버3) 같은 지출로 더 많은 활성 유저를 만든다.
전망: 챗봇/에이전트 시장은 3강+특화형으로 더 쪼개질 가능성이 크다(뉴스스페이스가 정리한 방향성). 이때 스타트업의 승부는 “모델 비교표”가 아니라 CAC를 낮추는 재현 가능한 장치다. 다음 분기 실행 우선순위는 간단하다: (1) 1개 핵심 배포 채널을 ‘기본값’ 수준으로 깊게 통합, (2) 첫 세션에서 가치 도달까지의 클릭/대기 시간을 절반으로, (3) 스켈레톤·캐시·병렬 호출로 첫 경험 이탈을 정량적으로 줄이기. 기술은 성장으로 연결될 때만 의미가 있다. 지금은 그 연결고리를 가장 빨리 설계하는 팀이 이긴다.