전환을 올리면서 COGS를 내리는 법: ‘스위칭 도구’ + 의도 라우팅의 결합

전환을 올리면서 COGS를 내리는 법: ‘스위칭 도구’ + 의도 라우팅의 결합

기억/채팅 이전으로 전환 마찰을 없애고, 의도 분류·모델 선택으로 비용 병목을 실험 가능한 시스템으로 바꾸자.

전환율 COGS 의도 분류 모델 라우팅 Gemini Claude Code 리텐션 그로스 실험
광고

AI 제품의 성장 병목은 점점 “유저가 안 온다”가 아니라 “유저가 오면 손익이 무너진다”로 이동했습니다. 전환율을 올리려면 더 좋은(=비싼) 모델을 더 많이 쓰게 되고, COGS가 치솟으면 결국 가격·무료체험·마케팅까지 보수적으로 변해 CAC가 올라갑니다. 그래서 이제 그로스의 핵심 이슈는 전환(Conversion)과 COGS를 동시에 최적화하는 운영 레버를 제품 안에 심는 것입니다.

이 맥락에서 TechCrunch 보도를 인용한 데브타임즈 기사에 나온 구글 제미니의 ‘기억·채팅 이전’은 전형적인 스위칭 마찰 제거 장치입니다. 새 챗봇으로 갈아탈 때 가장 비싼 비용은 학습 비용이 아니라 “내 맥락을 다시 입력하는 노동”인데, 이를 압축파일 업로드 한 번으로 제거합니다. 이건 단순 편의 기능이 아니라 온보딩의 첫 성공(TTFV)을 앞당겨 전환율·리텐션을 올리고, 결과적으로 CAC를 낮추는 레버입니다(구글 제미니 ‘스위칭 도구’).

하지만 여기서 한 발 더 들어가야 합니다. 스위칭 마찰을 낮춰 유입이 늘면, 다음 병목은 곧바로 서빙 비용(COGS) 입니다. 유저가 늘수록 “모든 요청을 최고급 모델로 처리”하는 구조는 파산 설계입니다. dev.to의 ‘의도 분류 기반 모델 라우팅’ 사례가 중요한 이유는, UX를 해치지 않고(유저는 모델을 고민하지 않음) 요청 의도에 맞춰 모델을 자동 선택해 비용을 구조적으로 낮추기 때문입니다. 특히 LLM로 분류하면 지연이 늘어 역효과가 나니, 글에서처럼 룰 기반 분류로 0-latency 라우팅을 먼저 깔고 카테고리 우선순위를 조정하는 접근은 프로덕션에 바로 꽂을 수 있습니다.

여기에 Claude Code의 ‘모델 선택 패턴’(Haiku/Sonnet/Opus 티어, effort level, plan→execute 자동 전환, subagent별 모델 고정)은 팀이 흔히 저지르는 실수를 찌릅니다. “기본값이니까” 최고 티어를 상시로 쓰는 순간, 전환을 키운 만큼 손익이 악화됩니다. 즉, 모델 티어링+effort의 2D 제어면을 제품/조직 운영에 들여오면, 같은 전환을 더 낮은 COGS로 받치거나, 같은 COGS로 더 공격적으로 성장(무료 한도/추천/리인게이지)할 여지가 생깁니다(dev.to Claude Code 모델 가이드).

시사점은 명확합니다. 전환 최적화는 더 이상 ‘카피/CTA’만의 문제가 아니라 (1) 스위칭 마찰 제거로 퍼널 상단을 넓히고, (2) 의도 라우팅으로 퍼널 하단의 단가를 낮추는 이중 최적화 게임입니다. 실행 프레임은 이렇게 잡을 수 있습니다. - 가설 A(전환): 기억/채팅 이전이 온보딩 완료율, 첫 대화 성공률, D7 리텐션을 올린다. - 가설 B(COGS): 의도 분류 라우팅이 품질 저하 없이 평균 토큰 단가를 낮춘다. - 결합 가설(A×B): 전환 개선으로 증가한 트래픽을 라우팅이 흡수해, 성장해도 마진이 유지된다.

측정도 같이 설계해야 합니다. 전환 측면에서는 ‘이전 완료→첫 답변 만족→재방문’ 코호트로 D1/D7과 churn을 보며, 비용 측면에서는 요청 단위로 intent, 선택 모델, latency, 사용자 만족 시그널(재질문/리라이트/이탈), gross margin을 로깅해야 합니다. A/B는 “이전 기능 ON/OFF” 같은 단일 실험이 아니라, 이전 기능 ON + 라우팅 정책 버전(룰/우선순위/티어링) 비교로 들어가야 병목이 어디서 터지는지 분리됩니다.

전망은 단순합니다. 챗봇 시장이 성숙할수록 ‘기능 격차’보다 이동 비용(스위칭)과 운영 단가(COGS) 가 승부를 가릅니다. 구글처럼 플랫폼 배포력을 가진 플레이어는 스위칭 도구로 상단 퍼널을 열 것이고, 그 다음 라운드는 “늘어난 사용량을 어떤 라우팅/티어링으로 수익성 있게 받치느냐”가 결정합니다. 결국 살아남는 AI 제품은 전환을 만드는 UX(기억 이동) + 마진을 지키는 시스템(의도 라우팅/모델 티어링) 을 한 묶음으로 설계한 팀입니다.

출처

더 많은 AI 트렌드를 Seedora 앱에서 확인하세요