AI 기능이 퍼널에 들어오는 순간, 승부는 모델 성능이 아니라 ‘마찰(friction) 제거’와 ‘실패율’에서 갈립니다. 입력 단계가 길면 전환이 떨어지고, 자동화가 한 번이라도 삑나면 사용자는 즉시 수동 플로우로 도망가며 CS 비용이 뒤따릅니다. 그래서 AI 퍼널 설계의 핵심 질문은 단 하나입니다. “사용자의 입력을 얼마나 줄이되, 성공률을 얼마나 확정적으로 보장할 수 있나?”
카카오모빌리티의 ‘AI 사진 접수’(CBC뉴스 보도)는 이 답을 꽤 교과서적으로 보여줍니다. 사용자가 물품 크기·종류를 텍스트로 기입하고 차량을 고르는 과정을, 사진 1장→물품 인식→차량 추천→주의사항 자동 기입으로 압축했습니다. 퍼널 관점에서 보면 ‘의사결정(차량 선택)’을 AI가 대신하는 게 아니라, 그 이전 단계인 입력·판단 비용을 줄여 첫 주문 완료 확률을 올리는 구조입니다.
더 중요한 건, 이게 단발 기능이 아니라 연속된 마찰 제거 실험의 연장선이라는 점입니다. 같은 서비스에서 이미 ‘AI 주소 자동 붙여넣기’로 접수 시간을 평균 24% 단축했다고 했죠(동 기사 내 언급). 즉, 온보딩에서 가장 많이 새는 구간(주소/품목/차량 같은 “귀찮은 폼”)을 AI가 흡수하고 있습니다. 이 패턴은 B2C든 B2B든 동일합니다. 사용자는 ‘정보를 입력하러’ 오는 게 아니라 ‘결과를 얻으러’ 옵니다.
하지만 여기서 많은 팀이 착각합니다. 입력을 줄이려고 AI를 붙였는데, 인식 실패·잘못된 추천·엉뚱한 자동 기입이 발생하면 전환은 오히려 더 무너집니다. 왜냐하면 사용자는 “내가 직접 쓰면 30초”였던 작업이 “AI가 틀려서 재촬영+수기 입력+불신”으로 늘어난 순간, 제품 전체를 불신하기 때문입니다. 카카오는 이를 의식하듯 배송 불가 품목 팝업, 재촬영/수기 입력 같은 폴백을 넣었습니다. 이건 UX 배려가 아니라 퍼널 방어선입니다.
여기에 두 번째 축이 붙어야 합니다. 자동화가 퍼널의 핵심 단계를 담당할수록, 팀이 관리해야 하는 성장 지표는 ‘AI 정확도’가 아니라 프로덕션 성공률(=완료율) 100%에 가까운 실행 신뢰성입니다. GeekNews에 공유된 Function Calling 하네스 사례는 시사점이 큽니다. 첫 시도 성공률 6.75% 수준이던 function calling을, 결정론적 검증(스키마/컴파일러 검증) + 자가 수복 루프로 100%까지 끌어올렸다고 합니다. 이 메시지는 명확합니다. AI를 퍼널에 넣을 거면, “잘 맞추길 기도”가 아니라 틀릴 때 자동으로 고쳐서 ‘결국 성공’하게 만드는 장치가 필요합니다.
AWS Bedrock 기반 사례(dev.to)는 이를 운영 관점으로 확장합니다. 프롬프트만으로는 한계가 있으니, 가드레일(자동 추론/근거성/관련성 체크)과 검증된 Q&A 캐시(LLM 호출 자체를 생략)로 확률적 시스템을 통제했다고 하죠. 이 접근을 퍼널 언어로 번역하면, “AI 응답 품질”이 아니라 이탈을 만드는 실패 모드(환각·무근거·비관련)를 차단해 재시도/문의/환불을 줄이는 설계입니다. 결국 CAC는 광고비만이 아니라, 실패로 생기는 운영비까지 포함한 ‘획득 단가’입니다.
시사점은 세 가지입니다. 첫째, 마찰 제거의 1순위는 ‘입력’입니다. 사진/클립보드/대화로 폼을 대체하면 전환이 즉시 움직입니다. 둘째, 퍼널에 들어온 AI는 반드시 폴백(재촬영·수기 입력·사람 연결)을 가져야 합니다. 폴백이 없는 자동화는 전환을 올리는 기능이 아니라 이탈을 키우는 기능입니다. 셋째, function calling/가드레일/스키마 검증 같은 결정론 레이어가 붙는 순간, AI는 ‘편의 기능’이 아니라 신뢰 가능한 퍼널 자동화 엔진이 됩니다.
실험 설계로 바로 옮기려면 이렇게 쪼개면 됩니다. (1) AI 사진/자동 입력 진입을 첫 화면에 노출 vs 기존 플로우 유지, (2) AI 추천 채택률과 주문 완료율 uplift, (3) 인식 실패 시 폴백 UX(재촬영 유도 vs 수기 전환)별 이탈률, (4) function calling 하네스/스키마 검증 도입 전후로 재시도 횟수·CS 티켓·환불률·처리 시간까지 함께 추적. 전환율만 보면 “AI가 좋아졌다”로 끝나지만, 운영 지표까지 보면 CAC와 LTV가 동시에 움직이는지가 보입니다.
전망은 분명합니다. 멀티모달(사진)로 입력을 줄이는 흐름은 더 확산될 겁니다. 다만 차별점은 “인식이 되냐”가 아니라 “실패를 어떻게 흡수해서 사용자가 끝까지 완료하게 만드냐”로 이동합니다. 퍼널 최적화 팀이 앞으로 가져야 할 경쟁력은 모델 선택이 아니라, 결정론적 검증·폴백·관찰성(모니터링)·캐시를 묶어 성공률을 ‘제품 스펙’으로 만드는 능력입니다. AI는 전환을 당기고, 신뢰성은 이탈을 막습니다. 둘을 같이 잡는 팀만 스케일합니다.