신세계그룹이 오픈AI와 손잡고 연내 이마트 앱에 ‘AI 쇼핑 에이전트’를 넣고, 2027년까지 검색·결제·배송을 한 번에 처리하는 ‘완결형 AI 커머스’를 목표로 한다고 연합뉴스가 전했습니다. 이 소식의 핵심은 “AI를 쓴다”가 아니라, 커머스 퍼널의 시작점(검색)과 끝점(결제)을 같은 대화 인터페이스로 접합해 전환율·ARPU를 구조적으로 바꿀 수 있다는 점입니다.
지금까지 커머스는 검색 → 리스트 → 상세 → 장바구니 → 결제처럼 화면/단계가 늘어날수록 마찰이 커지는 게임이었습니다. 대화형 쇼핑 에이전트는 사용자가 “가족 식사 메뉴 준비”처럼 의도(intent)만 던지면, 탐색·비교·묶음 제안(장바구니 구성)까지 한 번에 끌고 가며 퍼널을 재배치합니다. 여기서 그로스 포인트는 명확합니다. 단계가 줄면 전환율이 오르고, 추천이 ‘상품’이 아니라 ‘미션(상황)’ 단위가 되면 교차판매가 늘어 AOV/ARPU가 같이 튈 확률이 높습니다.
맥락을 더 보면, 신세계가 말하는 온·오프 결합(매장 방문 시 자동 주차 등록 등)은 “편의 기능”이 아니라 리텐션 장치입니다. 온라인 구매만 잘해도 D7은 오르지만, 오프라인 접점이 붙으면 반복 구매 루틴이 생기고 D30이 단단해집니다. 월마트의 오픈AI 협업 사례를 언급한 것도 같은 맥락인데, 결국 승부는 ‘챗봇’이 아니라 반복 방문을 만드는 생활형 워크플로우를 누가 먼저 잠그느냐입니다.
여기서 비용(COGS) 이슈가 바로 따라옵니다. 대화형 에이전트는 잘 설계하면 전환을 올리지만, 동시에 토큰 비용을 폭증시킬 수 있습니다. 그런데 최근 AI 트렌드는 “더 큰 모델”이 아니라 “더 효율적인 모델”로 축이 이동 중입니다. 브런치의 트렌드 리포트가 소개한 TurboQuant(KV 캐시 메모리 1/6 압축), Qwen 3.5 9B 같은 소형 고성능 모델, Gemma 4 오픈소스 흐름은 커머스 에이전트에 직접적인 의미가 있습니다. 같은 경험을 더 싼 추론 비용으로 제공할 수 있으면, (1) 무료 구간을 넓혀 퍼널 상단 마찰을 줄이고 (2) LTV/CAC를 방어하면서 (3) 트래픽 확장 실험을 과감하게 할 수 있습니다.
실행 관점에서 시사점은 세 가지입니다. 첫째, 에이전트는 ‘추천’이 아니라 결제 직전의 확신을 만드는 상담이어야 합니다. 전환을 흔드는 질문(재고/대체품/배송일/알레르기/예산)을 먼저 처리하는 플로우로 설계하면 상세페이지를 덜 보더라도 결제까지 갑니다. 둘째, 모델 전략은 RAG 우선, 필요한 구간만 파인튜닝이 현실적입니다. 상품/프로모션/재고는 매일 바뀌니 RAG로 신선도를 확보하고, 브랜드 톤·응답 포맷·금칙어 같은 ‘행동’은 파인튜닝으로 고정하는 식이 비용·속도·품질 균형이 좋습니다(프로덕션에서의 RAG vs 파인튜닝 비교는 dev.to 글이 잘 정리합니다). 셋째, KPI는 채팅 만족도가 아니라 에이전트 퍼널 전환율(대화 시작→장바구니 생성→결제), AOV uplift, 재구매 리텐션으로 잡아야 합니다. 그래야 “AI는 좋은데 매출은?” 같은 조직 내 회의가 사라집니다.
전망은 분명합니다. 2026~2027년 커머스의 경쟁 단위는 ‘상품 구색’에서 에이전트가 재구성한 퍼널의 효율로 이동할 겁니다. 먼저 완결형 흐름을 만든 쪽은 (1) 검색 트래픽 의존도를 낮추고 (2) 대화 로그로 의도 데이터를 축적해 추천 정확도를 올리며 (3) 그 결과 CAC를 낮추는 선순환을 만듭니다. 그리고 소형 고성능 모델/효율화 알고리즘이 성숙할수록, 이 게임은 “대기업만 가능한 AI”가 아니라 유닛이코노믹스를 설계한 팀이 이기는 AI로 바뀝니다. 신세계×오픈AI는 그 변곡점을 한국 커머스에서 가장 먼저 크게 찍어보는 실험입니다.