구글이 검색·제미나이 앱·크롬 전반에 ‘퍼스널 인텔리전스’를 확대(미국 개인 계정 중심)하며 개인화 경쟁을 정면으로 걸었습니다(aitimes 보도). 핵심은 기능 추가가 아니라 리텐션 메커니즘의 표준화입니다. 사용자가 “내 상황”을 다시 설명하는 마찰을 줄일수록, 세션 길이(체류)와 재방문 빈도는 구조적으로 올라갑니다.
이번 업데이트가 던지는 신호는 명확합니다: 데이터 연결(Email/Photo/History) → 개인화된 응답/추천 → ‘다음 행동’ 촉발. 구글은 지메일·포토·검색/유튜브 기록 같은 1st-party 데이터를 한 덩어리로 엮어 “기억하는 제품”을 만들었고, 그 결과 사용자는 탐색/계획/쇼핑에서 더 적은 클릭으로 더 높은 확신을 얻습니다. 전환을 만드는 순간은 대체로 ‘추천’이 아니라 맥락의 자동 완성에서 나옵니다.
성장 관점에서 이건 AARRR 중 Activation과 Retention을 동시에 당기는 레버입니다. 온보딩 초기에 “뭘 입력해야 하지?”라는 공백을 줄여 첫 성공 경험(TTV: time-to-value)을 앞당기고, 이후엔 ‘내 히스토리를 아는’ 경험이 락인을 만듭니다. 특히 개인화가 검색/브라우저 같은 습관 채널에 들어가면, 별도 캠페인 없이도 리인게이지먼트가 상시 발생합니다(구글은 기본 off로 두고 opt-in을 유도하는 방식까지 포함).
하지만 스타트업은 구글처럼 생태계를 이미 보유하지 않습니다. 여기서 실행 가능한 우회로가 모바일 온디바이스 RAG입니다. dev.to 튜토리얼은 sqlite-vss + ONNX Runtime + KMP로, 임베딩 생성→로컬 벡터검색→컨텍스트 조립을 서브 200ms, 50MB 이하로 구현하는 패턴을 제시합니다. 즉, “클라우드 호출 없이도” 앱 안에서 개인화 검색/추천을 굴릴 수 있는 현실적인 스택이 열린 겁니다.
이 옵션이 리텐션에 직결되는 이유는 세 가지입니다. (1) 지연 시간: 개인화는 ‘빠를수록’ 마찰 제거 효과가 커서 전환율과 D1이 같이 움직입니다. (2) 비용: 매 쿼리마다 서버 RAG를 태우지 않으니 COGS가 줄고, 그 여력이 가격/무료 구간/리텐션 실험으로 전환됩니다. (3) 프라이버시/신뢰: 민감 데이터가 폰 밖으로 안 나가면 opt-in 허들이 낮아져 개인화의 모수 자체가 커집니다(구글도 off-by-default를 채택한 배경과 맞닿아 있음).
스타트업 관점의 시사점은 “개인화 기능을 만들자”가 아니라, 어떤 데이터 연결이 D7/D30을 바꾸는지부터 역산하라는 겁니다. 추천 품질보다 먼저 볼 지표는: 개인화 opt-in 전환율, 개인화 기능 사용 세션의 재방문율 uplift, (개인화 사용자 vs 비개인화 사용자) 코호트의 churn gap. 기능은 2~3개의 ‘반복 과업’(예: 재구매, 재검색, 저장한 항목 재열람)에서 시작하는 게 ROI가 가장 좋습니다.
실행 플랜은 간단하게 쪼개면 됩니다. ① 개인화 트리거 1개를 정하고(예: “최근 본/저장한 것 기반 다음 행동”), ② 온디바이스 RAG로 로컬 히스토리/콘텐츠를 인덱싱해 맥락을 자동 완성하고, ③ CTA를 “더 보기”가 아니라 즉시 실행(재주문/재예약/이어보기)로 붙입니다. ④ 마지막으로 A/B 테스트는 ‘정확도’가 아니라 TTV, 재방문 간격, D7 retention을 1차 성공지표로 둡니다.
전망은 한 줄로 요약됩니다. 구글이 퍼스널 인텔리전스로 ‘개인화=기본값’ 기대치를 올렸다면, 스타트업은 온디바이스 RAG로 개인화의 단가와 지연을 낮춰 같은 레버를 더 민첩하게 돌릴 수 있습니다. 다음 경쟁은 모델이 아니라, “연결할 데이터의 범위”와 “opt-in을 이끌 UX” 그리고 “리텐션 지표로 증명되는 개인화 루프”를 누가 더 빨리 설계하느냐에서 갈릴 겁니다.