요즘 트랙션은 ‘만드는’ 게 아니라 ‘사는’ 게 가능해졌습니다. geeknews가 인용한 StarScout 분석에 따르면 2019~2024년 GitHub에서 의심 가짜 스타 약 600만 개가 1만8617개 저장소에 퍼져 있었고, 2024년엔 스타 50개 이상 저장소의 16.66%가 캠페인 연관으로 집계됐습니다. 한편 Velog에 올라온 Trustpilot 리뷰 글은 겉으로는 평판의 중요성을 말하지만, 본문에 “리뷰 구매” 연락처와 구매 링크가 노출됩니다. 즉, ‘신뢰 지표(소셜 프루프)’ 자체가 거래되는 시장이 이미 열려 있습니다.
성장팀 관점에서 문제는 윤리 논쟁이 아니라 측정 오염입니다. 첫째, CAC가 왜곡됩니다. GitHub 스타나 리뷰 점수는 상단 노출(Trending/SEO)과 클릭률을 올려 유입을 늘릴 수 있지만, 그 유입이 실제 ICP가 아니면 “CAC가 내려간 것처럼 보이는” 착시만 남습니다(저품질 유입 증가 → 영업/CS 비용 상승 → 실질 CAC 상승). 둘째, 전환율이 무너집니다. 랜딩에서 ‘4.8점/스타 5만’ 같은 신호는 초기 클릭을 당기지만, 제품 경험이 그 기대를 못 맞추면 결제 전환에서 급격한 이탈이 발생합니다. 셋째, 리텐션 지표도 오염됩니다. 기대-현실 갭이 커질수록 D7/D30 리텐션과 NPS가 하락하고, 리뷰/별점 조작으로 유입된 유저 코호트는 구조적으로 Churn이 높아집니다.
GitHub 스타 조작과 리뷰 조작의 공통점은 “조작 가능한 신호를 상위 퍼널 의사결정에 연결”했다는 겁니다. StarScout가 언급하듯 스타는 비용 없이 누를 수 있고(따라서 조작 비용이 낮고), 일부 프로젝트는 이를 Trending 노출 우회에 활용했습니다. 리뷰도 마찬가지로 검색 결과/스토어 노출에서 강력한 가중치를 갖습니다. 신호가 강력할수록 시장은 신호를 공격하고, 그 순간부터 우리는 지표를 최적화한 게 아니라 지표를 해킹당한 것입니다.
방어는 ‘가짜를 잡는 탐지’만으로 부족합니다. 성장팀이 해야 할 일은 핵심 의사결정 지표를 조작 난이도가 높은 방향으로 재설계하는 것입니다. (1) GitHub/커뮤니티 트랙션은 스타 절대값 대신 Fork/Star, Watch/Star 비율을 1차 가드레일로 둡니다(StarScout가 제시한 휴리스틱). “스타 1만+ & 포크/스타 < 0.05” 같은 규칙을 경보로 두고, 파트너/투자/PR 배분에서 제외하는 내부 정책을 만드세요. (2) 외부 소셜 프루프는 ‘별점 평균’ 대신 검증 가능한 행동으로 대체합니다: 설치 후 활성화 이벤트(예: 첫 프로젝트 생성), 7일 내 핵심 기능 2회 이상 사용, 유료 전환까지의 Time-to-Value. (3) 채널 운영은 ‘노출 지표’가 아니라 다운스트림 코호트 품질로 판정합니다: 채널별 D7 리텐션, 결제전환, 환불/차지백, CS 티켓/활성유저.
실행 가능한 실험 루프는 간단합니다. 2주 단위로 “소셜 프루프 강화” 실험을 하되, 성공 기준을 CTR이 아니라 (Activation Rate × D7 Retention × Purchase CVR)로 둡니다. 리뷰 위젯/배지/스타 카운터를 A/B로 노출하되, ‘전환 상승’이 단기 착시인지 확인하기 위해 30일 누적 LTV 또는 최소 D30 리텐션을 함께 보세요. 동시에 ‘신뢰 신호’는 가능한 한 1st-party로 회수해야 합니다: 제품 내 레퍼런스(템플릿 갤러리, 공개 사용 사례), 검증된 고객 로고(계약/결제 기반), 실제 사용량 기반 배지(예: 30일 활성 워크스페이스 수)처럼 조작 비용이 높은 신호로 교체합니다.
전망은 명확합니다. geeknews 글이 언급하듯 규제(FTC Consumer Review Rule 등)와 플랫폼 단속이 강화돼도, 신호 경제는 형태를 바꿔 계속됩니다. 따라서 장기적으로 이기는 팀은 “가짜를 완벽히 제거”하는 팀이 아니라, 조작 가능한 신호에 비즈니스 결정을 걸지 않는 팀입니다. 스타와 리뷰는 참고자료로 격하시켜두고, 성장 엔진은 제품 사용 데이터와 코호트 품질로 돌리세요. 트랙션이 조작되는 시대에 경쟁우위는 ‘더 큰 숫자’가 아니라 ‘더 믿을 수 있는 측정’에서 나옵니다.