Next.js 15로 AI 프로덕트 빠르게 만들기: 프로토타입에서 운영까지

'AI로 빠르게 만든다'는 말은 이제 진부하다. 진짜 질문은 그다음이다. 빠르게 만든 것이 실제로 작동하는가, 그리고 운영 비용이 통제 가능한가. dev.to에 올라온 AI 이모지 생성기 Forgemoji의 빌드 기록은 이 두 질문에 꽤 성실하게 답한다. Next.js 15와 Cloudflare Workers AI를 조합한 이 사례는 단순한 튜토리얼이 아니라, '사용자 문제 → 아키텍처 선택 → UX 디테일'이 한 줄기로 이어지는 프로덕트 사고의 압축판이다.

왜 이모지 생성기인가—문제 정의가 먼저다

Emoji Kitchen은 월 50만 명이 찾는 서비스다. 하지만 그 인기는 아이러니하게도 결함 위에 서 있다. Google이 사전 렌더링해 둔 약 4만 개의 조합 이미지를 룩업 테이블로 서빙하는 구조라, 데이터셋에 없는 조합은 존재 자체가 불가능하다. Forgemoji의 출발점은 바로 이 빈틈이다. '어떤 조합이든 투명 배경의 새로운 이모지를 생성한다'—문제가 뾰족할수록 아키텍처 선택도 명확해진다.

3레이어 생성 파이프라인: 점진적 복잡도 설계

빌더가 선택한 구조는 3개 레이어의 점진적 파이프라인이다. Layer 1(정적 룩업)은 Google 이미지 저작권 정책을 확인한 지 5일 만에 폐기했다. 빠른 실험과 빠른 포기—이것 자체가 올바른 프로세스다. Layer 2는 Text-to-Image로 프라이머리 경로이자 무료 구간이다. Layer 3는 사진을 업로드해 이모지 스타일로 합성하는 Image-to-Image로, Apple의 Genmoji와 유사한 경험을 플랫폼 무관하게 제공한다.

핵심은 프로바이더 폴백 체인이다. Cloudflare Workers AI(flux-1-schnell)를 1순위로, ModelScope, MiniMax를 순차 대기시킨다. Cloudflare는 하루 약 230회 무료 생성을 제공하므로 초기 사이드 프로젝트 트래픽은 비용 없이 흡수된다. 하나가 실패하면 자동으로 다음 프로바이더로 넘어가고, 각 실패는 Discord 웹훅으로 즉시 알림된다. 단순하지만 실전적인 가용성 설계다.

프롬프트 엔지니어링: 이모지 유니코드가 아닌 시각 언어로

Text-to-Image 모델에 이모지 유니코드를 그대로 던지면 '고양이 옆에 불꽃'이 나온다. 원하는 건 '고양이와 불꽃이 융합된 하나의 캐릭터'다. 이 간극을 메우는 것이 emoji-prompt-map.ts—200개 이상의 이모지를 구체적인 시각 묘사로 매핑한 테이블이다.

프롬프트 구조에서 가장 중요한 제약은 "one single character only"다. 이 한 줄 없이는 모델이 두 객체를 나란히 배치하는 방식으로 응답한다. 제약 하나가 산출물의 품질을 결정적으로 가른다. 프롬프트 엔지니어링이 단순한 문장 다듬기가 아니라 모델 행동을 제어하는 설계임을 다시 확인하는 지점이다.

UX 디테일: 배경 제거의 타이밍 문제

투명 배경 처리는 대부분의 이모지 도구가 멈추는 지점이다. rembg로 배경을 제거하면 Discord 스티커나 Telegram 이모지로 바로 쓸 수 있는 PNG가 나오지만, 처리 시간이 2~4초 걸린다. 단순하게 구현하면 사용자는 생성이 끝난 후 추가로 4초를 더 기다린다.

해결책은 레이어드 피드백 전략이다. 먼저 배경이 있는 원본 이미지를 즉시 보여주고, rembg 처리가 완료되면 클라이언트 측 폴링으로 투명 버전으로 교체한다. 사용자 입장에서 로딩 스피너 없이 이미지가 점점 나아지는 경험을 얻는다. 성능 최적화가 아니라 지각된 성능(Perceived Performance) 설계의 교과서적 사례다.

레이턴시와 서버리스의 충돌: submit/poll 패턴

I2I 모드는 60~120초가 걸린다. Vercel 함수의 최대 타임아웃은 300초지만, 120초는 아슬아슬한 경계다. 이를 submit/poll 비동기 아키텍처로 해결한다. POST /api/generate/submit으로 task_id를 받고, 클라이언트가 3초 간격으로 상태를 폴링한다. UI에는 카운트다운 타이머를 제공해 '얼마나 기다려야 하는지'에 대한 불안을 줄인다.

이 패턴은 서버리스 환경에서 장시간 작업을 다룰 때의 표준 해법에 가깝다. 아직 단순 in-memory Map으로 구현된 레이트 리미팅(하루 IP당 5회, 전체 하루 500회)은 스케일이 커지면 분명 한계에 부딪히지만, '지금 필요한 것만 만든다'는 원칙에 충실하다.

운영 비용, 설계 단계에서 잡지 않으면 나중에 청구서가 날아온다

Forgemoji가 무료 티어로 버티는 동안, AI 에이전트 운영 현장에서는 정반대의 이야기가 벌어졌다. dev.to에 연재된 VEKTOR Slipstream 시리즈는 OpenClaw 기반 에이전트가 구독 토큰을 API 키처럼 우회 사용하다 Anthropic의 강제 종료와 수천 달러 청구서를 맞이한 사례를 상세히 기록한다. 2026년 4월, Anthropic은 24시간도 안 되는 공지로 비공식 우회 채널을 차단했다.

핵심 인사이트는 단순하다. 구독 모델은 인간 속도를 전제로 설계됐고, 에이전트는 기계 속도로 움직인다. 이 전제 차이가 인프라 비용의 폭발로 이어진다. 리트라이 루프 버그 하나가 30번 호출할 작업을 3,000번 호출로 만들고, 토큰 만료 후 에이전트가 조용히 멈춰 있어도 아무도 모른다. 설계 단계에서 비용 라우팅과 실패 감지를 함께 고려하지 않으면, 운영 단계에서 예측 불가능한 비용이 청구된다.

시사점: '빠르게 만들기'와 '제대로 운영하기'는 설계 단계에서 이미 갈린다

Forgemoji와 VEKTOR의 사례는 서로 다른 스케일이지만 같은 교훈을 가리킨다. 빠른 프로토타이핑은 유효하다. 하지만 운영 비용, 실패 감지, 레이턴시 처리는 후반부로 미룰수록 수정 비용이 기하급수적으로 커진다.

Next.js 15 + Cloudflare Workers AI 조합은 현재 시점에서 사이드 프로젝트 스케일의 AI 프로덕트를 가장 빠르게 띄울 수 있는 스택 중 하나다. 무료 티어로 실제 사용자를 확보하고, 트래픽이 붙을 때 점진적으로 인프라를 강화하는 흐름은 충분히 현실적이다. 다만 그 흐름이 끊기지 않으려면, 처음부터 폴백 체인·비동기 처리·알림 설계를 함께 넣어야 한다.

전망: AI 프로덕트의 빌드-런 경계가 사라지고 있다

흥미로운 건 Forgemoji를 만든 사람이 스스로를 '트레이드바이 UI/UX 디자이너'로 소개한다는 점이다. 인프라보다 사용자 흐름을 먼저 생각하는 사람이 Cloudflare Workers AI와 Next.js API Route를 조합해 프로덕션급 AI 파이프라인을 혼자 완성했다. AI 도구가 개발-설계 경계를 허물고 있다는 말은 추상적인 트렌드가 아니라, 이런 사례들이 쌓이면서 구체적인 현실이 되고 있다.

앞으로 AI 프로덕트의 경쟁력은 '어떤 모델을 쓰느냐'보다 '프롬프트 설계, 비용 라우팅, UX 피드백 루프를 얼마나 촘촘하게 엮느냐' 에서 갈릴 가능성이 높다. 빠른 실험을 가능하게 하는 스택은 이미 충분히 성숙했다. 이제 남은 질문은 그 실험을 운영 가능한 프로덕트로 전환하는 설계 감각이다.