측정 없이 최적화 없다: AI 시대 프론트엔드 워크플로우의 새 기준

'최적화 시도가 항상 성공하지는 않는다.' velog에 공개된 Next.js 15 이미지 최적화 실전 기록에 등장하는 이 문장은, AI 도구를 마구 쌓아 올리며 개발 속도를 높이고 있는 지금의 프론트엔드 씬에 꽤 날카롭게 박힌다. 더 좋게 만들려던 시도가 LCP를 0.5s에서 1.0s로 두 배 악화시켰다는 이 실패담이 흥미로운 이유는, 실패의 원인이 기술 부족이 아니라 측정 없는 가정이었기 때문이다.

해당 사례를 구체적으로 보면, blur placeholder 구현을 위해 외부 이미지 URL에서 동적으로 tiny 이미지를 fetch해 base64로 변환하는 방식을 택했다. 21개 이미지를 병렬로 fetch하더라도 가장 느린 응답 하나가 전체를 잡아두면서 TTFB가 9ms에서 2.03s로 폭등했다. LCP를 개선하겠다는 시도가 Critical Path에 외부 API 의존성을 심어 TTFB를 터뜨린 것이다. 해결책은 의외로 단순했다—10x10 회색 JPEG을 미리 base64로 인코딩한 정적 상수를 하드코딩하는 것. TTFB는 다시 9ms로 돌아왔고, LCP는 손해 없이 blur UX를 확보했다. '측정 → 적용 → 재측정 → 비교' 루프가 왜 선택이 아닌 기본값이어야 하는지를 수치로 증명한 케이스다.

이 이야기가 단순한 기술 트러블슈팅으로 끝나지 않는 이유가 있다. AI를 활용한 코드 생성이 일상화되면서, 우리는 '그럴듯해 보이는 코드'를 빠르게 얻는 대신 '그게 실제로 어떻게 동작하는지' 검증하는 속도가 점점 뒤처지는 역설에 빠지고 있다. 동적 blur fetch 방식도 코드 자체는 깔끔하고 그럴듯하다. AI가 생성했어도 전혀 이상하지 않을 구현이다. 문제는 그 코드가 Critical Path에서 어떤 파급을 일으키는지, 실제 환경에서 측정해보기 전까지는 알 수 없다는 점이다.

같은 맥락에서 repomeld v1.1이 해결하려는 문제를 보면 패턴이 보인다. 코드베이스를 AI에 넘길 때, 아무 생각 없이 전체를 붙여 넣으면 실제 비즈니스 로직 50KB가 5MB의 vendor 노이즈 속에 파묻힌다. AI 모델이 이미 알고 있는 jQuery, Bootstrap, Lodash에 소중한 컨텍스트 윈도우를 낭비하는 셈이다. repomeld는 200개 이상의 공개 라이브러리와 빌드 결과물을 자동으로 걸러내, AI에게 '당신만의 코드'만 전달하는 도구다. --force-include 옵션으로 커스터마이징한 라이브러리는 예외로 포함할 수 있고, 프로젝트 루트의 repomeld.ignore.json으로 무시 목록을 확장할 수도 있다. 결과적으로 4.2MB 노이즈 파일이 52KB 신호 파일로 압축된다. AI 컨텍스트 최적화는 프롬프트 엔지니어링보다 컨텍스트 큐레이션에서 시작한다는 실용적 인사이트다.

Adobe Firefly AI 어시스턴트는 이 흐름을 창작 도구 영역으로 확장한다. 어도비가 공개한 이 에이전틱 크리에이티브 시스템은 사용자가 자연어로 결과물을 설명하면, Photoshop·Premiere·Lightroom·Illustrator에 걸친 다단계 작업을 단일 인터페이스에서 자동으로 조율한다. 핵심은 단순한 생성형 AI가 아니라 작업 맥락과 진행 상황을 유지하며 연속적으로 실행하는 에이전틱 구조라는 점이다. '크리에이터가 방향을 제시하면 AI가 실행을 담당한다'는 역할 분담 모델은, 프론트엔드 개발에서도 이미 익숙한 패턴이다—개발자가 의도와 구조를 설계하고, AI가 반복 구현을 처리하는 방식.

세 사례를 이어 붙이면 하나의 원칙이 선명해진다. 노이즈를 제거하고, 신호에 집중하고, 반드시 측정하라. Next.js 이미지 최적화는 Critical Path의 노이즈(외부 API 의존성)를 제거했을 때 성능이 회복됐다. repomeld는 AI 컨텍스트의 노이즈(vendor 코드)를 걷어내 더 나은 답을 이끌어낸다. Adobe Firefly는 반복 작업의 노이즈를 자동화해 창작자가 방향 설계에 집중하게 한다. 도구는 다르지만 작동 원리는 같다.

이 원칙은 '프로토타입 → 검증 → 고도화' 워크플로우의 각 단계에서 다르게 적용된다. 프로토타입 단계에서 AI는 속도를 준다. 검증 단계에서는 측정이 진실을 준다—DevTools Waterfall, Core Web Vitals 수치, TTFB 로그가 AI의 그럴듯한 제안을 걸러내는 필터가 된다. 고도화 단계에서 비로소 정적 상수 하나가 동적 fetch 로직 전체를 이기는 결정을 내릴 수 있다. AI 도구를 워크플로우에 통합할수록, 역설적으로 측정과 판단은 인간 개발자의 고유 역할로 더 선명해진다.

앞으로의 프론트엔드 개발 루틴은 'AI가 코드를 얼마나 빠르게 생성하는가'보다 '어떤 컨텍스트를 AI에 넘기고, 그 결과를 어떻게 검증하고, 어디서 인간이 개입하는가'를 설계하는 방향으로 진화할 것이다. repomeld 같은 컨텍스트 큐레이션 도구, Next.js 성능 측정 루프, Adobe Firefly 같은 에이전틱 자동화는 그 루틴의 서로 다른 레이어를 채우고 있다. 지금 필요한 건 더 많은 AI 도구가 아니라, 이 레이어들을 어떻게 조합해 신뢰 가능한 워크플로우를 만드는가에 대한 설계 감각이다.

측정 없이 최적화 없다: AI 시대 프론트엔드 워크플로우의 새 기준

출처