AI 코딩 도구, 기억을 갖기 시작하다

매번 처음부터 다시, 이 답답함의 정체

AI 코딩 어시스턴트를 쓰다 보면 반드시 한 번은 이 상황을 맞닥뜨리게 된다. 월요일에 공들여 잡은 webpack 설정 이슈를 수요일에 같은 AI가 처음 보는 듯 다시 디버깅하기 시작할 때. 'npm 말고 pnpm 써줘'라고 열 번 말했는데 다음 세션엔 또 npm이 등장할 때. 새벽 2시에 겨우 잡은 FFmpeg 오디오 버그를 3주 뒤 똑같이 한 시간 동안 다시 풀 때.

이건 모델 성능의 문제가 아니다. 구조의 문제다. 현재 대부분의 AI 코딩 어시스턴트는 세션이 종료되면 컨텍스트가 완전히 초기화된다. 당신이 쌓아온 결정, 선호, 해결책—전부 증발한다.

agent-recall: MCP로 기억을 심다

dev.to에 소개된 agent-recall은 이 문제를 정면으로 겨냥한 오픈소스 MCP(Model Context Protocol) 서버다. 개발자가 직접 유튜브 채널용 2-AI-에이전트 프로덕션 워크플로우를 운영하다 겪은 고통에서 출발했다는 점이 인상적이다. 실제로 쓰다 답답해서 만든 도구는, 실제로 쓸 수 있는 도구가 된다.

설치는 npx agent-recall 한 줄이다. Cursor, Claude Desktop, Windsurf 설정 파일에 몇 줄 추가하면 AI 어시스턴트에게 여섯 가지 새 능력이 생긴다. remember로 버그 수정 이력이나 프로젝트 결정을 저장하고, recall로 현재 작업과 관련된 기억을 토큰 예산에 맞게 꺼내오고, save_state / load_state로 세션 간 작업 컨텍스트를 이어받는다.

기술 선택도 실용적이다. 벡터 데이터베이스도, 임베딩 모델도, API 키도 없다. 로컬 SQLite에 FTS5(Full-Text Search) 인덱스를 얹은 구조로, 설치 용량 최소화와 오프라인 동작, 즉각적인 검색 속도를 동시에 잡는다. recall("webpack build errors")를 호출하면 텍스트 관련도·최신성·활용 빈도로 랭킹된 기억들이 컨텍스트 윈도우를 터뜨리지 않는 적정량으로 반환된다.

특히 Knowledge Pack 개념이 흥미롭다. npx agent-recall install @packs/ffmpeg 한 줄로 FFmpeg 관련 실전 버그와 해결책 12개를 AI에게 즉시 주입할 수 있다. 누군가 이미 밤새 겪은 시행착오를 당신의 AI가 처음부터 반복하지 않아도 된다는 뜻이다. React, Docker, AWS, Terraform 팩을 커뮤니티가 함께 만들어가는 생태계가 형성된다면, 이건 단순한 메모리 툴을 넘어 도메인 지식의 공유 인프라가 된다.

기억이 없어도 만든다: 바이브 코딩의 역설

한편, AI 어시스턴트의 기억 문제가 해결되기 전에도 비개발자들은 이미 AI로 실제 동작하는 소프트웨어를 만들어내고 있다. 지디넷코리아가 보도한 문과 출신 기자의 Claude Code 체험기는 이 흐름을 생생하게 보여준다.

코드 한 줄 모르는 기자가 1시간 30분 만에 완성한 것은, 키워드별 탭 분류·24시간 이내 기사 필터링·카드형 북마크·AI 자동 요약·하루 두 번 자동 실행까지 갖춘 뉴스 모니터링 앱이다. 사용한 도구는 Anthropic의 Claude Code, 그리고 CLAUDE.md—프로젝트 목적과 원하는 기능을 미리 정리해 AI에게 제공하는 일종의 컨텍스트 문서다.

이 경험에서 주목할 점은 두 가지다. 첫째, 컨텍스트 엔지니어링이 결과의 품질을 결정했다. 막연하게 '뉴스 모아줘'가 아니라, 키워드 목록·탭 구조·UI 방식·정렬 기준을 문서 형태로 먼저 정리했을 때 AI의 결과물이 실제로 쓸 수 있는 수준이 됐다. 요청이 구체적일수록 결과물이 정확해지고, 모호할수록 엉뚱해지는 건 여전한 AI의 특성이다.

둘째, Claude Code는 단순한 명령 수행기가 아니라 공동 설계자에 가까웠다. 515건 기사가 한꺼번에 몰려 프로그램이 멈추자, AI가 스스로 원인을 진단하고 키워드 규모별 기사 수 제한 구조를 먼저 제안했다. 기자는 기획자와 최종 결정권자였고, 개발자·감독관·디버거 역할은 AI가 맡았다.

두 흐름이 만나는 지점

agent-recall과 바이브 코딩 사례는 표면적으로 다른 이야기처럼 보이지만, 사실 하나의 질문을 공유한다. 'AI가 맥락을 얼마나 잘 유지하느냐가 결과물의 품질을 결정한다'는 것이다.

agent-recall은 세션을 넘어 맥락을 영속화하는 인프라 레이어를 만든다. CLAUDE.md는 세션 시작 전에 맥락을 주입하는 문서 레이어를 만든다. 하나는 기억을 저장하는 방향이고, 다른 하나는 기억이 없어도 충분한 컨텍스트를 미리 제공하는 방향이다. 두 전략은 결국 같은 목표를 향한다—AI가 '처음 만나는 사람'처럼 굴지 않도록 만드는 것.

ByteDance의 deer-flow 같은 장시간 자율 에이전트 프레임워크, Claude Code의 /git-pr 커스텀 커맨드로 PR 작성까지 자동화하는 워크플로우가 동시에 등장하고 있다는 점도 같은 맥락이다. AI는 점점 더 긴 작업 단위를 자율적으로 처리하는 방향으로 진화하고 있으며, 그 진화를 받쳐주는 핵심 인프라가 바로 맥락의 영속성이다.

지금 실무에 적용할 수 있는 것들

이 흐름에서 바로 꺼내 쓸 수 있는 실천 포인트는 명확하다.

단기적으로: CLAUDE.md(혹은 AGENTS.md) 습관을 들이자. 프로젝트 컨벤션, 자주 쓰는 커맨드, 피해야 할 패턴을 문서화해두면 매 세션마다 같은 설명을 반복하는 낭비가 줄어든다. 이건 AI를 위한 문서지만, 결과적으로 팀 온보딩 문서이기도 하다.

중기적으로: agent-recall 같은 MCP 기반 메모리 레이어 도입을 검토할 만하다. 특히 반복 작업이 많은 프로젝트—특정 API 연동, 인프라 설정, 공통 버그 패턴—에서 Knowledge Pack을 직접 만들어 팀 내 공유하면 집단 지성의 AI 주입이 가능해진다.

구조적으로: '코드를 짜는 사람'에서 '맥락을 설계하는 사람'으로의 역할 전환을 진지하게 받아들일 때가 됐다. 비개발자도 1시간 30분에 프로덕션 앱을 만드는 시대에, 개발자의 경쟁력은 코드 타이핑 속도가 아니라 문제를 구조화하고 AI에게 제대로 전달하는 능력에서 나온다.

기억하는 AI, 그 다음은

세션 기억 문제는 현재 AI 코딩 도구의 가장 현실적인 마찰 중 하나였다. agent-recall은 그 마찰에 대한 실용적이고 가벼운 해법을 제시했고, 커뮤니티 기반 Knowledge Pack 생태계라는 흥미로운 확장 가능성을 열었다.

동시에 바이브 코딩의 실전 사례들은 '맥락 설계'가 잘 되면 기억이 완벽하지 않아도 상당히 높은 수준의 결과물을 뽑아낼 수 있다는 것을 보여준다. 두 방향의 접근이 서로를 보완하면서 발전할 때, AI 코딩 어시스턴트는 비로소 진짜 '팀원'에 가까워질 것이다.

매번 처음 만나는 사람처럼 굴던 AI가, 이제 조금씩 당신을 기억하기 시작했다.