지하철에서 커밋하고, AI가 OS를 짓다: 에이전트 시대 개발자의 하루

지하철 안에서 텔레그램 메시지 하나를 보냈더니, 집에 있는 컴퓨터의 Claude Code가 버그를 수정하고 diff를 회신해왔다. 터미널도, SSH도, 심지어 노트북도 필요 없었다. 이 경험담이 단순한 긱(geek)의 자랑처럼 들린다면, 아직 패러다임 전환의 속도를 실감하지 못한 것이다.

터미널 밖으로 나온 에이전트

Anthropic이 2026년 3월 공개한 Claude Code Channels는 'push, not pull'이라는 아키텍처 원칙 하나로 기존 MCP 서버와 갈린다. 기존 MCP는 수동적이다—Claude가 호출해야만 움직인다. 반면 Channel은 외부 이벤트를 Claude 세션 안으로 밀어 넣는다. 텔레그램 메시지, CI 실패 웹훅, 모니터링 알림—이 모든 것이 실행 중인 Claude Code 세션에 프로젝트 컨텍스트를 유지한 채 도착한다. 당신이 터미널 앞에 있을 필요가 없어진 것이다.

보안 설계도 눈여겨볼 만하다. 채널 플러그인은 로컬 머신에서 Bot API를 폴링하는 구조라 인바운드 포트가 열리지 않는다. 퍼블릭 인터넷에 노출되는 엔드포인트 없이, 페어링 코드 인증으로 특정 사용자 ID를 잠근다. 같은 Discord 서버의 다른 사람이 메시지를 보내도 조용히 무시된다. 오픈소스 대안인 OpenClaw가 200K GitHub 스타로 수요를 증명했다면, Channels는 그 수요를 엔터프라이즈 보안 검토를 통과할 수 있는 수준으로 끌어올렸다.

직접 코딩 비중이 80%에서 0%로

Andrej Karpathy는 최근 강연에서 체감 데이터를 꺼냈다. 2024년 12월을 기점으로 자신의 직접 코딩 비중이 80%에서 20%, 이후 거의 0%에 근접했다고. 대부분의 사람들은 이 변화가 이미 일어났다는 사실 자체를, 그리고 얼마나 극적인지를 인지하지 못하고 있다고 덧붙였다.

새로운 병목은 타이핑 속도가 아니다. 에이전트에게 의도를 얼마나 정확하게 전달하는가가 핵심 역량이 됐다. Peter Steinberger의 사례가 이를 잘 보여준다. 그는 Codex 에이전트를 동시에 여러 개 띄워 10개 이상의 레포를 병렬 운영하며, 각 에이전트에 약 20분 단위의 작업을 배분한다. 한 에이전트는 리서치, 다른 에이전트는 코드 작성, 또 다른 에이전트는 구현 계획 수립. 작업 단위가 '함수 하나'에서 '새 기능 하나'로 올라섰다.

Karpathy는 이 감각을 박사 과정 시절 GPU FLOP을 최대치로 뽑지 못했을 때의 초조함에 비유한다. 지금은 그 초조함이 토큰 처리량 지휘 능력으로 옮겨왔다. 구독 여유분이 남아 있으면 처리량을 다 뽑지 못했다는 신호로 읽힌다. 에이전트를 얼마나 잘 다루는가가 개발자의 생산성 지표가 된 것이다.

AI가 OS를 8일 만에 짓다

한편 dev.to의 한 개발자는 같은 기간 동안 전혀 다른 실험을 했다. Claude(웹앱)와 Claude Code를 결합해 x86-64 운영체제 ASOS를 처음부터 구축한 것이다. UEFI 부트, 페이지 테이블, 선점형 멀티태스킹, FAT32 파일시스템, 윈도우 매니저, 그리고 1993년 오리지널 DOOM 포팅까지. 8일, 82커밋, 25,709줄의 코드.

이 프로젝트에서 드러난 워크플로우 패턴이 흥미롭다. Claude 웹앱을 '아키텍처 컨설턴트'로, Claude Code를 '실행자'로 역할을 분리했다. 아키텍처 설계와 고수준 의사결정은 대화형으로, 실제 C와 Assembly 코드 생성과 컴파일 오류 해결은 에이전트에게. 이 분리가 프로젝트의 성패를 가른 핵심 결정이었다고 회고한다.

동시에 AI의 한계도 선명하게 드러났다. AI가 제안한 '분리된 데이터 디스크 전략'을 그대로 따랐다가 복잡한 버그 덩어리에 빠졌다. 인간이 직접 의문을 제기하고 방향을 바꾸기 전까지 AI 스스로 빠져나오지 못했다. 고수준 아키텍처 판단에서 인간의 감독이 여전히 필수적이라는 교훈이다.

워크플로우가 바뀌면 사고방식이 바뀐다

세 사례를 겹쳐보면 하나의 윤곽이 잡힌다. 에이전트 시대의 개발자는 코드를 직접 타이핑하는 사람이 아니라, 여러 에이전트를 오케스트레이션하는 디렉터에 가깝다. Channels는 물리적 위치의 제약을 없애고, 병렬 에이전트 운영은 작업 단위의 개념을 바꾸며, OS 빌드 사례는 AI와의 역할 분담 방식을 시험했다.

Karpathy가 지적한 '들쭉날쭉한(jagged) 지능' 개념도 실무적으로 중요하다. 현재 모델은 검증 가능한 영역—코드 정확성, 테스트 통과—에서는 빠르게 발전하지만, 그 밖의 영역에서는 정체한다. 이 비대칭을 이해하고 있어야 에이전트에게 무엇을 맡기고 무엇을 직접 판단할지 경계를 제대로 그을 수 있다.

AgentMD 파일 작성, 메모리 도구 구성, 작업 단위 설계—이것들이 새로운 개발자 역량이다. 에이전트가 잘 작동하지 않을 때 대부분 '모델 능력 부족'이 아니라 '사용자의 지시 능력 부족'으로 체감된다는 Karpathy의 말은, 프론트엔드 개발자에게도 그대로 적용된다.

지금 당장 달라지는 것들

실용적 관점에서 정리하면 이렇다. Channels는 개발 루프를 터미널 세션 밖으로 꺼냈다. CI 실패 알림이 Claude 세션으로 직접 들어와 컨텍스트를 유지한 채 처리된다. 모바일에서 스크린샷을 찍어 Claude Code에 전송하고 피드백을 받는 QA 워크플로우가 실용적인 수준이 됐다.

더 장기적인 시사점은 Karpathy의 'AutoResearch' 구상에서 온다. 연구자 자신이 병목에서 빠져야 토큰 처리량이 최대화된다는 역설—이것은 개발자에게도 동일하게 적용된다. 내가 병목이 되지 않도록 에이전트의 자율 실행 범위를 설계하는 것, 그것이 앞으로 1~2년 안에 시니어 개발자를 가르는 기준선이 될 것이다.

도구는 이미 바뀌었다. 문제는 사고방식이 그 속도를 따라가고 있는가다.