우리는 여전히 단말기 앞에 앉아 있다

1815년, 나폴레옹이 워털루에서 패배하고 세인트헬레나로 유배된 뒤, 유럽의 군주들은 빈에 모여 하나의 합의를 이뤄냈다. 프랑스 혁명이 만들어낸 국민국가라는 새로운 체제를 지우고, 왕정이라는 과거의 질서로 되돌아가자는 것이었다. 메테르니히가 설계한 빈 체제는 약 30년간 유럽을 지배했다. 혁명이 만들어낸 자유주의와 민족주의는 지하로 내려갔지만 사라지지 않았고, 결국 1848년 2월 혁명으로 빈 체제는 완전히 붕괴했다. 국민국가라는 새 시스템이 등장했음에도 과거의 관성이 그것을 30년이나 억눌렀던 것이다. 그리고 보불전쟁(1870년) 이후 유럽에서는 대규모 전쟁이 사라질 것이라는 낙관이 퍼졌지만, 채 40년도 지나지 않아 1차 세계대전이 터졌다. 역사는 우리가 생각하는 것보다 훨씬 더 과거의 궤도 위에서 움직인다.

이 이야기를 꺼내는 이유가 있다. TIME이 발행한 “The New Old Age” 시리즈를 읽다가 하나의 문장에 머리를 맞은 듯한 충격을 받았다. 전 세계 주요 강대국의 수장들이 70대 이상의 고령이라는 사실이었다. 실제로 지금 세계를 움직이는 강대국의 수장들을 보면, 60대는 젊은 축에 속하고 70대가 중심이다. 푸틴은 소련에서 태어나 소련에서 교육받고 KGB에서 경력을 쌓은 사람이다. 그의 세계관은 21세기가 아니라 냉전시대에 형성된 것이다. 그런데 이것이 푸틴만의 문제일까. 전 세계 권력의 정점에 있는 사람들 대부분이 냉전기에 세계관을 형성한 세대다. 세상은 바뀌었다고 말하지만, 그 세상을 운전하는 사람들의 머릿속은 바뀌지 않았다.

할아버지, 아버지, 나, 그리고 자녀. 어느 시대든 3~4세대가 공존한다. 한국만 해도 후진국에서 태어난 세대, 중진국에서 태어난 세대, 선진국에서 태어난 세대가 함께 살고 있다. 정치도 기술도 이 세대 공존의 법칙에서 벗어나지 못한다. 디지털 세상의 역사를 길게 잡아도 60여 년인데, 그 안에 2세대의 서사가 압축되어 있다. 이 서사가 흘러가는 방향은 미래에만 있는 것이 아니라, 과거의 궤도 속에 여전히 갇혀 있다. IT의 세계에서도 마찬가지다. 지금 이 순간, 가장 첨단이라고 불리는 AI 시대의 컴퓨팅 구조가 60년 전 IBM이 만든 메인프레임의 구조와 놀라울 정도로 닮아 있다는 사실을 직시해야 한다.

메인프레임에서 한 발짝도 벗어나지 못했다

1964년 4월 7일, IBM의 토머스 왓슨 주니어는 뉴욕 포킵시에서 System/360을 공개했다. 50억 달러를 투자한 이 프로젝트는 당시로서는 상상할 수 없는 규모의 도박이었다. IBM의 연간 매출이 25억 달러이던 시절, 그 두 배를 하나의 제품군에 쏟아부은 것이다. System/360은 컴퓨터 산업의 판을 완전히 뒤집었다. 호환 가능한 컴퓨터 패밀리라는 개념, 소프트웨어와 하드웨어의 분리, 플랫폼 비즈니스 모델의 원형을 모두 이 기계가 만들어냈다. 그리고 이 메인프레임의 구조는 지금까지 컴퓨팅의 근본 골격으로 남아 있다.

많은 사람이 PC의 등장을 혁명이라고 부른다. 스티브 잡스와 스티브 워즈니악이 차고에서 Apple II를 만들었고, IBM PC가 사무실을 장악했으며, 마이크로소프트가 소프트웨어의 시대를 열었다. 2007년에는 아이폰이 등장하면서 모바일 시대가 시작됐다. PC 시대, 인터넷 시대, 모바일 시대. 각 시대마다 패러다임이 완전히 바뀌었다고들 말한다. 하지만 이것은 착시에 가깝다.

PC의 성능이 중요했던 시절이 분명 있었다. 쓰는 컴퓨터의 CPU와 그래픽카드에 따라 게임의 퀄리티가 달라지고, 프로그램이 돌아가거나 멈추는 일이 있었다. 스마트폰도 마찬가지였다. 하지만 이 시기는 길어야 10여 년에 불과했다. 그때조차도 거대한 데이터 처리는 서버가 담당했고, 인터넷 서비스의 실질적인 연산은 중앙의 데이터센터에서 이루어졌다. 엣지 단말기의 성능이 전체 연산에서 차지하는 비중은 극히 일부분이었을 뿐이다.

지금의 상황을 보면 더욱 명확하다. 어떤 스마트폰을 들고 있든, 어떤 노트북을 쓰고 있든, LLM에게 질문하고 답을 받는 데 있어 단말기 성능의 차이는 사실상 0에 수렴한다. ChatGPT에 물어보는 응답의 품질은 최신 맥북 프로에서 하든 5년 된 안드로이드 폰에서 하든 동일하다. 유일하게 차이를 만드는 것은 네트워크 연결 상태뿐이다. 통신이 되느냐 안 되느냐. 이것이 60년 전 메인프레임 단말기의 조건과 정확히 같다. 1960년대의 녹색 화면 터미널은 자체 연산 능력이 없었다. 모든 처리는 중앙의 메인프레임이 했고, 터미널은 입력과 출력만 담당했다. 지금 손에 들린 스마트폰이 바로 그 터미널이다.

미술사에서 고전 양식이 수백 년 뒤에 다시 등장할 때 ‘신고전주의’라고 부른다. 과거의 르네상스와 본질은 같지만 세부가 다르기에 ‘신(新)’이라는 접두어가 붙는다. 지금의 컴퓨팅 구조도 마찬가지다. 과거의 메인프레임과 지금의 메인프레임이 다른 점은 연산의 규모다. 수천 대의 GPU가 클러스터를 이루고, 수조 개의 파라미터를 가진 언어 모델이 돌아가는 거대한 연산 인프라. 이것이 신메인프레임이다. 그리고 과거에는 사람의 뇌가 프로그래밍의 주체였다면, 지금은 이 거대한 연산 뇌인 LLM이 프로그래밍까지 대신한다. 중앙 집중의 정도가 오히려 더 극단적으로 치달은 셈이다.

개발의 방식은 정말 바뀌었는가

프로그래밍을 처음 시작했을 때를 떠올려본다. PC에서 코드를 작성하고, PC에서 실행해보고, 간단한 테스트를 돌렸다. 하지만 그것은 어디까지나 가벼운 검증이었다. 진짜 의미 있는 테스트, 프로덕션 환경에서의 검증은 반드시 서버에서 해야 했다. 로컬 환경과 서버 환경의 갭을 얼마나 줄이느냐가 개발자의 역량과 개발 속도를 좌우했다. 로컬에서 잘 돌아가는 코드가 서버에 올리면 에러를 내뿜는 경험은 모든 개발자가 공유하는 악몽이었다.

그런데 지금은 어떤가. 코볼로 프로그램을 짜서 녹색 화면의 터미널에서 메인프레임에 전송하고 결과를 받아보던 1960년대의 방식과 지금의 방식을 비교해보면, 놀랍도록 유사한 구조가 드러난다. 지금 개발자들은 LLM에게 코딩을 요청하고, LLM이 코드를 생성하며, 그 코드의 검증과 실행까지 LLM에게 맡기고, 서비스 운영의 판단마저 LLM에 의존하는 방향으로 가고 있다. Claude Code나 GitHub Copilot 같은 AI 코딩 도구는 단순한 자동완성이 아니다. 코드베이스 전체를 컨텍스트로 읽어 들이고, 멀티 파일을 동시에 수정하며, 테스트를 실행하고 결과를 피드백하는 에이전트형 코딩 환경이다. 개발자는 지시를 내리고 결과를 확인하는 역할로 점점 이동하고 있다.

이미 AI 코딩 도구 하나가 전 세계 GitHub 공개 커밋에서 빠르게 늘어나는 비중을 차지하고 있고, 최근 한 달 사이에만 그 비율이 두 배로 뛰었다. 아직 전 세계 개발자의 상당수가 AI 코딩을 본격적으로 경험하지 못했다고 하지만, 직간접적으로 경험해본 사람이라면 AI 코딩이 선택이 아닌 필수라는 것을 안다.

이 변화의 본질은 무엇인가. 개발자가 키보드로 한 줄 한 줄 코드를 타이핑하던 시대에서, 자연어로 의도를 전달하면 중앙의 거대한 연산 장치가 코드를 생성하는 시대로 넘어간 것이다. 이것은 메인프레임으로의 완전한 회귀다. 다만 메인프레임의 성능이 사람의 두뇌를 일정 부분 대체할 수 있을 만큼 거대해졌다는 점이 과거와 다를 뿐이다. 1960년대에도 메인프레임 프로젝트에 인원을 늘린다고 개발이 빨라지지 않는다는 것을 뼈저리게 경험했다. 60년이 지난 지금, 인원을 늘려야 빨라진다는 착각이 여전하지만, 이번에는 그 착각을 깨뜨리는 존재가 사람이 아니라 LLM이다. 역사는 반복되고, 무대만 바뀐다.

MM에서 토큰으로 — 개발 공수의 새로운 산정법

소프트웨어 개발의 비용을 산정하는 가장 오래된 방식은 MM(Man-Month)이다. 사람의 수에 시간을 곱하고, 그 사람의 등급에 따라 단가를 매긴다. 외주를 하든 사내 프로젝트를 하든, 20년 넘게 이 방식에 동의하지 않았지만 업계는 여전히 MM을 기준으로 돌아간다. 다른 산정법이 마땅히 없었기 때문이다.

MM의 근본적인 문제는 명확하다. 사람의 시간을 파는 것이지, 일의 결과를 파는 것이 아니다. 경력 10년차 개발자와 3년차 개발자의 MM 단가는 다르지만, 그 차이의 근거가 직무 시간의 누적이라는 점에서 이미 한계가 있다. 10년차가 반드시 3년차보다 나은 코드를 쓰는 것은 아니고, 프로젝트의 성패는 투입된 MM과 비례하지 않는다. 모두가 이것을 알면서도 다른 대안이 없었기에 관행으로 굳어진 것이다. 프로젝트 발주자는 원하는 성과를 기대하고, 수주자는 MM을 맞추려 한다. 이 두 가지는 본질적으로 공존할 수 없는 목표이지만, 수십 년간 공존하는 척 해왔다.

AI 코딩 시대에 MM은 더 이상 유효한 척도가 아니다. 2~3명의 개발자가 AI 코딩 도구를 활용하면, 10년 전 100명이 하던 일을 해낸다. 여기서 핵심 변수는 인원이 아니라 LLM을 얼마나 썼느냐이다. 즉, 토큰이다. 얼마나 많은 토큰을 입력하고 출력했느냐가 곧 일의 양이고 비용이다.

실제로 AI 코딩 도구의 과금 체계가 이미 이 방향으로 움직이고 있다. 2025년부터 2026년 사이에 GitHub Copilot, Cursor, Claude Code 등 주요 AI 코딩 도구들이 일제히 정액제에서 사용량 기반의 토큰 과금 체계로 전환했다. Cursor는 크레딧 기반 모델로 바꿨고, Anthropic의 Claude Code는 구독 플랜에 토큰 할당량을 내장했으며, API 직접 사용의 경우 토큰 단위로 정확하게 과금된다. 업계 전체가 정액제에서 소비량 기반 과금으로 이동하고 있다는 사실 자체가, 토큰이 곧 일의 단위라는 인식이 시장에서 자리 잡고 있음을 보여준다.

요즘 개발을 제대로 하는 사람들 사이에서는 대화가 달라졌다. “몇 MM 들었어요?”가 아니라 “몇 토큰 들었어요?”라고 묻는다. “대략 100억 토큰 들었고, 개발 기간은 4주였습니다.” 이런 대답이 나온다. 토큰 비용으로 환산하면 수백만 원에서 수천만 원 수준이다. 과거에 수십 명을 수개월 투입하며 수억 원을 쓰던 프로젝트가, 소수의 인원이 토큰을 소비하는 방식으로 자릿수가 바뀌고 있다. 기간은 여전히 중요하다. 하지만 기간 대비 코드를 뽑아내는 속도가 극적으로 빨라졌기 때문에, 토큰으로 묻는 것이 실질적인 비용 감각에 더 부합한다.

결국 핵심은 이렇다. MM이라는 낡은 척도를 토큰이라는 새로운 척도로 대체해야 한다. MM이 사람의 시간을 거래하는 단위였다면, 토큰은 연산의 양을 거래하는 단위다. 메인프레임 시대에 CPU 사용 시간으로 과금하던 것과 구조적으로 동일하다. 다시 한번, 과거의 메인프레임으로 돌아온 셈이다.

에이전트가 일하는 개발 현장

그런데 여기서 현실적인 문제가 발생한다. 토큰으로 비용을 산정해야 하는데, 고객은 여전히 과거의 인당 비용 기준으로 견적을 비교한다. 개발사 입장에서는 2~3명이 일하면서 토큰 비용을 청구하면 금액이 낮아 보이고, 그렇다고 과거처럼 인원을 부풀려 MM으로 높은 금액을 제시하면 실제 일하는 방식과 괴리가 생긴다. 이 딜레마를 해결하는 방법은 하나다. 극도의 자동화를 통해 토큰 비용 자체가 높은 가치를 증명하게 만드는 것이다. 적은 인원이 거대한 토큰을 소비하면서 과거 대규모 팀이 수개월 걸리던 결과물을 수주 만에 만들어내는 구조. 이 구조가 성립하려면 개발 프로세스 자체가 자동화의 파이프라인으로 설계되어야 한다.

이미 이런 방향의 시스템이 실제로 작동하고 있다. 직접 설계하고 운영 중인 구조인데, 자동 피드백 시스템이라고 이름 붙였다. 요즘 개발자 커뮤니티에서 화제인 Ralph Loop와 유사한 자동화 사상을 공유하지만, 루프를 시작하는 주체가 개발자가 아니라 최종 사용자라는 점에서 결이 다르다. 사용자가 앱 안에서 버그를 발견하거나 UI 개선점을 피드백으로 제출하면, 그 피드백이 자동으로 GitHub Issue로 등록된다. 여기까지는 기존에도 가능했다. 달라진 것은 그 다음이다. AI 코딩 에이전트가 주기적으로 이슈를 확인하고, 이슈를 분석하여 코드를 수정하고, 테스트를 실행한 뒤, PR(Pull Request)을 자동으로 생성한다. 개발자는 AI가 만든 PR을 리뷰하고 승인만 하면 된다. 피드백 제출에서 코드 수정, PR 생성, 배포 대기까지의 전 과정이 자동화되는 것이다. 사용자 입장에서는 “로그인 버튼이 안 눌려요”라고 피드백을 남겼더니, 몇 시간 뒤에 수정된 버전이 배포되는 경험을 하게 된다. 비개발자가 남긴 한 줄의 피드백이 코드 변경으로 이어지기까지, 사람의 손을 거의 거치지 않는다.

이 시스템이 중요한 이유는 단순히 편리해서가 아니다. 토큰 기반 비용 산정이 실질적으로 작동하려면, 토큰이 소비되는 과정 자체가 측정 가능하고 투명해야 한다. 자동 피드백 시스템은 이슈 하나를 처리하는 데 소비된 토큰의 양이 정확하게 기록된다. 15분마다 에이전트가 이슈를 확인하고, 코드를 분석하고, 수정안을 생성하고, 테스트를 돌리는 과정에서 소비된 토큰이 곧 그 이슈의 처리 비용이다. 이것이 바로 토큰이 MM을 대체하는 구체적인 메커니즘이다. 추상적인 “사람×시간”이 아니라, 실측 가능한 “연산의 양”으로 일의 비용을 산출하는 방식이다.

여기서 한 발 더 나아가면, 레거시 환경을 다루는 문제가 등장한다. 현실의 서비스는 단일 코드베이스가 아니다. iOS 앱, Android 앱, 프론트엔드 웹, 백엔드 서버가 각각의 기술 스택으로 구축되어 있고, 수년간 축적된 레거시 코드가 복잡하게 얽혀 있다. 하나의 AI 에이전트가 이 모든 것을 처리할 수는 없다. 각 레거시 환경에 맞춰 전문화된 에이전트가 필요하다. iOS 에이전트, Android 에이전트, 프론트엔드 에이전트, 백엔드 에이전트. 각각이 해당 기술 스택의 코드베이스를 이해하고, 해당 플랫폼의 빌드와 테스트 파이프라인에 맞춰 동작하는 독립적인 에이전트 구성이다. 사용자의 피드백이 들어오면 시스템이 이슈의 성격을 판단하여 적절한 에이전트에 할당하고, 해당 에이전트가 자율적으로 처리하는 구조다.

이런 에이전트 기반의 개발 체계가 자리 잡으면, 전체 개발 작업의 90% 이상은 에이전트가 자동으로 처리하게 된다. 가벼운 UI 수정, 반복적인 버그 픽스, 텍스트 변경, 레이아웃 조정, API 응답 포맷 수정 같은 작업은 에이전트의 영역이다. 인간이 직접 관여해야 하는 영역은 10%에서도 더 줄어든다. 아키텍처 수준의 설계 변경, 비즈니스 로직의 근본적 재설계, 그리고 무엇보다 고객과의 커뮤니케이션. 인간의 일은 코드를 짜는 것이 아니라, 사람과 대화하며 요구사항을 정리하고, 각 에이전트를 어떻게 조합할지 판단하며, 기존 시스템의 맥락 안에서 새로운 기능이 어떻게 들어맞을지를 설계하는 것이 된다. 에이전트를 구성하고 오케스트레이션하는 역할, 이것이 AI 시대 개발자의 본업이다. 자동 피드백 시스템과 같은 극도의 자동화 파이프라인이 뒷받침될 때, 토큰은 비로소 MM을 대체하는 실질적인 비용 단위가 된다. 인간의 기여는 기술료라는 별도 항목으로 책정하되, 개발의 실체적 비용은 토큰으로 명시하는 것이 맞다.

과거를 직시하는 것이 미래를 여는 방법이다

빈 체제가 나폴레옹이 만든 국민국가를 30년간 억눌렀듯, 기술의 세계에서도 새로운 패러다임은 과거의 관성과 충돌하며 자리 잡는다. PC 시대와 모바일 시대라는 이름표가 붙었던 지난 수십 년은, 실은 메인프레임이라는 본질적 구조 위에서 단말기의 형태만 바뀌어온 시간이었다. 그리고 지금, LLM이라는 거대한 연산 엔진의 등장으로 메인프레임의 본질이 더욱 선명하게 드러나고 있다.

세대의 공존이라는 렌즈로 보면 더 명확해진다. 60대 이상의 세계 지도자들이 냉전 시대의 세계관으로 21세기를 운전하듯, IT 업계에서도 PC 시대의 관성으로 AI 시대를 바라보는 시각이 여전하다. MM으로 개발 비용을 산정하고, 개발자 머릿수로 프로젝트 규모를 가늠하며, 로컬 환경의 성능을 따지는 관행들. 이것들은 PC 시대의 유산이지, AI 시대의 문법이 아니다.

신메인프레임 시대의 문법은 다르다. 중앙의 거대한 연산 장치가 코드를 생성하고, 검증하고, 운영까지 관여한다. 개발의 단위는 사람의 시간이 아니라 연산의 양, 즉 토큰이다. 단말기의 성능은 의미를 잃었고, 네트워크 연결이 유일한 변수가 됐다. 60년 전 IBM이 System/360으로 컴퓨팅의 판을 만들었을 때와 구조적으로 동일한 세상이 다시 펼쳐지고 있다.

역사를 통해 배울 수 있는 것이 있다면, 새로운 것의 대부분은 과거의 변주라는 사실이다. 국민국가는 왕정 이후에 등장했지만, 빈 체제에 의해 일시적으로 후퇴했다가 결국 세계의 표준이 됐다. 메인프레임은 PC에 의해 한때 가려졌지만, LLM과 함께 더 거대한 형태로 돌아왔다. 우리가 지금 목도하고 있는 AI 시대의 본질을 제대로 이해하려면, 미래만 바라볼 것이 아니라 과거의 구조를 직시해야 한다.

빈 체제가 30년 만에 무너졌을 때, 그것을 무너뜨린 것은 새로운 무기가 아니라 이미 존재했던 사상이었다. 신메인프레임 시대를 제대로 맞이하려는 사람에게 필요한 것도 새로운 기술의 습득이 아니다. 60년간 반복되어 온 구조를 읽는 눈이다. 그 눈이 있으면, 다음에 무엇이 올지도 보인다.

Language Detection

메인프레임에서 한 발짝도 벗어나지 못했다

개발의 방식은 정말 바뀌었는가

MM에서 토큰으로 — 개발 공수의 새로운 산정법

에이전트가 일하는 개발 현장

과거를 직시하는 것이 미래를 여는 방법이다