코딩 AI 전쟁: Opus 4.6 vs GPT-5.3 Codex

2026년 2월의 가장 뜨거운 이슈는 Anthropic과 OpenAI의 동시 모델 출시였다. 2월 5일, Anthropic은 Claude Opus 4.6을, OpenAI는 GPT-5.3 Codex를 같은 날 공개하며 코딩 AI의 정면 대결 구도를 만들었다. 두 회사가 같은 날을 택한 것은 우연이 아니라, AI 패권을 둘러싼 치열한 경쟁의 산물이다.

Opus 4.6은 100만 토큰 컨텍스트 윈도우를 최초로 지원하며 장기 에이전트 작업에서 진가를 발휘했다. Anthropic은 이 모델의 성능을 극적으로 시연하기 위해 에이전트 팀에게 C 컴파일러를 “클린룸” 환경에서 구축하도록 했고, 약 2주 만에 Linux 커널을 부팅할 수 있는 10만 줄의 코드를 생성해냈다. GCC 테스트 스위트에서 99% 통과율을 달성했다는 발표는 업계에 충격을 안겼다.

GPT-5.3 Codex는 벤치마크 점수와 토큰 효율성에서 앞섰다. 이전 버전 대비 토큰 사용량을 절반으로 줄이면서 속도는 40% 향상시켜, 같은 성능을 약 3배 빠르게 달성할 수 있게 됐다. NVIDIA GB200 하드웨어에 맞춰 아키텍처를 최적화한 점도 주목할 만했다.

이 모델 경쟁의 여파는 개발 현장에 즉각 반영됐다. Spotify는 “최고 개발자들이 12월 이후 코드 한 줄도 작성하지 않았다”고 발표했으며, 내부 AI 시스템 Honk을 통해 Slack에서 명령만으로 버그 수정과 기능 추가를 수행하고 있다고 밝혔다. GitHub 공개 커밋의 4%가 Claude Code에 의해 작성되고 있으며, 이 추세대로라면 2026년 말까지 일일 커밋의 20% 이상이 AI가 작성하게 될 전망이다.

한편 Anthropic은 소넷 4.6도 출시하며, 플래그십 모델의 5분의 1 비용으로 유사한 성능을 제공해 기업 도입의 문턱을 대폭 낮췄다. 에이전트 금융 분석에서 Opus 4.6을 능가하는 등 가성비 측면에서 파괴력을 입증했다.

AI 에이전트의 폭풍: OpenClaw 현상

2월의 또 다른 주인공은 AI 에이전트 플랫폼 OpenClaw(오픈클로)였다. 원래 Clawdbot이라는 이름으로 시작했으나 Anthropic의 상표 문제로 Moltbot을 거쳐 OpenClaw로 최종 확정된 이 오픈소스 프로젝트는, 출시 직후 150만 개 이상의 에이전트가 생성되며 폭발적인 성장을 기록했다.

OpenClaw의 개발자 피터 스타인버거는 실리콘밸리에서 “가장 귀한 몸”이 됐다. 샌프란시스코에서 열린 제1회 ClawCon에는 수백 명의 개발자가 모였고, 배우 애슈턴 커처까지 참석해 화제를 모았다. 결국 스타인버거는 OpenAI에 합류했으며, 샘 올트먼은 그를 “천재”라고 칭했다. OpenClaw는 재단 산하 오픈소스 프로젝트로 유지된다.

그러나 빛이 강하면 그림자도 짙은 법이다. 네이버, 카카오, 당근마켓 등 국내 주요 IT 기업들은 사내에서 OpenClaw 사용을 금지했다. AI 보안 기업 Zenity는 문서에 악성 명령을 삽입해 OpenClaw가 파일을 탈취·삭제할 수 있는 개념증명을 공개했고, CrowdStrike 같은 글로벌 보안 기업들은 기업 네트워크 내 무단 설치된 OpenClaw를 탐지하는 전용 제거 팩까지 출시했다. 역설적으로, 이는 OpenClaw가 이미 기업 현장에 얼마나 깊이 침투했는지를 보여주는 증거이기도 했다.

SaaS 대학살과 AI 공포의 확산

Anthropic이 1월 말 Claude Cowork에 11개 오픈소스 플러그인을 출시하면서 촉발된 ‘SaaSpocalypse’는 2월 내내 시장을 흔들었다. 법률 워크플로우 자동화 플러그인 하나가 Thomson Reuters(-15%), LexisNexis 모회사 RELX(-14%), LegalZoom(-20%) 등의 주가를 폭락시켰고, 하루 만에 소프트웨어 주식에서 2,850억 달러가 증발했다.

공포는 연쇄적으로 번졌다. 2월 중순에는 AI 기업 Algorhythm Holdings가 직원 추가 고용 없이 화물량을 300~400% 확대할 수 있는 도구를 출시하자 물류주가 급락했고, 일론 머스크가 “AI가 근로자를 대체하면 사무실 빌딩이 곧 비게 될 것”이라고 발언하자 부동산주까지 하락했다. 보험 중개주, 자산관리주도 차례로 타격을 받았다.

2월 말에는 Anthropic이 Claude Code Security를 공개하며 사이버보안 업계에도 충격파를 보냈다. AI가 코드베이스를 스캔해 취약점을 찾고 패치까지 제안하는 이 도구의 출시로 CrowdStrike(-8%), Okta(-9%), Cloudflare(-7%) 등 보안주가 일제히 하락했다.

소규모 리서치 기업 시트리니의 “AI 종말 시나리오” 보고서는 서브스택 글 하나로 S&P 500을 1% 이상 끌어내리는 위력을 보여줬다. 이 보고서는 2028년까지 미국 실업률 10% 돌파, “Occupy Silicon Valley” 운동까지를 시나리오로 그렸는데, 시장 분석가조차 “전쟁, 인플레이션, 은행 위기를 어깨를 으쓱하며 넘긴 시장이 서브스택 사설 하나에 흔들린다”며 놀라움을 표했다.

AI 안전과 군사 활용의 격전

AI의 군사적 활용을 둘러싼 갈등이 전면에 드러났다. 월스트리트저널은 미군의 베네수엘라 마두로 체포 작전에 Claude가 Palantir를 통해 사용되었다고 보도했다. 이 작전은 카라카스 전역에 걸친 폭격을 포함했으며, 베네수엘라 측 발표에 따르면 83명이 사망했다.

미 국방부는 Anthropic에 “모든 합법적 목적”에 AI를 사용할 수 있도록 제한 해제를 요구했지만, Anthropic은 완전 자율 무기와 대규모 국내 감시에 대한 가드레일 유지를 고집했다. 펜타곤은 Anthropic CEO 다리오 아모데이를 워싱턴에 소환하는 한편, xAI 및 Google과의 계약을 지렛대로 활용해 압박했다. 국방장관 피트 헤그세스는 “전쟁을 수행할 수 없게 만드는 AI 모델은 사용하지 않겠다”고 공개적으로 선언했다.

내부에서도 균열이 드러났다. OpenAI 전 연구원 조이 히치그는 뉴욕타임스 기고를 통해 ChatGPT 내 광고 도입이 소셜미디어의 실수를 반복할 위험이 있다고 경고하며 사임했다. Anthropic의 세이프가드 연구 책임자 므리낭크 샤르마도 “세계가 위험에 처해 있다”는 공개 서한과 함께 사임했다. AI 안전 연구의 최전선에 있던 인물들이 잇따라 떠나면서, 상업적 압력과 안전 사이의 긴장이 한계에 달했음을 보여주었다.

대조적으로 Anthropic은 “Claude는 생각하는 공간이다”라는 제목의 블로그 글을 통해 광고를 영원히 배제하겠다고 선언했다. OpenAI가 ChatGPT에 광고 테스트를 시작한 것과 정면으로 대비되는 행보로, 슈퍼볼 광고를 통해서도 이 입장을 강조했다.

개발 생태계의 지각변동

AI가 개발자의 역할을 근본적으로 바꾸고 있다는 신호가 곳곳에서 포착됐다. Andrej Karpathy는 “AI로 인해 프로그래밍이 극적으로 변화했다”며, 특히 12월을 기점으로 코딩 에이전트의 성능이 급격히 향상됐다고 밝혔다. 그는 1시간 만에 유산소 운동 추적 대시보드를 완성한 경험을 공유하며, “앱스토어에서 개별 앱을 고르는 개념 자체가 구식이 되고 있다”고 선언했다.

그러나 생산성의 역설도 드러났다. 파로스 AI 조사에 따르면 AI를 적극 활용하는 팀은 PR 수가 98% 증가했지만, 코드 리뷰 시간도 90% 이상 증가했다. 개발의 병목이 “코드 작성”에서 “코드 이해와 검증”으로 이동한 것이다. ‘이해 부채(Comprehension Debt)’라는 새로운 개념이 등장했는데, 이는 개발자가 AI 생성 코드를 충분히 이해하지 못한 채 넘어가면서 누적되는 구조적 위험을 의미한다.

Steve Yegge는 더 급진적인 전망을 내놓았다. 그는 모든 회사에 엔지니어 감원 다이얼이 있으며 현재 약 50%로 설정되고 있다고 주장했다. 동시에 AI 증강 작업의 소모적 특성 때문에 하루 3시간 이상의 생산적 작업을 기대해서는 안 된다는 ‘드라큘라 효과’를 제시했다.

Anthropic 엔지니어 Boris Cherny는 “소프트웨어 엔지니어”라는 직함이 2026년부터 사라지기 시작할 수 있다고 언급하며, 역할이 코드 작성에서 아키텍처 설계, 결과 검증, 시스템 감독으로 이동하고 있다고 설명했다.

중국 AI의 약진과 글로벌 경쟁

중국 AI 기업들의 공세도 거셌다. DeepSeek은 컨텍스트 윈도우를 128K에서 100만 토큰 이상으로 10배 확장했고, Zhipu AI는 차세대 모델 GLM-5를 공개하며 홍콩 주가가 30% 급등했다. ByteDance의 Seedance 2.0은 영상 생성 AI의 수준을 한 단계 끌어올렸으나, 할리우드로부터 “노골적인 저작권 침해 도구”라는 거센 비판을 받았다. 디즈니, 파라마운트 등이 중단 요청서를 보냈고, Netflix는 소송을 경고했다.

Anthropic은 중국 AI 기업 DeepSeek, Moonshot AI, MiniMax가 Claude로부터 정보를 추출하기 위한 “산업 규모” 증류 공격을 벌였다고 고발했다. 세 기업이 합산 약 24,000개의 부정 계정에서 1,600만 건 이상의 교환을 생성했다는 주장이었다. 이 문제는 단순한 기업 분쟁을 넘어 국가 안보 담론으로까지 확대됐다.

AI 투자와 기업 동향

거대 자본의 흐름도 가속화됐다. Anthropic은 200억 달러(약 28조 원) 초대형 투자 유치를 마무리하며 기업가치 3,500억 달러(약 512조 원)를 달성했다. NVIDIA, Microsoft 등 전략적 투자자가 참여했으며, 연간 반복 매출은 90억 달러를 넘어섰다.

SpaceX는 xAI를 1조 2,500억 달러 규모로 인수하며 사상 최대 M&A 기록을 세웠다. 머스크의 AI와 우주 개발 야망이 하나로 통합된 이 거래는, 합병 후 암호화폐 전문가를 대거 영입하며 금융·블록체인 분야로의 확장도 예고했다.

아마존은 AI 인프라에 2,000억 달러 투자를 발표했고, 구글은 로보틱스 분야에 대규모 투자를 단행하며 오스틴을 혁신 허브로 육성하고 있다. 한국에서는 업스테이지가 다음 포털을 인수하며 AI 수익화 전략의 새로운 모델을 제시했다.

노동 시장과 사회적 파장

국내 생성형 AI 서비스 결제액이 월 845억 원을 돌파하며 넷플릭스 구독료 규모를 넘어섰다. 20~30대가 AI 구독에 가장 적극적이며, “AI 잘 다루면 월급 더 받는다”는 인식이 채용 시장에 반영되고 있다.

METR(Model Evaluation and Threat Research)의 분석에 따르면 AI는 약 7개월마다 2배씩 성능이 향상되고 있으며, 이 추세가 가속화되고 있다. DeepMind의 데미스 하사비스는 AI가 산업혁명의 10배 영향을 10분의 1 기간 안에 가져올 것이라고 전망했다.

가디언은 ‘Reworked’ 시리즈를 통해 AI가 블루칼라와 화이트칼라의 경계를 허물고, 새로운 노동자 운동의 촉매가 될 수 있다고 보도했다. 포드 재단의 사리타 굽타는 “실리콘밸리 소프트웨어 엔지니어가 자신의 성과가 창고 작업자와 같은 논리로 추적된다는 것을 깨달을 때, 더 큰 노동자 계급 운동이 가능해진다”고 말했다.

88개국이 참여한 뉴델리 AI 임팩트 서밋에서는 AI 혜택의 공평한 분배와 책임 있는 개발을 위한 선언이 채택됐다. 미국, 중국, 러시아를 포함한 주요국이 모두 서명했다는 점에서, 지정학적 경쟁 속에서도 AI 거버넌스에 대한 국제적 합의의 필요성이 인정되고 있음을 보여주었다.

맺으며

2026년 2월은 AI가 “기술의 가능성”에서 “산업의 현실”로 완전히 전환된 달이었다. 코딩 에이전트는 GitHub 커밋의 의미 있는 비중을 차지하기 시작했고, AI 도구 하나의 출시가 수천억 달러의 시가총액을 증발시키는 위력을 보여주었다. AI 안전 연구자들의 연쇄 사임과 군사 활용 논란은 기술 발전의 속도가 윤리적·제도적 논의를 앞지르고 있음을 경고한다.

Karpathy의 말처럼 “현재 소프트웨어 개발은 평상시와는 거리가 멀다.” 그리고 이 비평상의 상태는 소프트웨어 개발을 넘어, 산업 전반과 노동 시장, 국제 관계에까지 퍼져나가고 있다. 우리는 지금, AI가 만들어가는 새로운 세계의 초입에 서 있다.