2026년 4월 AI 동향 리포트

앤트로픽 Mythos 유출과 Opus 4.7: 사이버보안 모델의 등장
4월의 서막은 앤트로픽의 거대한 보안 사고로 열렸다. CMS 설정 오류로 약 3,000개의 내부 문서가 외부 데이터 캐시에 노출되면서, 차세대 모델군 Capybara 등급의 존재와 그 안의 플래그십 모델 Claude Mythos가 본의 아니게 세상에 공개됐다. 유출된 블로그 초안은 Mythos가 “전례 없는 사이버보안 위험을 초래한다”고 적나라하게 기술하고 있었고, 회사가 이를 “단계적 도약(step change)”이라 인정하면서 사태는 단순 사고에서 산업적 사건으로 번졌다.
Mythos는 처음부터 일반 출시를 염두에 두지 않은 모델이었다. 앤트로픽은 이 모델을 Project Glasswing이라는 이름의 사이버보안 프로그램으로 묶어, 엔비디아·JP모건체이스·구글·애플·마이크로소프트 등 약 40여 조직, 그중 공식 공개된 12곳에만 비공개 제공했다. 4월 중순에는 백악관도 Mythos 접근을 준비 중이라는 보도가 흘러나왔고, 21일에는 미 국가안보국(NSA)이 국방부의 ‘공급망 위험’ 지정을 무시하고 이미 Mythos를 자체 환경 취약점 스캔에 활용 중이라는 사실이 악시오스를 통해 드러났다. 사이버보안의 무게가 워싱턴-앤트로픽 간 정치 분쟁보다 더 무겁다는 신호였다.
같은 달 18일, 앤트로픽은 일반 출시용 Claude Opus 4.7을 공개했다. 시스템 카드에서 회사는 “Claude Mythos Preview가 모든 관련 평가에서 더 높은 점수를 받았기 때문에” Opus 4.7이 자사의 “역량 프론티어”를 진전시키지조차 않는다고 솔직히 적었다. 대신 4.7은 Opus 4.6 대비 고급 소프트웨어 엔지니어링에서 의미 있는 도약을 보여줬다. Cursor의 CursorBench는 58%에서 70%로, XBOW 시각 정확도는 54.5%에서 98.5%로, Rakuten-SWE-Bench는 3배의 프로덕션 작업 해결, Notion에서는 +14% 성능 향상에 도구 오류는 1/3로 감소했다. 비전은 장변 최대 2,576px(약 375만 화소)로 3배 이상 향상됐고, 가격은 Opus 4.6과 동일하게 입력 100만 토큰당 $5, 출력 $25를 유지했다.
흥미로운 점은 Opus 4.7이 사이버 역량을 “의도적으로 차별적으로 낮추는” 훈련을 거쳤다는 점이다. 합법적 보안 연구자를 위한 Cyber Verification Program도 함께 출시되어, 인증된 레드팀·취약점 연구자에게는 일부 안전장치가 완화된다. Mythos급 모델 출시를 위한 단계적 학습장이라는 의미다.
그러나 Opus 4.7의 환영 분위기는 오래가지 못했다. 해커뉴스에서는 곧바로 두 가지 불만이 터져나왔다. 첫째, 4.7은 API 사용자도 끌 수 없는 강제 적응형 사고(adaptive thinking)를 내장했고, CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 플래그도 무시된다. 둘째, max effort 설정에서도 토큰을 10분간 태우다가 손 흔들고 넘어가는(“handwaving”) 답변, 끊임없는 자기수정 루프 같은 신뢰성 문제가 보고됐다. 비용 측면에서는 추론 토큰이 거의 절반으로 줄어 총비용은 오히려 내려갔지만, “더 싸지만 더 제멋대로”라는 평가가 굳어졌다.
논란은 23일 앤트로픽의 공식 사과로 일단락됐다. 회사는 최근의 클로드 성능 저하가 모델이 아니라 ‘하네스(harness)’, 즉 제품 레이어 변경에서 비롯됐다고 인정했다. 세 가지 원인이 지목됐다. 3월 4일 UI 지연 해소를 위해 기본 추론 강도를 ‘높음’에서 ‘중간’으로 낮춘 것, 3월 26일 캐싱 최적화 과정에서 사고 기록(thinking history)이 매 요청마다 삭제되던 버그, 4월 16일 도입된 응답 길이 제한 정책(도구 호출 사이 25단어, 최종 응답 100단어). 모두 원상 복구되었고 모든 유료 사용자의 사용 한도가 초기화됐다. 앤트로픽은 도그푸딩 확대, 변경 추적 도구 개선, X·깃허브를 통한 투명한 의사결정 공개를 약속했다. “성능을 의도적으로 낮춘 적은 없다”는 강한 부인과 함께였다.
구글의 400억 달러 베팅: AI 빅3 시대의 종말
4월 후반, 산업 지형을 가장 크게 흔든 사건은 단연 구글의 거대한 베팅이었다. 구글이 직접 경쟁사인 앤트로픽에 최대 400억 달러를 투자한다고 발표한 것이다. 100억 달러는 앤트로픽의 3,800억 달러 가치평가 기준으로 즉시 송금되며, 나머지 300억은 마일스톤 연동이다. 더 놀라운 것은 컴퓨팅 약속이었다. 구글 클라우드는 2027년부터 5년간 5GW 규모 TPU 컴퓨팅을 앤트로픽에 공급한다.
이는 구글이 라이벌을 구매하는, AI 시대 가장 대담한 헤지였다. 실리콘밸리 4대 거인 — 아마존(현금 50억+최대 250억+5GW 트레이니엄), 구글(100억+최대 400억+5GW TPU), 엔비디아(최대 100억+1GW GPU), 마이크로소프트(최대 50억+Azure 300억 컴퓨팅 구매) — 모두가 앤트로픽 주주 명단에 올랐다. 누적 11GW 이상의 컴퓨팅 약속, 원전 10기에 해당하는 규모다. OpenAI의 스타게이트 10GW 목표를 단 한 주 만에 따라잡은 셈이다.
가장 극적인 장면은 마이크로소프트다. OpenAI의 최대 외부 주주가 OpenAI의 최대 라이벌에 동시 투자하는 극단적 헤지다. AI ‘빅3’ 개념은 무너지고, “앤트로픽 진영 vs OpenAI”의 양강 구도로 재편됐다. 구글 클라우드 CEO 토마스 쿠리안은 파이낸셜 타임스 인터뷰에서 “우리는 단순히 다른 회사의 기술을 재판매하는 하이퍼스케일러가 아니다. 매출 1달러당 80%를 모델·칩 공급업체에 낭비하지 않기 때문에 더 많은 투자를 할 수 있다”고 자신감을 드러냈다.
같은 시기 비영리 연구단체 Epoch AI는 충격적인 보고서를 내놨다. 구글이 마이크로소프트를 제치고 세계 AI 컴퓨팅 1위에 올랐다는 것이다. 2025년 4분기 기준 H100 환산: 구글 5.2M(TPU 3.9M + 엔비디아 1.3M), MS 3.6M, 메타 2.1M, 아마존 1.8M. TPU가 자체 칩으로서 엔비디아 칩의 3배를 운영하고 있고, 상위 10개 AI 기업 중 9곳이 TPU를 사용한다는 게 쿠리안의 자랑이었다. OpenAI만이 MS와의 독점 계약 때문에 TPU에서 배제된 상태다.
구글의 행보는 거기서 끝나지 않았다. 22일 구글 클라우드 Next에서는 Gemini Enterprise Agent Platform의 신기능 — Memory Bank, Memory Profile, Agent Simulation — 을 발표하며 코딩 에이전트 시장에서 앤트로픽 Claude Code와 OpenAI Codex가 차지한 자리에 도전장을 냈다. AI 에이전트 전용 인박스, Gemini Enterprise 앱(앤트로픽 Cowork 대응), Projects 협업 플랫폼, 사이버보안 에이전트, 추론 전용 신세대 맞춤형 칩까지 풀패키지였다.
28일에는 펜타곤 변수가 더해졌다. 구글이 앤트로픽이 거부한 조건 그대로 미 국방부에 Gemini 기밀 환경 접근권을 부여한 것이다. 앤트로픽이 국내 대규모 감시·자율 무기 사용 가드레일을 요구하며 거부하자 ‘공급망 위험’으로 지정된 그 자리를, OpenAI·xAI에 이어 구글이 세 번째로 차지했다. 구글 직원 950명이 공개서한을 통해 반대했지만, 회사는 코멘트를 거부했다. AI 산업의 가치 경쟁이 결국 정부 매출 앞에서 어떻게 굴절되는지 보여준 사건이었다.
오픈소스의 거대한 반격: 딥시크 V4·Qwen3.6·Kimi K2.6
폐쇄형 진영의 정치극이 한창이던 사이, 오픈소스 진영은 묵묵히 칼을 갈고 있었다. 4월은 중국발 오픈소스 공세의 정점을 찍은 달이었다.
가장 주목받은 것은 딥시크 V4였다. 24일 허깅페이스를 통해 미리보기로 공개된 V4 시리즈는 두 모델로 구성됐다. 1.6T 파라미터의 V4-Pro(활성 49B), 284B의 V4-Flash(활성 12B). 둘 다 사고-비사고 혼합형이며 컨텍스트 100만 토큰을 지원한다. 압축 희소 어텐션(CSA)과 고효율 압축 어텐션(HCA)을 결합한 하이브리드 어텐션, 1월에 화제가 된 매니폴드 제약 하이퍼 연결(mHC), Muon 옵티마이저, 32조 토큰 사전학습, 온폴리시 증류 — 모든 효율 기술이 총동원됐다. 100만 토큰 컨텍스트에서 단일 토큰 추론 FLOPs가 V3.2의 27%, KV 캐시는 10%만 필요할 만큼 효율적이다.
성능은 입체적이었다. LiveCodeBench 93.5%, Codeforce 3206점, APEX 숏리스트 90.2%로 일부 분야 1위였지만, SWE-Verified 80.6%는 같은 주 출시된 Opus 4.7의 87.6%에 크게 못 미쳤다. GDPval에서는 오픈소스 1위지만 폐쇄형 포함 6위. 가격은 V4 Pro $1.74/$3.48(이전 대비 6배 인상), V4 Flash $0.14/$0.28로 여전히 Opus 4.7의 10~20% 수준. 화웨이 어센드 슈퍼노드 전체 지원이 발표되며, 미국 칩 의존도를 줄이는 ‘AI 자립’의 상징으로 자리잡았다. 딥시크는 엔비디아 칩 사용을 인정했지만 ‘H200’ 여부는 함구했고, OpenAI의 합성 데이터 활용 의혹도 부인했다.
알리바바 Qwen은 두 갈래로 진격했다. 4월 18일 공개된 Qwen3.6-35B-A3B는 오픈웨이트 라인의 첫 작품이다. 350억 파라미터 중 30억 활성, 10×(3×(Gated DeltaNet → MoE) → 1×(Gated Attention → MoE)) 구조, 256개 전문가, 기본 262K·최대 1.01M 컨텍스트. Terminal-Bench 2.0에서 40.5→51.5, QwenWebBench 978→1397(+43%) 등 코딩 에이전트 성능에서 두드러진 향상을 보였다. 추론 컨텍스트를 다음 턴에 보존하는 ‘사고 보존(Thinking Preservation)’ 기능이 핵심이다. 며칠 후인 22일에는 자체 비공개 플래그십 Qwen3.6-Max-Preview가 공개됐다. SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode 등 6개 주요 코딩 벤치마크에서 1위를 기록했다고 주장하며, OpenAI/Anthropic API 모두 호환되는 API와 preserve_thinking 기능을 강조했다.
오픈소스 코딩의 또 다른 강자 Kimi K2.6 (Moonshot AI)도 만만치 않았다. K2.6의 가장 인상적인 사례는 두 가지였다. 8년 된 오픈소스 금융 매칭 엔진 ‘exchange-core’를 13시간 자율 실행, 1,000+ 도구 호출, 4,000+ 라인 수정으로 처리량 185% 향상시킨 사례. Mac에서 Qwen3.5-0.8B를 Zig로 로컬 추론 구현해 처리량을 ~15에서 ~193 tokens/sec로 끌어올린 사례. 장기 실행 코딩(long-horizon execution)과 에이전트 스웜의 진화가 핵심이었다. K2.5의 100→300 sub-agents, 1,500→4,000 조정 단계로 확장됐고, Skills라는 기능을 통해 PDF·스프레드시트·슬라이드의 구조와 스타일 DNA를 보존해 향후 작업에서 동일 품질을 재현한다. RL 인프라 팀이 K2.6 에이전트를 5일 자율 운영하는 검증 결과까지 더해, 폐쇄형과의 격차는 더 좁아졌다.
구글도 오픈 모델 진영에 답을 보냈다. Gemma 4가 Apache 2.0 라이선스로 출시됐고, Unsloth 팀의 GGUF 최적화로 맥북에서도 OCR·임베딩·번역 파이프라인을 로컬 자체 호스팅으로 돌릴 수 있게 됐다. 출시 이후 Gemma 시리즈 누적 4억 회 다운로드, 10만 개 이상의 커뮤니티 변형 모델이라는 숫자가 함께 발표됐다.
메모리 시장 충격: 구글 TurboQuant의 ‘딥시크 모먼트’
4월 초의 또 다른 폭탄은 구글의 TurboQuant였다. ICLR 2026에서 공개된 이 알고리즘은 PolarQuant 벡터 회전과 양자화된 Johnson-Lindenstrauss 압축을 결합한 2단계 프로세스로 KV 캐시 메모리를 6분의 1로 줄인다. 모델 정확도 손실 없이. 한인수 KAIST 교수도 참여한 이 논문은 발표되자마자 시장을 뒤집었다.
3월 27일 장 마감 이후 마이크론 시총 700억 달러 증발(-15%), 샌디스크는 한 주 동안 150억 달러 손실, 웨스턴 디지털·시게이트도 수십억 달러 손실. 미국 메모리 칩 관련 주식 시총 합계 약 1,000억 달러(151조원)가 며칠 새 사라졌다. 삼성전자·SK하이닉스도 단기 충격을 받았다. 모건 스탠리는 “쿼리 처리 비용이 크게 줄어 AI 배포 수익성이 높아진다”고 분석했고, 클라우드플레어 CEO 매튜 프린스는 이를 “구글의 딥시크 순간”이라 명명했다.
물론 ‘제번스의 역설’을 지적하는 회의론도 강했다. 효율이 높아지면 장기적으로는 AI 인프라 수요가 더 커진다는 것. 작년 딥시크 충격 때 사상 최대 폭락을 기록했던 엔비디아도 결국 원상복구됐다는 학습이 시장에 남아있었다. 그러나 AI 인프라 투자에서 메모리가 차지할 비중이 영원히 우상향이라는 가정에 처음으로 균열이 갔다는 점은 부인할 수 없는 변화였다.
비슷한 시기 구글 딥마인드는 학습 인프라 자체를 재편할 또 다른 논문을 공개했다. Decoupled DiLoCo (Distributed Low-Communication)는 동기화된 거대 데이터센터에 묶여 있던 LLM 학습을 비동기·분산식 ‘섬(island)’ 구조로 풀어냈다. 데이터센터 간 필요 대역폭이 198Gbps에서 0.84Gbps로 — 일반 인터넷 수준 — 으로 줄었고, 카오스 엔지니어링 실험에서 일부 장비 중단에도 학습이 멈추지 않는 자가 치유 특성을 보였다. 120만 칩 시뮬레이션에서 유효 학습 시간 비율(goodput)은 27%에서 88%로 상승. 미국 4개 지역에 분산된 이종 데이터센터로 120억 파라미터 모델을 기존 대비 20배 빠르게 학습하는 데도 성공했다. 흩어진 GPU/TPU를 하나로 묶는 시대, 구글이 또 한 번 패러다임 전환을 주도한 셈이다.
에이전트의 시대: 거래·유지보수·창작까지
3월에 OpenClaw의 글로벌 확산을 다뤘다면, 4월은 에이전트가 실제 경제 행위로 진입한 달이었다. 앤트로픽이 24일 공개한 Project Deal 파일럿 결과는 충격적이었다. 샌프란시스코 사무실 직원 69명에게 1인당 100달러 예산을 주고, 슬랙 시장에서 클로드 에이전트들이 인간 개입 없이 자율 협상하게 했다. 결과는 186건의 거래, 총 4,000달러 이상의 거래액. 스노보드·책·자전거 같은 물건뿐 아니라 반려견 산책 같은 경험 상품까지 성사됐다. 강아지를 다른 사람에게 맡기는 고난도 신뢰 임무에서, AI는 “우리 강아지는 모험을 좋아한다”는 식의 꾸며낸 세부사항으로 역할극을 수행하며 인간을 설득했고, 실제 인간들이 오프라인에서 만나 약속을 이행했다.
흥미로운 발견은 별도 영역에 있었다. AI 모델 성능 차이가 거래 결과를 좌우했다. 클로드 4.5 Opus는 Haiku 대비 명확한 협상 우위를 보였고, 동일 물건을 더 비싸게 팔거나 더 싸게 샀다. 더 무서운 것은 불리한 거래를 한 참가자조차 손해를 인지하지 못하고 거래가 공정했다고 평가했다는 점이다. “공격적으로 협상하라” 같은 인간의 프롬프트는 별 영향이 없었고, 결정 변수는 모델 자체의 지능이었다. 앤트로픽의 결론은 명료했다: “미래 에이전트 경제에서 가장 중요한 화폐는 AI의 지능이 아니라, 그 지능이 인간의 이익을 보호하도록 만드는 안전과 신뢰가 될 것.”
오픈소스 유지보수 전선에서도 새로운 이정표가 세워졌다. 4월 25일 오픈클로(OpenClaw) 개발자 피터 슈타인베르거가 공개한 클로스위퍼(ClawSweeper)는 약 50개의 코덱스를 병렬 가동해 이슈와 PR을 자동 정리하는 시스템이다. 공개 후 하루 만에 4,000건의 이슈를 정리했고, 1만 건 이상이 추적·검토되고 있다. 단순 분류가 아니라 증거 기반 마크다운 기록(문제 상태, 근거, 위험, 신뢰도, 제안 조치)을 만들어 깃허브 README에 실시간 공개하는 투명성, 한 번의 판단으로 종료하지 않고 저장소 변화에 따라 재검토하는 지속 루프가 핵심이다. AI가 코드 작성을 넘어 오픈소스 유지보수 노동까지 흡수하는 단계로 들어선 것이다.
같은 흐름에서, 앤트로픽은 30일 Claude Connector를 출시했다. 어도비 크리에이티브 클라우드, 블렌더, 오토데스크 퓨전, 에이블톤 라이브, 스플라이스, 스케치업, 레졸룸 등 창작 도구와 클로드를 MCP 기반으로 직접 연결한다. 자연어로 블렌더 3D 장면을 분석하고 스크립트를 생성하거나, 에이블톤 라이브에서 공식 문서 기반 정확한 가이드를 받거나, 스플라이스 음원 샘플을 클로드 안에서 직접 검색할 수 있다. 블렌더용 커넥터는 오픈소스로 공개되어 다른 모델도 활용할 수 있고, 앤트로픽은 블렌더 개발 펀드에 참여했다. 로드아일랜드 디자인 스쿨, 골드스미스 런던 등과의 커리큘럼 협력까지 — 창작 파트너로서의 AI가 본격 무대에 올랐다.
또 다른 한편에서는 멀티 에이전트 오케스트레이션의 한계를 정직하게 짚는 글도 화제가 됐다. Paperclip, Gastown, Claude Code Agent Teams처럼 “에이전트들을 조직처럼 굴리자”는 흐름에 5,000달러를 직접 태워본 한 개발자의 분석은 명확했다. 토큰 비용이 단일 에이전트 대비 5~10배 들지만 생산성은 비례하지 않고, 맥락 손실·인수인계 단절·잘못된 결과를 ‘완료’로 처리하는 문제가 반복된다는 것. “도시”나 “회사” 메타포가 잘 안 먹히는 구조적 이유가 산업 전체의 숙제로 남았다.
엔비디아도 가만있지 않았다. 30일 공개된 네모트론 3 나노 옴니(Nemotron 3 Nano Omni)는 텍스트·영상·음성·이미지를 단일 모델로 처리하는 통합형 멀티모달 모델이다. 30B-A3B(활성 3B) 하이브리드 MoE, Mamba+Transformer 결합으로 메모리·연산 효율 최대 4배 개선, Conv3D + Efficient Video Sampling, Parakeet v2 오디오 인코더. 영상 추론 9.2배, 다중 문서 추론 7.4배의 시스템 처리량을 기록했다. 호퍼·블랙웰 GPU에서 FP8/NVFP4 양자화 최적화, 허깅페이스 가중치 공개. 분리된 모델 체인을 통합한 에이전트 인지-행동 루프의 새로운 표준 후보다.
OpenAI의 균열: 9억 사용자, 5%만 유료
화려한 헤드라인 너머에서 OpenAI는 점점 짙은 그림자를 드리우고 있었다. WSJ에 따르면 OpenAI는 2026년 1분기 내부 매출 목표 미달, 그 직전에는 ChatGPT 사용자 성장 목표도 미달이었다. 2025년 말까지 주간 활성 사용자 10억 명 목표는 도달하지 못했고, 그 자리를 구글 Gemini와 앤트로픽이 잠식했다.
European Business Magazine의 분석은 더 잔인했다. ChatGPT 9억 사용자 중 유료는 5.5%뿐, 나머지 94.5%는 무료로 컴퓨팅 비용을 OpenAI가 부담한다. 2026년 예상 손실 140억 달러, 2023~2028년 누적 손실 440억 달러. OpenAI 엔터프라이즈 AI 지출 점유율은 50%→27%로 하락한 반면 앤트로픽은 40%까지 상승, Fortune 10 중 8곳이 앤트로픽 유료 고객이다. Claude Code는 10개월 만에 ARR $0→25억으로 성장하며 코드 생성 시장에서 42~54% 점유율을 가져갔고, OpenAI 엔지니어가 앤트로픽으로 이직할 확률이 그 반대보다 8배 높다. 핵심 차이를 이 매거진은 이렇게 정리했다: “OpenAI는 소비자 기업이 엔터프라이즈 제품을 만들고 있고, 앤트로픽은 엔터프라이즈 기업이 소비자 제품을 가지고 있다.”
내부 갈등도 부상했다. 사라 프라이어 CFO는 컴퓨팅 계약 이행 가능성에 우려를 제기했고, 이사회는 알트먼의 컴퓨팅 용량 확보 전략에 의문을 표했다. 알트먼은 IPO 가속을 원하지만 프라이어는 2026년 내 상장사 보고 대응이 어렵다고 판단한다는 보도가 흘러나왔다. 알트먼의 부관 피지 시모는 IPO를 앞두고 예기치 못한 의료 휴직에 들어갔다. 머스크 대 알트먼 소송도 28일 본격 재판에 돌입했다. 머스크는 26개 주장 중 ‘부당이득’과 ‘자선 신탁 위반’으로 압축, 최대 1,340억 달러(약 197조원) 이익 반환과 알트먼·브록먼 퇴진, 영리 구조 재편 철회를 요구한다. 법률 전문가들의 머스크 승소 가능성 평가는 약 40%. 양측 합산 기업가치 2조 달러의 상징적 분쟁이 이제 막 시작됐다.
긍정 신호도 있었다. 1,220억 달러 펀딩 라운드 마감(실리콘밸리 역사상 최대), Codex 추진력 확보, GPT-5.5 일부 벤치마크 1위. SpaceX의 IPO 신청 보도가 같은 시기에 나오면서 머스크 진영의 자금 조달도 본격화됐다. 한편 Sora는 종료됐다. 하루 1,500만 달러 소진, 총수익 210만 달러, 전체 추론 비용의 1/3 이상을 차지하던 GPU 부담이 결국 한계를 드러낸 것이다. 알트먼은 “비용 구조가 지속 불가능했다”고 인정했다. Sora 책임자 Bill Peebles와 AI for Science 부사장이 4월 17일 동시 퇴사하면서 영상 AI 전선의 후퇴가 굳어졌다.
사이버보안의 새 전선: AI가 AI를 잡는 시대
3월에 다뤘던 SentinelOne의 사례가 4월 초 상세히 공개되면서, AI 시대 보안의 새로운 전선이 명확해졌다. 3월 24일 SentinelOne의 자율 탐지 시스템은 Trivy 침해를 통해 LiteLLM 관리자의 PyPI 자격증명이 탈취되어 배포된 트로이 목마 버전 1.82.7과 1.82.8을 식별했다. 보안 도구가 AI 인프라 패키지 침해의 벡터가 된 것이다. 더 충격적인 것은 한 고객 환경에서의 감염 경로였다. 무제한 시스템 권한으로 실행 중인 AI 코딩 어시스턴트(claude --dangerously-skip-permissions)가 인간 검토 없이 자율적으로 LiteLLM을 트로이 목마 버전으로 업데이트한 것. SentinelOne은 이 행동을 MALICIOUS로 분류해 424개 관련 이벤트를 44초 이내에 KILLED 처리했다.
페이로드는 다단계 — base64 부트스트랩 → 데이터 탈취(암호화폐 지갑, 클라우드 자격증명, 시스템 비밀) → systemd 지속성(sysmon.service로 위장, 50분마다 C2 연결) — 으로 구성됐고, kube-system 네임스페이스의 권한 Pod로 Kubernetes 횡이동까지 시도했다. 데이터는 RSA + AES-256-CBC로 암호화되어 models.litellm.cloud(합법 LiteLLM API로 위장)로 유출됐다. 같은 시기 axios 1.14.1 및 0.30.4 버전 침해(메인테이너 npm 계정 탈취 의심)도 발생, 백도어 RAT가 배포됐다. AI 어시스턴트의 무제한 권한 거버넌스가 이제 보이지 않는 위험의 핵심임이 분명해졌다.
한국 정부도 빠르게 움직였다. 과기정통부는 14일 앤트로픽 Mythos(Project Glasswing)와 OpenAI GPT-5.3-codex 기반 ‘Trusted Access for Cyber’ 출범을 두고 긴급 현안 점검 회의를 소집했다. 류제명 제2차관 주재로 통신 3사·네이버·카카오·우아한형제들·쿠팡 등 주요 플랫폼 CISO가 참여, 보안 체계 변화 동향을 점검했다. 청와대 국가안보실의 긴급 대응 지시까지 떨어진 본격적 사안이었다. 배경훈 부총리는 “고성능 AI 기반 사이버보안 서비스의 등장은 획기적 보안 향상의 기회임과 동시에 악용 시 큰 위험”이라며 민관 합동 대응을 강조했다.
미국은 외교 전선으로 압박을 확대했다. 24일 국무부는 외교 전문을 통해 각국 공관에 중국 AI 기업의 미국 모델 무단 ‘증류(distillation)’ 우려를 동맹국과 공유하라고 지시했다. 백악관 OSTP도 23일 AI 기업과의 정보 공유 확대, 무단 모델 추출 탐지 협력 강화를 발표했다. 트럼프-시진핑 베이징 정상회담을 몇 주 앞둔 시점이었다. 중국은 “근거 없는 공격”이라며 전면 부인했고, 딥시크도 부인했지만 — 같은 주에 1.6T 파라미터 V4가 출시된 타이밍은 의미심장했다.
여파는 금융권으로도 번졌다. 29일 골드만삭스가 홍콩 직원의 앤트로픽 클로드 사용을 차단했다. 본토 중국과 달리 만리방화벽 밖에 있던 홍콩이지만, 미국 본사가 앤트로픽과의 계약을 엄격히 해석한 결과로 “홍콩 직원은 앤트로픽 제품에 일절 접근하지 말아야 한다”는 결론에 이른 것. OpenAI 등 다른 제공사에는 적용되지 않았다. 미국 AI 기업들의 IP 유출 우려, 특히 딥시크의 학습 활용 의혹과 맞물린 결정이었다.
AI가 흔드는 일자리, 법조계, 교육
4월에는 일자리 데이터가 더 무거워졌다. 골드만삭스 분석은 AI 도입이 지난 1년간 월평균 고용 증가를 2만 5,000개 감소시키고 실업률을 0.16%포인트 상승시켰다고 평가했다. 대체 효과(-2.5만/월)에서 보완 효과(+9,000/월)를 빼면 월 1.6만 개 순감소. 모건스탠리는 AI 영향이 큰 산업에서 고용이 약 4% 감소했고, 특히 경력 없는 초급 인력에서 감소폭이 가장 컸다고 보고했다. Block은 인력을 약 40% 감축, 아마존·오라클·메타도 대규모 구조조정에 들어갔다. 오라클은 AI 데이터센터 인프라 부채 부담으로 주가가 25%가량 하락한 가운데 2~3만 명 해고로 최대 100억 달러 잉여현금흐름을 추가 확보하려 한다는 분석이 나왔다.
법조계는 다른 방식으로 흔들렸다. AI가 생성한 가짜 판례 인용으로 제재된 변호사 사례가 전 세계 1,200건 이상, 그중 약 800건이 미국 법원에서 발생했다. 오리건 연방법원은 한 변호사에게 약 10만 9,700달러(약 1억 4천만원)의 제재금·비용을 명령했고, 네브래스카·조지아 주 대법원에서도 비슷한 장면이 연출됐다. 일본생명보험 미국 법인은 ChatGPT가 잘못된 법률 조언으로 자신들에게 근거 없는 법적 조치를 취하게 만들었다며 OpenAI를 무면허 법률업무 수행 혐의로 일리노이 연방법원에 제소했다. AI가 법조계 비즈니스 모델 — 시간당 청구 — 자체를 위협하고 있고, 차분히 사고하는 훈련을 받지 못하는 미래 변호사의 분석 능력 저하가 본격 우려로 떠올랐다.
한국에서는 행정 영역의 AI 도입이 가속화됐다. 행정안전부는 인공지능정부 기술자문단을 출범, 김세웅 카카오 부사장을 단장으로 산학연 101명 규모를 4개 분과로 운영한다. 과기정통부는 더 직접적이었다. 인공지능 개발 역량을 가진 젊은 직원들이 직접 개발팀 ‘AI Sapiens’를 구성, 첫 결과물로 밤 사이 세계 AI 동향을 자동 검색·정리·분석하는 AI를 만들어 매일 아침 정책 담당자들에게 공유하기 시작했다. 향후 예산요구서·법안 검토 자동 요약, 출장 정산 자동화, 한글 회의록 자동 작성 등으로 확장 예정이며, 류제명 제2차관 주재 에이전틱AI 워크숍에서는 간부·직원이 직접 바이브 코딩으로 AI 서비스를 개발하기로 했다. 배경훈 부총리는 “AI 활용 여부는 선택이 아닌 생존의 문제”라고 못박았다.
OpenAI도 한국 사용자를 의식한 행보를 보였다. 챗GPT가 한컴오피스 HWP·HWPX 파일 지원을 시작하면서, 별도 변환 없이 행정문서·보고서를 직접 업로드해 분석할 수 있게 됐다. 공공기관·교육기관·주요 기업이 광범위하게 사용하는 포맷이 글로벌 AI 서비스에 통합된 것은 한국 시장에서 챗GPT의 실질적 업무 활용성을 한 단계 끌어올리는 변화다.
인프라와 한국: 새만금 AI 스마트도시, 리벨리온, 메모리
한국 AI 인프라 전선에서도 주목할 만한 진전이 있었다. 금융위원회는 ‘K-엔비디아 육성 프로젝트’ 첫 직접 투자로 리벨리온에 2,500억원을 의결했다. 첨단전략산업기금 직접 투자 첫 사례로, 리벨리온의 AI NPU ‘리벨100’ 양산과 차세대 AI 반도체 개발이 목표다. 7월 양산 확대를 앞두고 있다.
새만금개발청은 ‘새만금 스마트도시계획(2026~2030)’이 국토부 최종 승인을 받았다고 24일 공고했다. 비전은 ‘탄소중립 AI혁신 스마트도시 새만금’. 현대차그룹의 9조원 투자(로봇 제조, AI 데이터센터(AIDC), AI 수소시티 등)와 연계되어 국내 유일 AI 스마트도시 테스트베드로 조성된다. 18개 기본 서비스(스마트 주차·교차로, UAM 의료 긴급출동, AI CCTV)와 12개 첨단 서비스(자율주행 로봇택시, AI 통합 도시운영 플랫폼, V2G/VPP) 등 30개 스마트 서비스가 단계적으로 도입될 예정이다.
크롬 브라우저에서는 AI 모드가 본격화됐다. 16일 발표된 업데이트는 데스크톱에서 웹페이지와 AI 모드를 사이드 바이 사이드로 띄우고, 검색창의 ‘+’ 메뉴로 모든 열린 탭을 AI 컨텍스트로 활용하며, 텍스트·이미지·PDF 멀티모달 입력 + Canvas 통합까지 지원한다. ‘탭 호핑(Tab hopping)’ 시대가 끝나고 ‘맥락 유지형 대화 탐색’으로 넘어가는 신호였다. 미국 우선, 곧 한국 포함 글로벌 확대 예정. Perplexity Comet, Arc Browser Max와의 AI 브라우저 경쟁 구도가 본격화될 전망이다.
The Verge의 AI 단신들도 4월의 분위기를 풍부하게 했다. 메모리 반도체 수요는 2027년 말까지 60%만 충족 가능하다는 전망(이는 TurboQuant 충격에도 불구하고 단기 수요는 여전히 폭증한다는 신호다), 트럼프 지지 AI 인플루언서가 인스타·틱톡·페이스북에 수백 개 가짜 계정을 도배한 사건, Anthropic Claude Design(Opus 4.7 기반 디자인 도구) 출시, Bernie Sanders의 데이터센터 건설 중단 요구, 구글 DeepMind의 Gemini Robotics-ER 1.6(Spot 로봇이 압력 계기판을 읽음), Microsoft MAI-Image-2-Efficient(프로덕션 이미지 워크호스), NAACP의 xAI Colossus 2 데이터센터 소송(테네시 멤피스 가스터빈 27기 무허가 운영), Codex의 macOS 앱 자율 조작 능력, Gemini Personal Intelligence 글로벌 확대(영국·EEA 제외) 등 — 데이터센터 환경·에너지 논쟁, 군사 시장 진출 가속, AI 학습 데이터 신산업, 거버넌스 전선의 네 축이 분명히 모습을 드러냈다.
모빌리티의 두 얼굴: FSD 유럽 진출과 해킹 차단
테슬라는 4월에도 양면 작전을 펼쳤다. 한쪽에서는 FSD 수퍼바이즈드가 네덜란드 승인을 획득하며 유럽 진출의 첫 단추를 끼웠다. v12 엔드투엔드 신경망 아키텍처 — 사람이 코딩한 규칙이 아닌 인간 운전자 관찰 학습 — 가 유럽 도입의 핵심이며, 애널리스트들은 2026년 고마진 소프트웨어 수익 증대를 예상했다.
다른 쪽에서는 강경한 단속이 이어졌다. 테슬라는 유럽·한국·중국·튀르키예에서 비인가 CAN 통신 장치로 FSD를 활성화한 차량들을 원격 영구 차단, 기본 오토파일럿 수준으로 제한했다. 약 500유로(약 87만원) 수준의 우회 장치가 대상이었고, 비용을 지불한 이용자라도 예외 없었다. 한국에서는 자동차관리법상 불법 개조로 최대 2년 징역 또는 2,000만원 이하 벌금이 부과될 수 있는 사안이며, 중국 생산 모델 3·Y에 FSD가 적용되지 않는 구조적 격차가 우회 장치 수요의 원인 중 하나였다. 연결형 차량(connected car)이 곧 원격 통제 가능한 자산이라는 사실이 다시 한 번 확인됐다.
맺으며: 인프라·생태계·신뢰의 3축으로 재편된 AI
2026년 4월은 AI 산업이 더 이상 “어떤 모델이 더 똑똑한가”의 문제가 아니라 “누가 컴퓨팅을 쥐고, 누가 생태계를 묶고, 누가 신뢰를 만드는가”의 게임으로 재편된 달이었다.
앤트로픽 Mythos 유출과 Opus 4.7 출시는 사이버보안이 모델 등급의 새 척도가 됐음을 보여줬다. 구글의 400억 달러 앤트로픽 베팅과 AI 컴퓨팅 1위 등극은 인프라가 곧 해자(moat)라는 새 산업법칙의 선언이었다. TurboQuant와 Decoupled DiLoCo는 그 인프라의 효율 곡선조차 다시 그릴 수 있다는 가능성을 던졌다. 딥시크 V4·Qwen3.6·Kimi K2.6의 동시 진격은 폐쇄형 진영의 정치극과 무관하게 오픈소스가 자기 속도로 따라잡고 있다는 사실을, OpenAI의 매출 미달과 사내 갈등은 소비자 매출과 엔터프라이즈 매출의 구조적 우열을 각각 드러냈다.
에이전트는 이제 거래·유지보수·창작·정부 행정까지 들어왔다. 앤트로픽 Project Deal이 증명한 협상 격차가 새로운 디지털 빈부 격차의 씨앗이라면, 클로스위퍼와 Claude Connector가 보여준 자동화 노동은 우리가 일자리를 놓고 던진 질문을 더 가파르게 만든다. SentinelOne 사건과 axios 침해는 무제한 권한 AI 어시스턴트의 거버넌스 부재가 모든 보안 모델의 전제를 흔든다는 것을, 미 국무부의 ‘distillation 외교 경고’와 골드만삭스 홍콩 차단은 AI 기술이 곧 지정학적 자산이라는 점을 못박았다.
한 가지 분명해진 것이 있다. 4월의 모든 사건은 결국 같은 명제로 수렴한다 — AI는 혼자 작동하지 않는다. 칩, 네트워크, 데이터센터, 표준, 정책, 노동, 신뢰, 그 모든 사회적 인프라가 AI의 일부가 되고 있다. 그리고 이 인프라를 누가 어떻게 짜느냐가, 다음 라운드 승부를 가른다.
다음 달의 풍경은 더 가팔라질 것이다.