LLM의 표상

1876년, 알렉산더 그레이엄 벨이 전화기를 발명했을 때, 사람들은 그것을 “말하는 전보”라고 불렀다. 당시에는 전보망이 세상을 지배하고 있었고, 새로운 기술은 기존 기술의 언어로밖에 설명되지 못했다. 하지만 전화기의 진짜 혁명은 음성 전송 기술 자체가 아니었다. 전보는 전문 기사가 모스 부호를 찍어야 했지만, 전화기는 아무나 수화기를 들면 됐다. 기술을 감싸는 방식이 달라지자, 전문가의 도구가 만인의 도구로 바뀌었다.

지금 AI 시장에서 정확히 같은 일이 벌어지고 있다. 2026년 2월 25일, Anthropic이 “Remote Control”이라는 기능을 출시했다. 로컬 컴퓨터의 터미널에서 CLI로만 돌리던 Claude Code에 웹과 모바일 앱으로 원격 접속할 수 있게 한 것이다. 기술적으로는 기능 하나가 추가된 것에 불과하다. 하지만 이 기능 하나가 기존에 서드파티 도구들이 독점하던 영역 대부분을 Anthropic 자체 플랫폼 안으로 흡수시켰다.

시장의 반응은 아직 조용하다. 하지만 이전에도 같은 패턴이 있었다. 2025년 10월 Anthropic이 Skills를 출시했을 때도 시장은 무덤덤했다. Skills 위에 만들어진 Cowork가 나오자 하루 만에 SaaS 주가에서 2,850억 달러가 증발했고, Security가 나오자 사이버보안 주가에서 150억 달러가 더 날아갔다. Remote Control도 마찬가지일 것이다. 그 자체가 아니라, 그 위에 올라올 제품이 본체다.

같은 LLM을 쓰는데 왜 어떤 서비스는 성공하고 어떤 서비스는 실패하는가? 차이는 본질이 아니라 그것이 드러나는 방식에서 생긴다. 쇼펜하우어 식으로 말하면, LLM은 의지이고 하네스는 표상이다. 사용자가 경험하는 것은 LLM이 아니라, LLM의 표상 — 하네스(harness)다.

Anthropic의 제품 행군 — Skills에서 Remote Control까지

Anthropic의 2025~2026년 제품 전략을 이해하려면, 개별 제품이 아니라 그 구조를 봐야 한다. 핵심은 “기반 기술을 먼저 깔고, 그 위에 특화 제품을 올린다”는 패턴이다.

2025년 10월 16일 출시된 Agent Skills가 기반이었다. Skills는 Claude가 특정 작업을 수행하기 위해 동적으로 로드하는 지침 묶음이다. 각 Skill은 SKILL.md 파일이 담긴 폴더 하나로 구성된다. 설계의 핵심은 “점진적 노출(progressive disclosure)”이었다. Claude는 시작할 때 설치된 Skill의 이름과 설명만 미리 로드하고, 작업이 매칭될 때만 해당 Skill의 세부 내용을 불러온다. 컨텍스트 윈도우를 과부하시키지 않으면서 전문 지식을 필요할 때만 꺼내 쓰는 구조다.

Skills 자체는 조용히 출시되었다. 시장의 반응도 담담했다. 하지만 Skills는 그 자체가 목적이 아니었다. 레고 블록을 만든 것이지, 완성품을 만든 것이 아니었다.

Skills 위에 올라온 첫 번째 완성품이 Cowork였다. 2026년 1월 12일 리서치 프리뷰로 시작해, 1월 30일에 플러그인 11종이 추가되었다. 탄생 배경이 흥미롭다. Anthropic이 관찰한 것은 개발자들이 Claude Code를 코딩이 아닌 업무에도 쓰고 있다는 사실이었다. 스프레드시트 정리, 보고서 초안, 파일 관리 같은 지식 노동을 터미널에서 처리하고 있었던 것이다. Anthropic은 이 행동 패턴을 관찰한 뒤, 비개발자도 쓸 수 있는 형태로 제품화했다. Cowork는 로컬 폴더에 접근하고, MCP 커넥터로 Google Drive, DocuSign, Apollo 같은 외부 도구와 연결되며, 사용자가 자연어로 작업을 설명하면 계획을 세우고 실행한 뒤 중간중간 사람에게 확인을 구한다. Skills라는 블록이 있었기에, Cowork는 법률, 영업, 마케팅, 데이터 분석 같은 영역별 전문 능력을 플러그인으로 빠르게 확장할 수 있었다.

두 번째 완성품이 Claude Code Security였다. 2월 20일 출시된 이 제품은 백만 토큰 컨텍스트 윈도우를 가진 Claude Opus 4.6 기반으로, 사이버보안 전문가처럼 “사고하는” 취약점 스캐닝을 수행한다. 데이터 흐름을 추적하고, 컴포넌트 간 상호작용을 이해하며, 복잡한 로직 오류를 찾아낸다. Claude는 오픈소스 코드베이스에서 수십 년간 발견되지 않았던 고위험 취약점 500건 이상을 찾아냈고, PicoCTF에서 글로벌 상위 3%에 들었다. Cowork와 마찬가지로, Skills의 전문 지식 블록 위에서 보안이라는 특정 영역에 하네스를 씌운 제품이다.

Cowork와 Security가 나오자 시장이 들썩였다. 하루 만에 SaaS 주가에서 2,850억 달러가 증발했고, 사이버보안 주가에서 150억 달러가 추가로 날아갔다. Skills가 깔렸을 때는 아무도 주목하지 않았지만, 그 위에 올라온 완성품이 시장을 뒤흔든 것이다.

그리고 2월 25일, Remote Control이 나왔다. 터미널에서 시작한 Claude Code 세션을 폰, 태블릿, 브라우저 어디서든 이어갈 수 있게 하는 기능이다. 세션은 전적으로 사용자의 로컬 머신에서 돌아간다. 코드는 절대 외부로 나가지 않는다. claude rc 명령을 치면 QR 코드가 뜨고, 스캔하면 연결된다. Anthropic은 이것을 “라이프스타일 기능”이라 불렀다.

시장의 반응은 또다시 조용하다. 하지만 Remote Control은 Cowork나 Security 같은 완성품이 아니다. Skills와 같은 위치에 있는 기반 기술이다. Skills가 “전문 지식의 동적 로딩”이라는 기반을 깔아 그 위에 Cowork와 Security를 가능케 했듯이, Remote Control은 “데스크톱에 묶이지 않는 에이전트 접근”이라는 새로운 기반을 깔고 있다. 그 위에 어떤 완성품이 올라올지는 아직 모른다. 하지만 Skills 때를 기억한다면, 시장이 조용한 지금이 오히려 주목해야 할 시점이다.

Anthropic은 이 패턴을 반복하고 있다. 기반을 조용히 깔고, 그 위에 특화 제품을 올려 시장을 뒤흔든다. 매번 전문가의 도구를 관찰하고, 만인의 도구로 바꾸는 것이다. 벨이 전보 기사의 전유물을 수화기 하나로 바꾼 것과 같은 패턴이다.

같은 엔진, 다른 차 — 하네스란 무엇인가

같은 Claude 모델을 쓰더라도 Claude Code와 OpenClaw는 완전히 다른 서비스처럼 느껴진다. 한국의 WrksAI는 OpenAI 모델을 쓰지만 ChatGPT와는 전혀 다른 제품이다. Cowork와 Security는 둘 다 Skills 기반이지만, 각각 자기 용도에 맞는 고유한 성격을 가지고 있다. 같은 LLM이 감싸는 방식에 따라 다른 제품이 된다.

이 “감싸는 층”을 업계에서는 하네스(harness)라고 부른다. 비유하자면 LLM은 엔진이고, 하네스는 차체다. 같은 엔진을 넣어도 차체가 다르면 완전히 다른 탈것이 된다. Claude라는 엔진을 Cowork라는 차체에 넣으면 지식 노동자의 동료가 되고, Security라는 차체에 넣으면 사이버보안 전문가가 된다.

좀 더 구체적으로 말하면, 하네스란 LLM 자체를 제외한 모든 것이다. 어떤 도구를 쓸 수 있는지, 어떤 범위에서 작동하는지, 실패했을 때 어떻게 복구하는지, 사람에게 언제 확인을 구하는지 — 이 모든 것이 하네스의 구성 요소다.

하네스를 “래퍼(wrapper)”와 혼동하는 경우가 많은데, 둘은 같지 않다. 래퍼는 API 호출 위에 UI를 입힌 것이다. 실제로 래퍼만으로 연 매출 수천만 달러까지 성장한 AI 스타트업들이 있었지만, 플랫폼이 같은 기능을 내장하는 순간 사용자들이 빠져나갔다. 얇은 래퍼는 플랫폼이 기능을 흡수하는 순간 존재 이유를 잃는다. 하네스는 그보다 훨씬 두꺼운 층이다.

하네스와 페르소나는 다르다

여기서 한 가지 구분이 필요하다. 하네스와 페르소나는 다른 개념이다.

페르소나는 개별 사용자에게 맞춘 개인적 맥락이다. “나는 마케팅 담당자이고, 보고서는 한국어로 작성하며, 표는 PowerPoint보다 한글(HWP)을 선호한다” — 이런 개인화가 페르소나다. ChatGPT의 Custom Instructions, Claude의 Memory 기능이 이에 해당한다.

하네스는 서비스 전체의 성격이다. Cowork의 하네스는 “지식 노동자의 업무 동료”라는 정체성을 규정한다. 어떤 도구에 접근할 수 있는지, 어떤 파일 형식을 다루는지, 어떤 워크플로우를 따르는지가 모두 서비스 수준에서 결정된다. Security의 하네스는 “사이버보안 전문가”라는 정체성을 규정한다. 코드 흐름을 추적하고, 취약점 패턴을 매칭하고, 심각도를 평가하는 전체 프로세스가 서비스 수준에서 내장되어 있다.

다시 자동차 비유로 돌아가면, 페르소나는 운전석의 시트 포지션, 사이드미러 각도, 라디오 채널 같은 개인 설정이다. 하네스는 차체 자체다. SUV인지 스포츠카인지 트럭인지를 결정하는 것이 하네스이고, 그 차 안에서 시트를 어떻게 맞추느냐가 페르소나다. Cowork와 Security는 둘 다 같은 엔진(Claude)과 같은 기반 부품(Skills)을 쓰지만, 차체가 다르기 때문에 완전히 다른 제품이 된다.

좁힐수록 강해지는 역설

좋은 하네스 설계의 핵심은 직관에 반하는 원칙에 있다. 범위를 좁히는 것이다.

사람에게 “아무 글이나 써 보세요”라고 하면 한 글자도 못 쓰는 경우가 많다. 하지만 “어제 점심에 뭘 먹었는지 쓰세요”라고 하면 즉시 쓴다. 마찬가지로, “아무 질문이나 하세요”라고 하면 사람들은 멈칫한다. 하지만 객관식 네 개를 주면 즉시 하나를 고른다. 범위가 제한되었기 때문이다.

AI 에이전트도 같다. Anthropic이 자체 연구에서 발견한 것은, 하네스 없는 에이전트가 두 가지 방식으로 실패한다는 사실이었다. 첫째, 한 번에 너무 많은 것을 하려 한다. 둘째, 작업이 끝나지 않았는데 끝났다고 선언한다. 사람도 마찬가지 아닌가. “이 프로젝트 전체를 오늘 끝내”라고 하면 어디서부터 손대야 할지 모른다. 하지만 “오늘은 목차만 잡아”라고 하면 즉시 시작한다.

Anthropic의 해결책은 “2개로 나눈 에이전트”였다. 에이전트의 역할을 둘로 나눈다. 하나는 환경을 파악하고 계획을 세우는 초기화 에이전트, 다른 하나는 그 계획에 따라 실제 작업을 점진적으로 수행하는 실행 에이전트다. 마치 건축에서 설계사와 시공사를 분리하는 것과 같다. 각자의 범위가 명확히 한정되어 있기 때문에, 한 번에 모든 것을 해치우려는 유혹에 빠지지 않는다. 범위를 좁히는 것이 곧 성능을 높이는 것이었다.

Spotify의 AI 플레이리스트 생성기가 좋은 사례다. Nielsen Norman Group의 UX 연구에 따르면, 이 기능은 음악 관련 프롬프트만 받도록 범위를 제한한 덕분에 범용 AI보다 훨씬 정교하고 오류가 적은 경험을 제공했다.

이 원리는 이미 글로벌 시장에서 증명되고 있다. AI 검색 Perplexity는 ChatGPT의 “아무거나 다 하는” 접근과 달리 “정보 탐색”이라는 하나의 범위로 좁혔고, 그 결과 200억 달러 밸류에이션을 받았다. 코딩 에디터 Cursor는 같은 기저 모델을 쓰지만 코드 편집이라는 범위에 하네스를 집중시켜 약 300억 달러의 기업 가치를 인정받았다. 한국의 WrksAI도 같은 맥락이다. OpenAI, Claude, DeepL 등 60개 이상의 모델을 쓰지만, 사용자는 모델을 직접 고르지 않는다. 어떤 작업에 어떤 모델을 쓸지를 WrksAI가 대신 결정한다. 범위를 좁히고 선택을 대신해주는 것 — 이것이 하네스의 힘이다.

95%의 만족과 나머지 5%의 집착

하네스가 서비스에서 매우 중요하지만, 한 가지 인정해야 할 한계가 있다. 아무리 잘 설계된 하네스라도 대략 95%까지의 만족만 가져다줄 수 있다. 나머지 5%는 개인의 극도로 세밀한 취향과 환경에 달려 있다. 대부분의 사용자에게는 95%로 충분하다. 하지만 정말 민감한 사용자들, 특히 자기 워크플로우에 AI를 깊이 통합하려는 전문가들은 이 5%까지 자기에게 맞추는 것을 원한다.

OpenClaw 현상이 이것을 극적으로 보여준다. 오스트리아 엔지니어 Peter Steinberger(PSPDFKit 창업자)가 만든 OpenClaw는 오픈소스 자율 AI 에이전트다. WhatsApp, Telegram, Discord, Slack, iMessage 같은 메신저 앱을 통해 이메일 관리, 일정 조율, 웹 브라우징, 터미널 명령 실행, 스마트홈 제어까지 수행한다. 2026년 1월 25일경 입소문을 타면서 이틀 만에 GitHub 스타 6만 개를 기록했고, 2월 초에는 18만 스타, 2만 포크를 넘겼다. 역대 가장 빠르게 성장한 GitHub 프로젝트였다.

여기서 흥미로운 현상이 발생했다. OpenClaw는 리눅스에서도 완벽하게 작동한다. 클라우드 서버에 올리면 된다. Steinberger 본인도 2 vCPU와 4GB RAM이면 충분하다고 밝혔다. 8만 원짜리 Raspberry Pi 5로도 돌릴 수 있다. 그런데 사람들은 최소 80만 원이 넘는 Mac Mini를 사서 전용 환경을 구축했다. 일부는 Mac Mini를 10대 이상 쌓아놓고 각각 다른 에이전트를 돌렸다. 배송 대기 기간이 6일에서 6주까지 늘어났고, Mac Studio까지 품절되는 사태가 벌어졌다.

왜 클라우드에 올리면 되는 것을 굳이 실물 하드웨어를 사서 집에 놓으려 했을까? 이것이 바로 “나머지 5%”의 문제다. 자기 집에 물리적으로 존재하는 기기, 자기만의 네트워크 환경, 자기만의 보안 설정, 자기만의 커스터마이징 — 클라우드가 줄 수 없는 물리적 통제감과 심리적 소유감이 그 5%를 채운다. 하지만 기술적으로 보면, OpenClaw는 AI 모델을 로컬에서 돌리는 것이 아니다. 클라우드 서비스에 API 호출을 하는 에이전트 프레임워크일 뿐이다. 그럼에도 사람들이 Mac Mini를 산 이유는, 원한 것이 기술적 효율이 아니라 자기만의 환경에서 자기만의 방식으로 돌아가는 에이전트였기 때문이다.

이것은 커피에 비유할 수 있다. 카페에서 파는 아메리카노가 95%의 만족을 준다. 하지만 어떤 사람들은 직접 원두를 골라 직접 그라인딩하고 직접 드리핑하는 과정 자체를 원한다. 맛의 차이가 미미하더라도, 그 5%의 통제감이 경험의 질을 결정짓는다. Mac Mini 대란은 AI 에이전트 시장에서도 이 5%가 하드웨어를 품절시킬 만큼의 수요를 만들어낸다는 것을 증명한 사건이었다.

그리고 바로 이 지점에서 Remote Control의 전략적 의미가 드러난다. Remote Control은 기술적으로 OpenClaw가 하던 일 대부분을 할 수 있다. 하지만 하네스 관점에서 보면, 아직 OpenClaw가 채워주던 세밀한 니즈에는 미치지 못하는 부분이 많다. 메신저 앱을 통한 자연스러운 상호작용, 24시간 백그라운드 실행, 능동적 작업 수행 같은 것들이다. Remote Control은 아직 완성품이 아니다. 앞서 본 패턴을 떠올려 보자. Anthropic은 Skills를 내놓고 사용자들이 그것을 어떻게 쓰는지 관찰한 뒤, 그 데이터를 기반으로 Cowork와 Security라는 완성품을 만들었다. Remote Control도 같은 수순을 밟을 것이다. 사용자들이 원격 접속을 어떤 방식으로 쓰는지 데이터를 모으고, 그 위에 나머지 5%까지 채우는 특화 제품을 만들어 낼 것이다. 그것도 OpenClaw가 해결하지 못한 보안 문제까지 커버한 형태가 될 것이다.

동네 맛집의 단골 법칙 — SaaS 주가 급락의 진짜 이유

2026년 2월 3일, Cowork 플러그인 출시 직후 월스트리트에서 벌어진 일은 “사포칼립스(SaaSpocalypse)”라 불렸다. 하루 만에 소프트웨어 관련 주식에서 2,850억 달러가 증발했다. Goldman Sachs의 미국 소프트웨어 바스켓 지수는 6% 하락해 4월 관세 쇼크 이후 최대 낙폭을 기록했다. Gartner 주가가 20%, LegalZoom이 20%, Thomson Reuters가 16% 빠졌다. Jefferies는 소프트웨어 투자 심리가 “역대 최악”이라며 “방사능” 수준이라고 표현했다.

2월 20일 Claude Code Security가 나오자 두 번째 파도가 덮쳤다. CrowdStrike가 8%, Cloudflare가 8%, SailPoint가 9%, JFrog가 25% 폭락했다. 사이버보안 주식에서만 약 150억 달러가 증발했다. 2월 23~24일에는 COBOL 현대화 기능에 대한 Anthropic 블로그 포스트 하나로 IBM이 13.2% 하루 만에 빠졌다. 2000년 10월 이후 최대 낙폭이었다.

하지만 여기서 중요한 것은 “왜” 빠졌느냐다. 기존 엔터프라이즈 고객이 SaaS 서비스를 해지하고 떠났기 때문이 아니다. 매출의 90% 이상을 만드는 대형 고객은 쉽게 움직이지 않는다. 연간 계약에 묶여 있고, 조직 전체에 깊이 통합되어 있으며, 전환 비용이 막대하다.

이것은 동네 맛집의 경제학과 같다. 어떤 맛집이든 전체 고객의 5% 정도가 단골이고, 이 단골이 매출의 대부분을 만든다. 이 단골들은 새 식당이 옆에 열린다고 쉽게 옮기지 않는다. 하지만 새로 유입될 손님들은 다르다. 아직 단골이 아닌 사람들은 더 좋은 대안이 있으면 처음부터 그쪽으로 간다.

SaaS 기업들에게도 같은 일이 벌어지고 있다. 이전이라면 법률 SaaS 도구를 도입했을 스타트업이, 이제는 Cowork 플러그인으로 자체 법률 워크플로우를 만든다. 사이버보안 전문 제품을 구매했을 성장기 기업이, Claude Code Security로 자체 보안 스캐닝을 구축한다. 기존 대형 고객은 그대로 있지만, 새로 유입될 미래 고객 파이프라인이 급격히 줄어들고 있는 것이다. 투자자들은 이 미래 파이프라인의 축소를 주가에 선반영하고 있다.

흥미로운 것은 2월 24일 Anthropic의 엔터프라이즈 브리핑 이후의 반전이다. 통합 파트너로 이름이 거론된 Thomson Reuters, Salesforce, DocuSign, FactSet의 주가가 반등했다. Thomson Reuters는 하루에 11% 이상 올랐다. 메시지는 명확했다. Anthropic 생태계 안에 있느냐 밖에 있느냐가 생존의 갈림길이 된 것이다.

모든 것은 하네스로 수렴한다

AI 모델 자체의 성능 경쟁은 이미 평준화 단계에 진입하고 있다. GPT-5든, Claude든, GLM-5든, Gemini든, 최상위 모델들의 벤치마크 차이는 점점 줄어들고 있다. 물론 모델 성능이 중요하지 않다는 뜻은 아니다. 하지만 모델 성능만으로는 서비스의 차별화를 만들 수 없는 시대가 됐다.

서비스의 차이를 만드는 것은 하네스다. 같은 LLM 엔진을 가지고도 코딩 에디터(Cursor), AI 검색(Perplexity), 업무 보조(WrksAI), 사이버보안(Claude Code Security), 자율 에이전트(OpenClaw)라는 완전히 다른 제품이 만들어진다. 엔진이 아니라 차체가 용도를 결정한다.

그리고 하네스의 가치는 범위를 좁힐수록 커진다. 이것이 가장 중요한 교훈이다. “아무거나 다 하는” AI 서비스는 결국 아무것도 잘 하지 못한다. 특정 카테고리에 범위를 좁힌 하네스를 설계하면, 에이전트는 마치 그 일을 위해 태어난 것처럼 작동한다.

Anthropic의 제품 행군은 이 원리의 체계적 실행이었다. Skills로 재사용 가능한 전문 지식 블록을 만들고, 그 위에 범위를 좁힌 제품별 하네스(Cowork, Security)를 올리고, Remote Control로 접근성의 물리적 제약을 풀었다. 플랫폼이 확장될수록 외부 도구의 존재 이유는 줄어들고, 모든 것이 Anthropic 생태계 안으로 수렴한다.

1876년 전화기가 “말하는 전보”에서 출발해 결국 전보 산업 전체를 대체했듯이, AI 하네스는 “똑똑한 챗봇”에서 출발해 기존 소프트웨어 산업의 근간을 재편하고 있다. 2,850억 달러의 증발은 시작일 뿐이다. 하네스를 잘 설계하는 자가 AI 서비스 시장을 가져간다. 그리고 그 하네스의 가치는 범위를 좁힐수록 커진다.

Language Detection