단일 에이전트에서 팀으로: OpenClaw 서브 에이전트의 작동 방식 — 그리고 Anthropic의 2만 달러 컴파일러 실험이 미래에 대해 알려주는 것

지난 2월, 한 Anthropic 연구원은 16개의 병렬 Claude 에이전트가 C 컴파일러를 작성하도록 하는 데 2만 달러를 사용했습니다. OpenClaw의 서브 에이전트 시스템을 사용하면 약 0.03달러의 비용으로 아침 브리핑을 위해 동일한 아키텍처를 실행할 수 있습니다.

에이전트 인프라 시리즈 · 12부

이번 달에 Anthropic의 연구원 Nicholas Carlini는 소프트웨어 공학이라기보다는 생물학적 진화에 더 가깝게 느껴지는 실험 결과를 발표했습니다.

그는 16개의 Claude Opus 4.6 인스턴스에게 2주 동안 병렬로 작업하도록 지시했습니다. 이들은 거의 2,000개의 코딩 세션을 생성했고, 20억 개의 입력 토큰을 소비했으며, API 수수료로 2만 달러가 조금 안 되는 비용이 들었습니다.

결과는? x86, ARM, RISC-V 아키텍처용 Linux 6.9 커널을 컴파일할 수 있으며, 처음부터 직접 작성된 10만 줄의 Rust 기반 C 컴파일러였습니다. 심지어 Doom도 실행합니다.

이것

우리 대부분은 이번 주 API 호출에 2만 달러를 쓸 여유가 없습니다. 하지만 Carlini가 사용한 아키텍처 패턴, 즉 거대한 목표를 독립적인 에이전트들을 위한 병렬 작업으로 분해하는 것은 바로 OpenClaw의 **Sub-Agent

먼저: 혼란스러운 점을 명확히 해봅시다

현재 커뮤니티에는 세 가지 “멀티 에이전트” 개념이 떠돌고 있습니다. 비슷하게 들리지만, 그것들은 완전히 다른 도구입니다.

개념	설명	사용처
Claude Code 에이전트 팀	Anthropic의 `claude` CLI 도구에 있는 실험적인 기능. 팀원들이 “Mailbox” 시스템을 통해 서로에게 직접 메시지를 보낼 수 있습니다.

이 글은 OpenClaw Sub-Agents에 관한 것입니다. 현재 세 가지 중에서 일반적인 자동화 작업에 바로 사용할 수 있는(production-ready) 것은 이것이 유일합니다.

OpenClaw 하위 에이전트의 작동 방식

하나의 에이전트가 모든 것을 순차적으로 처리하는 대신, “메인 에이전트”가 백그라운드에서 작업을 수행하도록 “하위 에이전트”를 생성합니다.

메인 에이전트 (깊이 0) │ ├── sessions_spawn(task=“경쟁사 A 조사”) │ └── 하위 에이전트 A (깊이 1, 격리된 세션) │ └── 작업… 작업… → 결과 보고 │ ├── sessions_spawn(task=“경쟁사 B 조사”) │ └── 하위 에이전트 B (깊이 1, 격리된 세션) │ └── 작업… 작업… → 결과 보고 │ └── 결과 수신 → 최종 보고서 종합

핵심 동작

논블로킹: sessions_spawn 명령어는 즉시 runId를 반환합니다. 메인 에이전트는 기다릴 필요 없이 계속 작업하거나 더 많은 에이전트를 생성할 수 있습니다.
**컨텍스트 격리

명령어

도구는 sessions_spawn입니다. 파라미터 이름은 instruction이 아니라 task라는 점에 유의하세요.

sessions_spawn({
  task: "Search for the latest HackerNews AI headlines and return top 5",
  model: "gpt-4o-mini",         // 워커에 더 저렴한 모델 사용
  runTimeoutSeconds: 120,       // 안전 차단
  label: "news-fetcher",        // 로그용
  cleanup: "delete"             // 완료 시 세션 자동 삭제
})

실제 사용되는 네 가지 아키텍처

패턴 1: 코디네이터 + 워커 (가장 일반적)

이는 리서치나 배치 처리를 위한 표준 패턴입니다.

메인 에이전트 (코디네이터)
  ├── 워커 A: Notion의 가격 모델 리서치
  ├── 워커 B: Linear의 가격 모델 리서치
  └── 워커 C: Monday.com의 가격 모델 리서치
메인 에이전트는 입력들을 결합하여 가격 비교표를 만듭니다.

작동 원리: 이 작업을 순차적으로 수행하면 메인 에이전트의 컨텍스트 창은 세 개의 다른 가격 책정 페이지의 원시 HTML로 가득 차게 됩니다. 병렬 처리함으로써 각 워커는 원시 데이터를 처리하고 구조화된 요약 정보만 반환합니다.

권장 워커 모델: gpt-4o-mini 또는 gemini-2.5-flash (저비용).

패턴 2: 파이프라인

하위 에이전트 1: 원시 데이터 스크래핑 (웹 검색 기술) ↓ 하위 에이전트 2: 데이터 정제 및 구조화 (추론 기술) ↓ 하위 에이전트 3: 인사이트 생성 (분석 기술) ↓ 메인 에이전트: 전달을 위한 형식 지정

이것이 작동하는 이유: 이는 프로세스의 “지저분한” 부분을 격리합니다. 고부가가치 분석을 수행하는 에이전트는 1단계의 원시 HTML 잡동사니를 절대 보지 않습니다.

패턴 3: 전문가 라우팅

하나의 범용 에이전트 대신, 메인 에이전트가 라우터 역할을 합니다.

메인 에이전트 (라우터) ├── “회의 예약” → Google Calendar 전문가 에이전트 ├── “이메일 초안 작성” → 글쓰기 전문가 에이전트 └── “이 주제에 대해 조사” →

AGENTS.md 라우팅 규칙

하위 에이전트에 작업을 라우팅할 때:

캘린더 요청: google-calendar 및 google-workspace 스킬로 스폰
리서치 요청: web-search 스킬로 스폰하고, gpt-4o-mini 모델 사용
글쓰기 요청: 작업 설명에 글쓰기 컨텍스트를 명시적으로 주입하여 스폰


### 패턴 4: 팬아웃 / 팬인 (아침 브리핑)

이것은 병렬 에이전트의 "Hello World"입니다.

---

**순차적 (기존 방식):** 날씨 확인 (5초) → 캘린더 확인 (5초) → 이메일 확인 (10초) → 뉴스 확인 (10초) → 요약 (5초). 총: **~35초.**

**병렬적 (새로운 방식):**
오전 7:00 → 메인 에이전트가 즉시 4개의 워커를 생성:
*   **에이전트 A:** 샌프란시스코 AccuWeather 날씨 예보
*   **에이전트 B:** 오늘의 Google Calendar 미팅
*   **에이전트 C:** Gmail 읽지 않은 메일 요약 (긴급 항목 표시)
*

---

총 시간은 가장 느린 에이전트(약 15초) + 종합(5초) = **약 20초**입니다.

---

---

## 핵심 비용 전략: "똑똑한 상사, 저렴한 인턴"

하위 에이전트의 가장 큰 위험은 비용 증폭입니다. 만약 5개의 에이전트를 생성하고 그들 모두가 Claude Opus 4.6을 사용한다면, API 요금이 5배로 늘어납니다.

해결책은 명시적인 모델 할당입니다.

**보스 (메인 에이전트):** 작업을 분해하고 결과를 종합하기 위해 높은

---

**인턴 (작업자):** 주로 명확하고 제한된 작업(이것을 요약하고, 저것을 찾기 등)을 수행합니다.
*   **모델:** `openai/gpt-4o-mini` 또는 `google/gemini-2.5-flash`

실수를 방지하기 위해 설정에서 이 기본값을 지정할 수 있습니다:

```json
{
  "agents": {
    "defaults": {
      "subagents": {
        "model": "openai/gpt-4o-mini",
        "maxSpawnDepth": 1,
        "maxChildrenPerAgent": 5
      }
    }
  }
}

고급: 오케스트레이터 패턴 (깊이 2)

기본적으로 OpenClaw는 maxSpawnDepth: 1로 설정되어 있으며, 이는 하위 에이전트가 자신의 하위 에이전트를 생성할 수 없음을 의미합니다.

복잡한 프로젝트의 경우, 깊이 2를 활성화할 수 있습니다:

{ "agents": { "defaults": { "subagents": { "maxSpawnDepth": 2 } } } }

이를 통해 3계층 구조를 사용할 수 있습니다:

불가”. ‘스폰’ is also widely understood in tech/gaming contexts, but ‘생성’ is more formal and general. Let’s use ‘생성 불가’. It’s clear and correct.

The instructions are: “Raw Markdown only. No code fences. Keep brands unchanged: Open

OpenClaw vs. Claude Code 에이전트 팀

둘 다 존재합니다. 실제로 어떤 것을 사용해야 할까요?

기능	OpenClaw 하위 에이전트	Claude Code 에이전트 팀
대상 사용자	일반 자동화 (이메일, 리서치, 운영)	코딩 및 소프트웨어 엔지니어링
커뮤니케이션	허브 앤 스포크 (작업자가 메인에 보고)	메시 (팀원들이 서로 메시지 전송)
성숙도	프로덕션 준비 완료 기능	알파 / 실험적
설정	내장형, 별도 설정 불필요	`settings.json` 편집 필요
컨텍스트	에이전트별로 독립적	에이전트별로 독립적

컴파일러를 구축하고 있다면 Claude Code를 사용하세요. 개인 비서나 비즈니스 워크플로를 구축하고 있다면 OpenClaw를 사용하세요.

현실적인 제약 사항

단방향 통신: 하위 에이전트는 부모에게 보고만 할 수 있습니다. 작업 도중 설명을 요청하기 위해 부모에게 질문할 수 없습니다.
SOUL.md 없음: 하위 에이전트는 백지 상태라는 것을 기억하세요. 만약 그들에게 성격이나 특정 행동 규칙을 부여하고 싶다면, 해당 지침을 task 프롬프트나 AGENTS.md에 포함해야 합니다.
동시성 제한: 한 번에 50개의 에이전트를 생성하려고 시도하지 마세요. 즉시 API 속도 제한에 도달하게 됩니다. 기본 상한선은 8개의 동시 세션입니다.

이런 관리가 번거롭다면: TinyClaw

병렬 에이전트 아키텍처를 관리하고, maxSpawnDepth를 구성하며, 여러 모델에 걸친 토큰 비용을 모니터링하는 것은 복잡합니다.

TinyClaw는 이 과정을 간단하게 만들어 줍니다:

비용 보호 기능: 내장된 대시보드를 통해 “인턴”들이 얼마를 지출하고 있는지 정확히 보여줍니다.
스마트한 기본값: 최적화된 하위 에이전트 구성을 별도의 설정 없이 바로 제공합니다.
원클릭 배포: 60초 안에 완전히 구성된 OpenClaw 인스턴스를 실행할 수 있습니다.

에이전트 팀을 운영하는 데 20,000달러가 들 필요는 없습니다. 아침 브리핑으로 시작하세요.

→ tinyclaw.dev · 무료로 시작 · 60초 안에 에이전트