출시
2026년 5월 28일, Anthropic이 Claude Opus 4.8을 출시했다. 모델 ID는 claude-opus-4-8. 직전 모델인 Opus 4.7이 나온 지 41일 만이다. 표준 가격은 입력 $5, 출력 $25(백만 토큰당)로 4.7과 동일하다.
직전 글에서 4.7의 방향을 “더 똑똑한 게 아니라 더 맡길 수 있는 모델"이라고 정리했다. 4.8은 그 연장선을 한 칸 더 밀어붙인다. 이번에는 작업 한 건을 통째로 맡기는 게 아니라, 작업을 잘게 쪼개 수백 개의 subagent에게 동시에 맡긴다. 한 사람에게 맡기던 일을 한 팀에게 맡기는 셈이다.
한눈에 보는 변화
| Opus 4.7 | Opus 4.8 | |
|---|---|---|
| 출시일 | 2026-04-16 | 2026-05-28 |
| 표준 가격 (입/출) | $5 / $25 | 동일 |
| 고속 모드 | — | 2.5배 속도, $10 / $50 |
| 병렬 subagent | 제한적 | 수백 개 (동적 워크플로우) |
| 코드 결함 누락 | 기준 | 4.7의 약 1/4 |
| 불확실성 표시 | 제한적 | 적극적으로 먼저 알림 |
| effort(추론 강도) 조절 | low~max + xhigh | 슬라이더 + ultracode |
가격을 보면 표준 호출 비용은 그대로다. 대신 새로 생긴 두 가지 — 동적 워크플로우와 고속 모드 — 가 작업의 단위 자체를 바꾼다.
핵심 1: 동적 워크플로우 — 수백 개의 subagent
가장 큰 변화는 동적 워크플로우(dynamic workflows)다. Claude Code 안에서 Claude가 직접 작업 계획을 세우고, 그 계획을 orchestration 스크립트로 옮긴 다음, 수백 개의 subagent를 동시에 돌린다. Anthropic은 이걸 코드를 완성하는 단계를 넘어선 기능으로 설명한다.
규모 제한은 명확하게 정해져 있다.
| 항목 | 값 |
|---|---|
| 동시 실행 subagent | 최대 16개 |
| 한 번의 실행당 총 subagent | 1,000개 |
| 필요 버전 | Claude Code v2.1.154 이상 |
| 제공 플랜 | Max / Team / Enterprise (Max·Team은 기본 켜짐) |
| 상태 | 리서치 프리뷰 |
흐름을 도식으로 보면 이렇다.
flowchart TD
A[작업 요청] --> B[Claude가 계획 수립]
B --> C[orchestration 스크립트 생성]
C --> D{작업 분할}
D --> E1[subagent 묶음 1]
D --> E2[subagent 묶음 2]
D --> E3[subagent 묶음 N]
E1 --> F[결과 취합]
E2 --> F
E3 --> F
F --> G[테스트 통과 확인]
G --> H[병합]
여기서 중요한 건 분할과 취합을 사람이 짜는 게 아니라는 점이다. 사람은 “이 작업을 해줘"라고 던지고, 어떻게 쪼갤지와 어떻게 합칠지는 모델이 정한다. 동시 16개라는 상한이 있어서 1,000개를 한꺼번에 띄우는 게 아니라, 16개씩 흘려보내며 총 1,000개까지 처리하는 구조다.
실제로 뭐가 달라지나
MarkTechPost가 전한 사례가 이 기능의 성격을 잘 보여준다. 약 75만 줄 규모의 Rust 코드를 다시 쓰는 작업에서, Opus 4.8이 기존 테스트 스위트의 99.8%를 통과시키며 첫 커밋부터 병합까지 11일 만에 끝냈다.
핵심은 기존 테스트 스위트를 합격선으로 삼는다는 부분이다. 수십만 줄 규모의 마이그레이션을 사람이 일일이 검수하는 대신, 통과해야 할 테스트를 기준으로 모델이 스스로 작업의 완료 여부를 판단한다. 4.7에서 강조됐던 셀프 검증이 워크플로우 전체로 확장된 모양새다.
다만 리서치 프리뷰이고, 일반적인 세션보다 토큰을 눈에 띄게 많이 쓴다는 경고가 붙어 있다. 가격과 제공 범위가 바뀔 수 있다는 단서도 함께다.
핵심 2: 고속 모드 — 2.5배 속도, 3분의 1 가격
두 번째는 고속 모드(fast mode)다. 같은 Opus 4.8을 출력 토큰 기준 2.5배 빠르게 돌린다. 모델 품질은 표준과 동일하고, 속도만 끌어올린다.
가격은 입력 $10, 출력 $50(백만 토큰당)로 표준의 두 배다. 다만 The New Stack에 따르면 이 고속 모드 가격이 이전 모델들의 고속 모드($30/$150)보다 3배 저렴해졌다.
| 구분 | 입력 | 출력 | 속도 |
|---|---|---|---|
| 표준 | $5 | $25 | 기준 |
| 고속 모드 (4.8) | $10 | $50 | 2.5배 |
| 고속 모드 (이전 세대) | $30 | $150 | — |
쓰는 법도 단순하다. Claude Code에서 /fast 명령으로 켜고 끄며, 켜진 상태는 작은 번개 아이콘으로 표시된다. 다만 청구 방식이 다르다. 고속 모드는 플랜 할당량이 아니라 사용량 크레딧(usage credits)에서 차감되므로, 크레딧을 활성화해 둬야 쓸 수 있다.
속도가 두 배 이상 빨라진다는 건 단순히 답이 빨리 나온다는 의미를 넘어선다. 동적 워크플로우처럼 subagent를 수백 개 돌리는 작업에서는 개별 호출의 속도가 전체 완료 시간을 좌우한다. 두 기능이 같은 날 나온 게 우연은 아니다.
핵심 3: 더 정직해진 모델
벤치마크 점수 못지않게 강조된 변화가 정직성이다. Opus 4.8은 자기 작업에서 코드 결함을 놓치는 빈도가 4.7의 약 4분의 1로 줄었다. 작업의 불확실한 부분을 먼저 드러내고, 근거 없는 단언을 덜 한다는 평가도 함께 나왔다.
TechCrunch가 전한 Bridgewater Associates의 코멘트가 인상적이다. 분석의 입력과 출력에서 문제를 능동적으로 짚어내는데, 다른 모델들이 으레 놓치던 지점이라는 것이다.
이 변화는 동적 워크플로우와 맞물린다. subagent 수백 개가 동시에 돌아가는 작업에서 모델이 결함을 자주 놓치거나 근거 없이 다 됐다고 보고하면, 사람이 검수할 지점이 폭발적으로 늘어난다. 결함 누락이 줄고 불확실성을 먼저 알리는 성질은 대규모 위임을 실제로 굴러가게 만드는 전제다.
핵심 4: effort 슬라이더와 ultracode
4.7에서 xhigh effort 레벨이 추가됐던 것을 기억할 것이다. 4.8은 이 effort 조절을 더 손에 잡히게 바꿨다.
- claude.ai와 Cowork에서 슬라이더로 effort 수준을 조절한다. 품질과 토큰 소비를 직접 저울질하는 방식이다.
- 기본값은 high effort다. 4.7과 같은 토큰을 쓰면서 성능은 더 낫다는 게 Anthropic의 설명이다.
- Claude Code에는
ultracode설정이 생겼다.xhigheffort에 자동 워크플로우 orchestration을 결합한 모드다.
ultracode 외에도 프롬프트에 workflow라는 단어를 넣거나 번들 /deep-research 명령을 쓰면 동적 워크플로우가 작동한다. 즉 동적 워크플로우는 별도 화면이 아니라 기존 작업 흐름 안에서 자연스럽게 켜지도록 설계됐다.
벤치마크
수치 자체는 4.7만큼 극적이진 않지만, 측정 대상이 달라졌다. 단일 코딩 점수보다 에이전트와 실무 작업 쪽에 무게가 실렸다.
| 벤치마크 | 결과 |
|---|---|
| Online-Mind2Web (브라우저 에이전트) | 84% |
| Super-Agent | 모든 케이스를 끝까지 완료한 유일한 모델 |
| Legal Agent Benchmark (전체 통과 기준) | 전체 통과 10% 넘긴 첫 모델 |
전체 통과 기준에서 10%를 넘긴 첫 모델이라는 표현이 현재 에이전트 벤치마크의 난이도를 잘 보여준다. 부분 점수가 아니라 한 작업을 처음부터 끝까지 완수했는지를 따지면, 아직 대부분의 모델이 한 자릿수에 머문다는 뜻이다.
정리
| Opus 4.7 | Opus 4.8 | |
|---|---|---|
| 방향 | 작업 하나를 맡길 수 있는 | 작업을 쪼개 한 팀에 맡길 수 있는 |
| 병렬성 | 제한적 | subagent 최대 16 동시 / 1,000 총 |
| 속도 옵션 | — | 고속 모드 2.5배 |
| 코드 결함 누락 | 기준 | 약 1/4 |
| 정직성 | — | 불확실성 능동 표시 |
| 표준 가격 | $5 / $25 | 동일 |
4.7이 사람이 덜 개입해도 되는 방향이었다면, 4.8은 그 위에 한 사람이 못 하던 규모를 한 번에 처리하는 방향을 얹었다. 수십만 줄 마이그레이션을 11일에 끝낸 사례가 과장이 아니라면, 위임의 단위가 작업 한 건에서 프로젝트 한 덩어리로 넘어가는 셈이다.
물론 동적 워크플로우는 아직 리서치 프리뷰이고, 토큰을 많이 쓴다는 단서가 붙어 있다. 작은 작업이라면 표준 호출이 여전히 합리적이다. 다만 사람 손으로 며칠 걸리겠다 싶은 큰 작업 앞에서 선택지가 하나 더 생겼다는 건 분명하다.
참고 자료
- Introducing Claude Opus 4.8 — Anthropic
- Anthropic releases Opus 4.8 with new ‘dynamic workflow’ tool — TechCrunch
- Anthropic Ships Claude Opus 4.8 Alongside Dynamic Workflows and Cheaper Fast Mode — MarkTechPost
- Claude Opus 4.8 is here: effort controls, dynamic workflows, cheaper fast mode — The New Stack
- Anthropic Releases Claude Opus 4.8 With Dynamic Workflows, Just 41 Days After Opus 4.7 — Technology.org