Claude 모델 비교·선택 가이드 — Opus 4.8·Sonnet 4.6·Haiku 4.5·Fable 5

Claude API의 현행 모델(Opus 4.8·Sonnet 4.6·Haiku 4.5·Fable 5)을 가격·컨텍스트·최대출력·thinking·knowledge cutoff로 비교하고, 작업 유형별 선택 기준을 2026년 6월 공식 문서 기반으로 정리합니다.

Claude API에는 여러 모델이 있고, 어떤 모델을 고르느냐가 비용과 품질을 동시에 좌우합니다. 이 글은 2026년 6월 기준 공식 Models overview 문서를 바탕으로 현행 모델들의 스펙·가격을 비교하고, 작업 유형별 선택 기준을 정리합니다.

Claude 모델 비교 (2026-06 기준) 가격 = MTok당 USD · 공식 Models overview 기준 · 정책은 변동될 수 있음 Fable 5 claude-fable-5 가격(입력/출력) $10 / $50 컨텍스트 1M 최대 출력 128k 최상위 난이도 워크로드 Opus 4.8 claude-opus-4-8 가격(입력/출력) $5 / $25 컨텍스트 1M 최대 출력 128k 복잡 추론·에이전트 코딩 Sonnet 4.6 claude-sonnet-4-6 가격(입력/출력) $3 / $15 컨텍스트 1M 최대 출력 64k 속도·지능 균형 기본값 Haiku 4.5 claude-haiku-4-5 가격(입력/출력) $1 / $5 컨텍스트 200k 최대 출력 64k 최고속·저비용 대량처리

현행 모델 라인업

공식 문서 기준, 현재 주력 모델은 다음과 같습니다. 모든 현행 Claude 모델은 텍스트·이미지 입력, 텍스트 출력, 다국어, 비전을 지원하며 Claude API·AWS·Bedrock·Vertex AI·Microsoft Foundry를 통해 제공됩니다.

  • Claude Opus 4.8 (claude-opus-4-8) — Anthropic의 가장 강력한 Opus 등급 모델. 복잡한 추론과 장기 호흡의 에이전트 코딩에 적합. 가격 입력 $5 / 출력 $25 (MTok당), 컨텍스트 1M 토큰, 최대 출력 128k. effort 파라미터를 지원하며 기본값은 high.
  • Claude Sonnet 4.6 (claude-sonnet-4-6) — 속도와 지능의 최적 균형. 가격 $3 / $15, 컨텍스트 1M, 최대 출력 64k. extended·adaptive thinking 모두 지원.
  • Claude Haiku 4.5 (claude-haiku-4-5-20251001, alias claude-haiku-4-5) — 가장 빠르면서 프런티어에 근접한 지능. 가격 $1 / $5, 컨텍스트 200k, 최대 출력 64k.
  • Claude Fable 5 (claude-fable-5) — Anthropic이 널리 공개한 모델 중 가장 강력. 가장 까다로운 추론·장기 에이전트 작업용. 가격 $10 / $50, 컨텍스트 1M, 최대 출력 128k. (2026년 6월 9일부터 일반 제공)

※ Claude Mythos 5·Mythos Preview는 Project Glasswing(초대제, 방어적 사이버보안 워크로드)으로 별도 제공되며 일반 셀프서비스 가입은 없습니다.

가격·스펙 핵심 비교

비용은 입력/출력 토큰 100만 개(MTok)당 USD로 매겨집니다. 같은 작업이라도 모델에 따라 단가가 Haiku $1/$5 → Sonnet $3/$15 → Opus $5/$25 → Fable $10/$50로 차이가 큽니다. 입력 대비 출력이 비싸므로, 출력 길이를 줄이는 프롬프트 설계가 비용에 직접 영향을 줍니다.

  • 컨텍스트 윈도우: Opus 4.8·Sonnet 4.6·Fable 5는 1M 토큰, Haiku 4.5는 200k 토큰. (단 Microsoft Foundry에서 Opus 4.8은 200k)
  • 최대 출력: Opus 4.8·Fable 5는 128k, Sonnet 4.6·Haiku 4.5는 64k. (동기 Messages API 기준. Batch API에서는 일부 모델이 베타 헤더로 최대 300k 출력)
  • thinking: Sonnet 4.6·Haiku 4.5는 extended thinking 지원, Opus 4.8·Fable 5는 adaptive thinking. (Haiku 4.5는 adaptive 미지원, Fable 5는 adaptive 항상 켜짐)
  • knowledge cutoff(신뢰 가능한 지식 기준일): Opus 4.8 Jan 2026, Sonnet 4.6 Aug 2025, Haiku 4.5 Feb 2025.
어떤 모델을 고를까? 공식 권고: 잘 모르겠으면 복잡한 작업은 Opus 4.8로 시작 작업 난이도는? 비용 vs 품질 트레이드오프 대량·단순·저지연 → Haiku 4.5 일상 프로덕션 기본 → Sonnet 4.6 복잡 추론·에이전트 → Opus 4.8 최고난도 프런티어 → Fable 5 고려 포인트 · 긴 문서·코드베이스 → 1M 컨텍스트 (Opus·Sonnet·Fable) · thinking 필요 → Sonnet·Haiku (extended) / Opus·Fable(adaptive) · 워크플로 중 난이도 변동 → 단계별로 모델 라우팅 최신 스펙은 공식 문서로 확인

작업 유형별 선택 기준

공식 문서는 "잘 모르겠으면 복잡한 작업은 Opus 4.8로 시작"하라고 안내합니다. 실무에서는 비용·품질 트레이드오프를 기준으로 다음처럼 잡으면 무난합니다.

  • 대량·단순·저지연 작업 (분류, 짧은 응답, 실시간 챗봇) → Haiku 4.5. 가장 빠르고 저렴.
  • 일상 프로덕션 기본값 (대부분의 코딩·생성·요약) → Sonnet 4.6. 속도·지능·비용 균형.
  • 복잡한 추론·장기 에이전트 코딩Opus 4.8. 답변 품질이 중요할 때.
  • 최고난도 프런티어 작업Fable 5. 추가 비용이 정당화될 만큼 어려운 워크로드에만.

긴 문서·코드베이스를 다룬다면 1M 컨텍스트(Opus·Sonnet·Fable)가 유리하고, 단계별로 난이도가 달라지는 워크플로라면 단계마다 모델을 다르게 라우팅하는 것도 방법입니다.

모델 ID는 고정 스냅숏

주의할 점: 모든 Claude 모델 ID는 고정 스냅숏(pinned snapshot)입니다. ID에 날짜가 있으면(예: 20250929) 그 릴리스에 고정되고, 4.6 세대부터는 날짜 없는 형식(예: claude-sonnet-4-6)도 자동 갱신 포인터가 아니라 고정 스냅숏입니다. 모델 capability와 토큰 한도는 Models API로 프로그램적으로 조회할 수 있습니다(max_input_tokens, max_tokens, capabilities 반환).

정리

모델 선택은 ① 작업 난이도와 비용 허용치 파악 → ② Haiku/Sonnet/Opus/Fable 중 등급 선택 → ③ 컨텍스트·thinking·출력 요구로 미세조정 순서가 합리적입니다. 더 알아보려면 Claude API 모델 ID와 버전 관리, 컨텍스트 윈도우와 토큰을 함께 참고하세요.

본 글은 Anthropic 공식 문서(platform.claude.com/docs)의 공개 정보를 2026년 6월 기준으로 정리했습니다. 모델 라인업·가격·스펙은 자주 바뀌므로 실제 선택 시 공식 Models overview·Pricing 페이지를 반드시 확인하세요. 본 사이트는 Anthropic 공식 사이트가 아닙니다.

이어서 읽어보세요

궁금한 점이 있거나 활용법을 나누고 싶나요?

커뮤니티에서 다른 사용자들과 팁과 노하우를 나눠보세요. 더 많은 가이드도 준비되어 있어요.