Claude Sonnet 5 완벽 가이드: 새 기능·가격·마이그레이션 주의점

가장 에이전트적인 Sonnet — 새 기능, 인트로 가격, 토크나이저 변화, 마이그레이션 주의점을 공식 문서 기준으로 정리했습니다.

Claude Sonnet 5는 Anthropic이 2026년 6월 30일 공개한 Sonnet 계열의 새 세대 모델입니다. 공식 발표에서 "지금까지 나온 것 중 가장 에이전트적인 Sonnet"으로 소개됐으며, 출시와 동시에 Free·Pro 플랜의 기본 모델이 되었습니다. 이 글은 공식 발표와 개발 문서를 기준으로 무엇이 달라졌는지, 가격은 어떻게 되는지, 그리고 기존 사용자·개발자가 넘어갈 때 주의할 점을 정리합니다.

Claude 모델 라인업에서 Sonnet 5의 위치 (2026년 7월 기준) Haiku 4.5 $1 / $5 속도·대량 작업 Sonnet 5 $2 / $10 (인트로) 9/1부터 $3 / $15 일상 작업의 기본값 Free·Pro 기본 모델 Opus 4.8 $5 / $25 복잡한 추론 에이전트 코딩 Fable 5 $10 / $50 최고 성능 안전 분류기 포함 가격은 API 기준 100만 토큰당 입력/출력 · 공식 Pricing 문서

핵심 스펙 한눈에

항목Claude Sonnet 5
출시일2026년 6월 30일
API 모델 IDclaude-sonnet-5
컨텍스트 윈도우(한 번에 기억하는 대화·문서의 양)100만(1M) 토큰 — 기본값이자 최대값, 더 작은 변형 없음
최대 출력12.8만(128k) 토큰
가격 (100만 토큰당)인트로 입력 $2 / 출력 $10 (2026-08-31까지) → 이후 $3 / $15
사고 방식adaptive thinking(모델이 필요할 때만 스스로 깊게 생각하는 방식) 기본 활성
제공 범위전 플랜 — Free·Pro의 기본 모델, Claude Code·API 포함

무엇이 좋아졌나

Anthropic 공식 발표에 따르면 Sonnet 5는 계획을 세우고, 브라우저·터미널 같은 도구를 사용하며, 몇 달 전까지는 더 크고 비싼 모델이 필요했던 수준의 자율 작업을 수행합니다. 전작 Sonnet 4.6과 비교하면 추론, 도구 사용, 코딩, 지식 작업 전반에서 큰 폭으로 개선됐고, 상위 모델인 Opus 4.8에 근접한 성능을 더 낮은 가격에 제공한다는 것이 공식 설명입니다. 안전성 평가에서도 Sonnet 4.6보다 바람직하지 않은 행동의 비율이 전반적으로 낮았다고 밝혔습니다.

비유하자면, 지금까지 "무난한 중형차" 포지션이던 Sonnet이 이번 세대에서 상위 트림의 주행 성능 상당 부분을 가져온 셈입니다. 어떤 모델을 골라야 할지 기준이 궁금하다면 모델 선택 가이드모델 비교 정리를 함께 참고하세요.

가격 — 그리고 놓치기 쉬운 토크나이저 변화

API 가격은 8월 31일까지 인트로 요금(입력 $2·출력 $10/100만 토큰)이 적용되고, 9월 1일부터 표준 요금 $3·$15로 바뀝니다. 표준 요금은 전작 Sonnet 4.6과 같습니다. 프롬프트 캐싱(같은 앞부분을 반복 전송할 때 할인해 주는 기능)으로 최대 90%, 배치 처리(급하지 않은 요청을 모아 처리)로 50%까지 비용을 줄일 수 있다는 점도 공식 발표에 명시돼 있습니다.

다만 개발자라면 한 가지를 꼭 알아야 합니다. 공식 문서에 따르면 Sonnet 5는 새 토크나이저(텍스트를 토큰 단위로 쪼개는 규칙)를 사용하며, 같은 텍스트가 약 30% 더 많은 토큰으로 계산됩니다. 토큰당 단가가 같아도 요청 한 건의 실제 비용은 달라질 수 있고, Sonnet 4.6 기준으로 잡아둔 max_tokens 예산이 부족해 출력이 잘릴 수 있으며, 1M 컨텍스트가 실제로 담는 텍스트 분량도 이전보다 줄어듭니다. 이전 모델에서 측정한 토큰 수를 재사용하지 말고 다시 계산하라는 것이 공식 안내입니다.

개발자 마이그레이션 — 400 에러가 나는 3가지

공식 문서는 Sonnet 5를 Sonnet 4.6의 "드롭인 업그레이드(코드를 거의 바꾸지 않고 교체 가능한 업그레이드)"로 설명하면서, 아래 3가지 동작 변화만 주의하라고 안내합니다.

  • adaptive thinking이 기본으로 켜집니다. 별도 설정 없이 모델이 필요할 때 스스로 깊게 생각합니다.
  • 수동 extended thinking이 제거됐습니다. thinking: {type: "enabled", budget_tokens: N} 형태의 요청은 400 에러를 반환합니다.
  • 샘플링 파라미터를 바꿀 수 없습니다. temperature, top_p, top_k를 기본값이 아닌 값으로 지정하면 400 에러를 반환합니다.

이 밖에 Priority Tier(전용 처리 용량 옵션)는 Sonnet 5에서 제공되지 않습니다. 이 세 가지를 제외하면 Sonnet 4.6에서 돌던 코드는 추가 수정 없이 동작한다는 것이 공식 설명입니다. API 모델 전반의 선택 기준은 API 모델 비교 가이드에서 다룹니다.

플랜별로 어떻게 쓰게 되나

  • Free·Pro: 별도 설정 없이 기본 모델로 Sonnet 5를 사용합니다.
  • claude.ai 채팅(유료 플랜): 공식 도움말 기준, Sonnet 5는 유료 플랜 채팅에서 100만 토큰 컨텍스트를 지원합니다. 참고로 Opus 4.8 등은 채팅에서 50만 토큰입니다.
  • Claude Code: v2.1.197 이상이 필요하며, sonnet 별칭이 Sonnet 5로 연결됩니다. API 경유 시 항상 1M 윈도우로 동작합니다. 요금 구조는 Claude Code 요금 가이드를 참고하세요.

사이버 보안 안전장치 — Sonnet 최초

Sonnet 5는 Sonnet 계열 최초로 실시간 사이버 보안 안전장치를 기본 탑재했습니다. 금지되거나 위험도가 높은 사이버 보안 주제의 요청은 거부될 수 있으며, API에서는 이 거부가 에러가 아니라 정상 응답(HTTP 200) + stop_reason: "refusal" 형태로 돌아옵니다. 자동화 파이프라인을 운영한다면 이 응답 형태를 처리 로직에 반영해 두는 것이 안전합니다.

자주 묻는 질문

인트로 가격은 언제까지인가요?

2026년 8월 31일까지입니다. 9월 1일부터 입력 $3 / 출력 $15(100만 토큰당)의 표준 요금이 적용됩니다.

Sonnet 4.6에서 쓰던 코드를 그대로 쓸 수 있나요?

대부분 그대로 동작합니다. 단 수동 extended thinking과 비기본 샘플링 파라미터는 400 에러를 반환하므로 해당 설정을 쓰고 있었다면 제거해야 하고, 토큰 수가 약 30% 늘어나는 점을 감안해 max_tokens와 비용 추정을 다시 잡아야 합니다.

1M 컨텍스트를 쓰려면 추가 요금이 있나요?

없습니다. 공식 문서 기준 Sonnet 5의 1M 컨텍스트는 기본값이며, 베타 헤더나 별도 과금 없이 표준 요금으로 제공됩니다.

이 글은 2026년 7월 4일 기준 Anthropic 공식 발표와 공식 개발 문서(platform.claude.com, support.claude.com)를 근거로 작성했습니다. 가격·제공 조건·모델 구성은 이후 변경될 수 있으므로 중요한 결정 전에는 공식 문서를 다시 확인하시기 바랍니다.

이어서 읽어보세요

읽고 나서도 궁금한 점이 있나요?

Q&A에 질문을 남기면 운영진이 48시간 내에 답변해 드립니다.