Messages API 응답에 usage.output_tokens_details.thinking_tokens 포함

Messages API 응답에 `usage.output_tokens_details.thinking_tokens` 정보가 추가되었습니다. 이를 통해 청구 대상 출력 토큰 중 몇 개가 extended thinking에 사용되었는지 확인할 수 있습니다. 스트리밍 방식으로 요청할 경우 해당 정보는 마지막 message_delta 이벤트에만 나타나며, 별도의 베타

Messages API 응답에 `usage.output_tokens_details.thinking_tokens` 정보가 추가되었습니다. 이를 통해 청구 대상 출력 토큰 중 몇 개가 extended thinking에 사용되었는지 확인할 수 있습니다. 스트리밍 방식으로 요청할 경우 해당 정보는 마지막 message_delta 이벤트에만 나타나며, 별도의 베타 헤더를 포함할 필요는 없습니다.

The Messages API response now includes usage.output_tokens_details.thinking_toke

The Messages API response now includes usage.output_tokens_details.thinking_tokens, reporting how many of the billed output tokens were extended thinking. When streaming, the breakdown appears only on the final message_delta event. No beta header is required.

출처: Claude Platform 릴리스 노트 (원문 보기)

이어서 읽어보세요

Claude Code 2.1.162

Claude Code 2.1.162 업데이트에서는 여러 기능과 안정성이 개선되었습니다. 명령어 사용 경험이 개선되어 `/effort` 명령어는 선택한 난이도 수준이 새 세션의 기본값으로 유지될 때 확인 메시지를 표시하고, 자동완성 메뉴에서 슬래시 명령어를 클릭하면 즉시 실행되지 않고 프롬프트에 입력된 후 Enter 키로 실행할 수 있게 변경되었습니다. Re

Claude Opus 4.8, 적응형 사고 기능으로 필요할 때만 추론 활성화

Claude Opus 4.8에서 적응형 사고 기능을 활성화하면, 필요한 경우에만 추론을 수행하도록 동작합니다. 이를 통해 같은 수준의 노력에서 Claude Opus 4.7 대비 불필요하게 소비되는 사고 토큰을 줄일 수 있습니다.

거부 응답의 stop_details 필드가 공식 문서화됨; 반환 값

Claude의 거부 응답(refusal response)에 포함된 stop_details 필드가 공식 문서에 등재되었습니다. 이 필드는 거부 사유를 나타내는 카테고리(cyber, bio 또는 null)와 인간이 읽을 수 있는 설명을 함께 반환합니다. 이를 통해 애플리케이션이 거부의 종류에 따라 다른 처리 방식으로 라우팅할 수 있게 되었습니다. 더 이상 베타

Claude API에서 stop_r을 반환하는 요청에 대해 더 이상 요금이 청구되지 않습니다

Claude API에서 요청이 stop_reason: "refusal"을 반환하면서 Claude가 생성한 출력물이 없는 경우, 더 이상 해당 요청에 대한 비용이 청구되지 않습니다. 이는 API 사용자가 거부된 요청에 불필요한 요금을 지불하지 않도록 하는 변경 사항입니다. 사용자는 스트리밍 거부(Streaming refusals) 문서를 통해 거부 상황을 감

궁금한 점이 있거나 활용법을 나누고 싶나요?

커뮤니티에서 다른 사용자들과 팁과 노하우를 나눠보세요. 더 많은 가이드도 준비되어 있어요.