Messages API 응답에 `usage.output_tokens_details.thinking_tokens` 정보가 추가되었습니다. 이를 통해 청구 대상 출력 토큰 중 몇 개가 extended thinking에 사용되었는지 확인할 수 있습니다. 스트리밍 방식으로 요청할 경우 해당 정보는 마지막 message_delta 이벤트에만 나타나며, 별도의 베타 헤더를 포함할 필요는 없습니다.
The Messages API response now includes usage.output_tokens_details.thinking_toke
The Messages API response now includes usage.output_tokens_details.thinking_tokens, reporting how many of the billed output tokens were extended thinking. When streaming, the breakdown appears only on the final message_delta event. No beta header is required.
출처: Claude Platform 릴리스 노트 (원문 보기)