Advisor 도구가 이제 max_tokens 파라미터를 지원합니다. 이를 통해 advisor 모델의 호출당 출력을 제한할 수 있으며, 전체 길이의 응답이 필요하지 않은 작업의 지연시간과 출력 토큰 비용을 줄일 수 있습니다. tools[].max_tokens을 advisor 도구 정의에서 설정하면 됩니다.
The advisor tool now supports a max_tokens parameter to cap the advisor model's
The advisor tool now supports a max_tokens parameter to cap the advisor model's output per call, reducing latency and output token cost for workloads that don't need full-length advisor responses. Set tools[].max_tokens on the advisor tool definition; see Capping advisor output.
출처: Claude Platform 릴리스 노트 (원문 보기)