클로드 사용량 줄이기: 한도에 덜 막히는 6가지 습관

클로드 한도에 자주 막힌다면 — 매 메시지마다 대화 전체를 다시 읽는 원리부터, 새 대화로 분리·질문 묶기·큰 첨부 줄이기 등 토큰을 아끼는 실전 습관까지 정리했습니다.

한도에 자주 막힌다면, 원리부터 알아야 합니다 — 클로드는 메시지 개수가 아니라 토큰으로 계산하고, 매 메시지마다 그때까지의 대화 전체를 다시 읽습니다. 그래서 대화가 길수록 답변 하나가 점점 비싸집니다. 한도에 덜 닿게 쓰는 실전 습관을 정리합니다. (한도가 무엇이고 언제 초기화되는지는 사용량 한도 가이드 참고.)

사용량 아끼는 6가지 습관 새 작업 = 새 대화 이전 맥락은 요약해서 넘기기 질문은 묶어서 나눠 보내면 매번 재로드 큰 첨부 줄이기 PDF·이미지는 토큰 많이 씀 작업별로 분리 개요·작성·편집을 각각 다른 대화 재생성 줄이기 밀지 말고 되감기로 수정 가벼운 작업엔 가벼운 모델 (예: Haiku) 핵심 원리: 클로드는 매 메시지마다 대화 전체를 다시 읽으므로, 대화가 길수록 답변 하나가 비싸집니다.

왜 긴 대화가 비싼가

클로드는 새 답을 만들 때마다 앞의 모든 대화를 다시 처리합니다. 첫 메시지는 거의 공짜지만, 30번째 메시지에서는 앞의 29개를 통째로 다시 읽은 뒤 답합니다. 즉 길어질수록 같은 질문도 비싸집니다. 아래 습관은 모두 이 한 가지 — "재처리 낭비 줄이기" — 로 통합니다.

1. 새 작업은 새 대화로

주제가 바뀌면 새 대화를 여세요. 이전 맥락이 필요하면 "지금까지 내용 요약해줘"라고 한 뒤, 그 요약을 복사해 새 대화의 첫 메시지로 붙여넣습니다. 무거운 히스토리 없이 맥락만 가져갈 수 있습니다.

2. 질문은 묶어서

세 가지를 따로 보내면 대화 맥락을 세 번 다시 로드합니다. 가능한 한 한 메시지에 모아서 물어보세요.

3. 큰 첨부 줄이기

PDF·이미지·스크린샷은 텍스트보다 토큰을 많이 씁니다(이미지·문서 1장이 수천 토큰 수준으로 알려져 있습니다 — 정확한 값은 내용에 따라 다름). 꼭 필요한 부분만 올리거나, 가능하면 텍스트로 전달하세요.

4. 작업별로 대화 분리

큰 일을 한 대화에 몰아넣지 말고, 개요 → 작성 → 편집처럼 단계별로 나눠 각각 새 대화에서 진행하면 대화당 맥락이 가벼워집니다.

5. 불필요한 재생성 줄이기

답이 빗나갔을 때 "아니, 그게 아니라…"로 계속 밀면 그때마다 전체를 다시 읽습니다. 크게 어긋났다면 앞으로 밀지 말고, 초기 지점에서 메시지를 편집해 다시 시도하는 편이 낫습니다.

6. 가벼운 작업엔 가벼운 모델

요약·분류 같은 단순 작업까지 최고 성능 모델을 쓸 필요는 없습니다. 채팅에서 모델을 고를 수 있다면 가벼운 모델(예: Haiku)을 선택하세요. 모델별 차이는 모델 비교를 참고하세요.

Claude Code 사용자라면

  • plan mode(Shift+Tab)로 먼저 계획만 보고 불필요한 단계를 쳐내 시행착오 토큰을 줄입니다.
  • /compact로 더 이상 필요 없는 맥락을 정리해 세션을 가볍게.
  • @파일 참조로 긴 내용을 붙여넣는 대신 필요할 때만 불러오기.
  • CLAUDE.md에 반복 설명을 적어두면 매번 다시 설명할 필요가 없습니다(작성법).

이 습관들은 한두 개만 적용해도 차이가 납니다. 한도 자체가 궁금하면 사용량 한도 가이드를 함께 보세요.

고지: "긴 대화는 토큰을 많이 쓴다"는 원리는 사실이지만, 일부 출처에서 인용되는 구체 토큰 수치(예: 메시지당 ○○토큰)는 추정값이며 내용·모델·시점에 따라 달라집니다. 본문은 검증 가능한 원리 위주로 작성했습니다. 한도·요금 정책은 변동되니 공식 안내에서 확인하세요. 본 사이트는 Anthropic 공식 사이트가 아닙니다.

이어서 읽어보세요

궁금한 점이 있거나 활용법을 나누고 싶나요?

커뮤니티에서 다른 사용자들과 팁과 노하우를 나눠보세요. 더 많은 가이드도 준비되어 있어요.