한도에 자주 막힌다면, 원리부터 알아야 합니다 — 클로드는 메시지 개수가 아니라 토큰으로 계산하고, 매 메시지마다 그때까지의 대화 전체를 다시 읽습니다. 그래서 대화가 길수록 답변 하나가 점점 비싸집니다. 한도에 덜 닿게 쓰는 실전 습관을 정리합니다. (한도가 무엇이고 언제 초기화되는지는 사용량 한도 가이드 참고.)
왜 긴 대화가 비싼가
클로드는 새 답을 만들 때마다 앞의 모든 대화를 다시 처리합니다. 첫 메시지는 거의 공짜지만, 30번째 메시지에서는 앞의 29개를 통째로 다시 읽은 뒤 답합니다. 즉 길어질수록 같은 질문도 비싸집니다. 아래 습관은 모두 이 한 가지 — "재처리 낭비 줄이기" — 로 통합니다.
1. 새 작업은 새 대화로
주제가 바뀌면 새 대화를 여세요. 이전 맥락이 필요하면 "지금까지 내용 요약해줘"라고 한 뒤, 그 요약을 복사해 새 대화의 첫 메시지로 붙여넣습니다. 무거운 히스토리 없이 맥락만 가져갈 수 있습니다.
2. 질문은 묶어서
세 가지를 따로 보내면 대화 맥락을 세 번 다시 로드합니다. 가능한 한 한 메시지에 모아서 물어보세요.
3. 큰 첨부 줄이기
PDF·이미지·스크린샷은 텍스트보다 토큰을 많이 씁니다(이미지·문서 1장이 수천 토큰 수준으로 알려져 있습니다 — 정확한 값은 내용에 따라 다름). 꼭 필요한 부분만 올리거나, 가능하면 텍스트로 전달하세요.
4. 작업별로 대화 분리
큰 일을 한 대화에 몰아넣지 말고, 개요 → 작성 → 편집처럼 단계별로 나눠 각각 새 대화에서 진행하면 대화당 맥락이 가벼워집니다.
5. 불필요한 재생성 줄이기
답이 빗나갔을 때 "아니, 그게 아니라…"로 계속 밀면 그때마다 전체를 다시 읽습니다. 크게 어긋났다면 앞으로 밀지 말고, 초기 지점에서 메시지를 편집해 다시 시도하는 편이 낫습니다.
6. 가벼운 작업엔 가벼운 모델
요약·분류 같은 단순 작업까지 최고 성능 모델을 쓸 필요는 없습니다. 채팅에서 모델을 고를 수 있다면 가벼운 모델(예: Haiku)을 선택하세요. 모델별 차이는 모델 비교를 참고하세요.
Claude Code 사용자라면
- plan mode(Shift+Tab)로 먼저 계획만 보고 불필요한 단계를 쳐내 시행착오 토큰을 줄입니다.
- /compact로 더 이상 필요 없는 맥락을 정리해 세션을 가볍게.
- @파일 참조로 긴 내용을 붙여넣는 대신 필요할 때만 불러오기.
- CLAUDE.md에 반복 설명을 적어두면 매번 다시 설명할 필요가 없습니다(작성법).
이 습관들은 한두 개만 적용해도 차이가 납니다. 한도 자체가 궁금하면 사용량 한도 가이드를 함께 보세요.