- #클로드코드
- #ClaudeCode
- #토큰절약
- #사용량
- #Opus4_7
- #Sonnet4_6
- #AI코딩
Claude Code 토큰 절약법
“그냥 막 말하면 안 되나요?” 싶은 분을 위한 사용량 최적화 가이드
Claude Code를 처음 쓰면 AI가 알아서 다 이해해주는 것처럼 느껴져요.
그런데 그 대화와 코드 읽기에는 모두 토큰이 쓰이죠.
토큰이 뭔지, 사용량은 어디서 보는지, Sonnet/Opus 4.7은 어떻게 나눠 써야 하는지 입문자 눈높이로 정리했습니다.
· 2026-05 기준 · 읽는 데 약 4분
안녕하세요, 인프런입니다.
클로드 코드를 쓰다보면 한번쯤은 "you've hit your limit" 이라는 메시지를 보게 될 텐데요.
이런 경우, 내가 하던 작업을 더 이상 진행할 수 없어 막막해지는 경우가 상당히 많이 생깁니다. 저만 해도 지난 일주일동안, 한도 제한 메시지를 2번 경험한 적이 있네요 하하..

응? 토큰? 사용량?
Claude Code는 알아듣기 위해 여러분의 말, 이전 대화, 코드 파일, 에러 로그, 도구 실행 결과를 계속 읽어요. 이때 AI가 읽고 쓰는 말 조각을 토큰이라고 부릅니다. 토큰을 너무 많이 쓰면 사용량이 빨리 줄고, API 사용자는 비용도 늘어나요.
클로드 코드에 입문하시는 분들이라면 토큰/사용량 에 대해서 반드시 알아가셔야 합니다. AI는 무한정 답을 뱉어주지 않아요. 요금제가 낮을수록 사용량도 적기에 더더욱 효율적으로 사용하는 게 중요하고요. 이 글에서는 토큰이 뭔지, 사용량은 어디서 어떻게 보는지, 왜 입문자는 Sonnet으로도 충분한지, 그래서 지금 어디서부터 챙기면 되는지를 한 번에 정리해 드릴게요.
① 토큰의 정의
토큰은 AI가 문장을 이해하기 위해 글을 잘게 나눈 단위예요. 사람은 “Claude Code 사용량 줄이는 법”을 한 문장처럼 읽지만, AI는 이 문장을 여러 조각으로 나눠서 읽어요. 한글, 영어, 코드, 기호, 줄바꿈도 모두 토큰으로 계산될 수 있어요.
Claude Code는 일반 채팅 AI보다 토큰을 더 많이 쓸 수 있어요. 단순히 질문에 답하는 것이 아니라, 프로젝트 파일을 읽고, 터미널 명령 결과를 보고, 에러 로그를 해석하고, 수정한 코드를 다시 확인하기 때문이에요.
“난 그냥 AI한테 몇 마디 했을 뿐인데?”라고 느껴도, Claude Code 입장에서는 그 짧은 마디를 처리하기 위해 꽤 많은 자료를 함께 읽었을 수 있어요.
② 그냥 AI한테 우다다 얘기하면 왜 안 될까요?
물론 내가 원하는 걸 자유로이 얘기해도 됩니다. 처음 배울 때는 편하게 말해보는 게 좋아요. 다만 오래 쓰다 보면 “대화를 편하게 하는 것”과 “불필요한 내용을 계속 들고 다니는 것”은 구분해야 해요.
예를 들어 친구와 메신저를 한다고 생각해볼게요. 오늘은 여행, 내일은 회사 보고서, 모레는 이사 이야기를 합니다. 그런데 이 대화를 기억하지 못하고, 매번 이전 대화를 전부 다시 읽고 답해야 한다면 어떨까요? 답은 더 느려지고, 읽어야 할 내용도 많아지고 머릿속이 흐릿해질 거예요. "그게 뭐였더라?" 식으로 말이죠.
Claude Code도 비슷해요. 오래된 대화, 이미 끝난 작업의 코드, 지금 문제와 상관없는 로그가 남아 있으면 다음 요청에서도 그 맥락이 함께 들어갈 수 있어요. Anthropic 공식 문서도 토큰 비용이 컨텍스트 크기에 따라 커진다고 설명해요. (Claude Code Docs의 비용 관리)
토큰 절약의 핵심은 “말을 아끼자”가 아니라, “지금 작업에 필요한 내용만 보여주자”에 가까워요.
③ Claude Code 사용량은 어디서 확인하나요?(CLI/웹/앱)

클로드 코드 CLI 안에서 현재 세션의 토큰 사용량을 보려면 /usage를 입력하면 돼요. 이 명령은 현재 세션에서 사용한 토큰, API 기준 추정 비용, 소요 시간 같은 정보를 보여줍니다.(*구독제는 별도 결제가 아닌 이상 API 비용이 별도 청구되지 않으니 안심하세요.)
클로드는 클로드 코드와 사용량을 공유하기에 클로드 데스크탑 또는 웹에서 사용량 확인도 가능한데요, 사이드바의 프로필을 누르고, 설정을 눌러 사용량을 보시면 됩니다.


사용량 체크 포인트 3가지
- /usage : 지금 세션에서 얼마나 썼는지 확인
- Claude Console : API 사용자의 실제 청구 기준 확인
- Pro/Max 사용량 막대 : 구독 요금제 사용량 흐름 확인
*단, /usage 에 나오는 달러 금액은 로컬에서 계산한 추정치예요. 실제 청구 금액과 다를 수 있으므로, API 사용자는 Claude Console의 사용량 페이지를 함께 확인해야 해요.
Pro·Max 구독자는 사용량이 요금제에 포함되어 있어, 세션의 비용 숫자가 곧바로 결제 금액을 뜻하지는 않아요. 그래도 사용량 막대가 빨리 줄어든다면 “지금 너무 과하게 사용하고 있나?”를 점검해볼 필요가 있어요.
④ 클로드의 모델과 /effort(노력)
Claude에는 여러 모델이 있어요. 단순하게 보면 “성능과 비용이 다른 AI 모드”로 이해하면 됩니다.
- Haiku : 빠르고 저렴한 모델
- Sonnet : 일상적인 코딩에 잘 맞는 균형형 모델
- Opus : 어렵고 복잡한 일을 맡기는 추론 맞춤형 고성능 모델
특히 Opus는 더 깊게 생각하고 길게 검토하는 작업에 자주 쓰이기 때문에 실제 사용에서는 더 많은 사용량으로 이어지기 쉽고, Opus 4.7로 업그레이드 되면서 4.6 버전보다 토큰을 최소 1.35배 더 많이 사용하게 됐어요.
| 모델 | 입력 토큰 | 출력 토큰 | 초보자식 이해 |
|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $25 / MTok | 어려운 문제용 고성능 모드 |
| Claude Sonnet 4.6 | $3 / MTok | $15 / MTok | 대부분의 코딩에 충분한 기본 모드 |
| Claude Haiku 4.5 | $1 / MTok | $5 / MTok | 짧고 단순한 작업용 가벼운 모드 |
추론 /effort 레벨도 토큰에 큰 영향을 미칩니다
앤트로픽의 /effort(노력) 에 대한 공식적인 문서에는 effort 매개변수, 즉 레벨의 설정에 따라 모든 토큰에 영향을 미친다고 설명했는데요. 사람들이 가장 많이 사용하는 모델인 Opus/sonnet 두 모델의 /effort 기본값 자체가 high로 설정되어 있으므로, 단순한 작업에도 추론 레벨이 높아지면 토큰을 많이 사용하게 된다는 걸 의미합니다.
Towards AI 라는 블로거는 /effort 레벨을 Max로 설정하면 토큰이 2.7배까지 차이날 수 있다고 언급했어요.
https://pub.towardsai.net/i-tested-all-5-effort-levels-of-claude-opus-4-7-2f335c626786
노력 매개변수는 다음을 포함한 모든 토큰에 영향을 미칩니다:
- 텍스트 응답 및 설명
- 도구 호출 및 함수 인수
- 확장 사고(활성화된 경우)
이 접근 방식에는 두 가지 주요 이점이 있습니다:
- 사용하기 위해 사고를 활성화할 필요가 없습니다.
- 도구 호출을 포함한 모든 토큰 지출에 영향을 미칠 수 있습니다. 예를 들어, 더 낮은 노력은 Claude가 더 적은 도구 호출을 수행한다는 의미입니다. 이는 효율성에 대한 훨씬 더 큰 제어 수준을 제공합니다.

Opus 4.7/xhigh을 계속 켜두면 안 되나요?
Opus 4.7은 좋은 모델이에요. Anthropic도 복잡한 코딩·에이전트 워크플로우·전문 업무에 강한 프리미엄 모델로 소개해요. 다만, “좋으니까 항상 켜둬야지" 라고 생각해 단순한 작업에도 Opus를 사용하면 사용량이 급격히 증가할 수 있어요.
비유하자면 동네 편의점에 매번 최고급 스포츠카를 부르는 느낌이에요. 갈 수는 있지만, 간단한 이동에는 지하철이나 택시로도 충분하죠. 파일 이름 바꾸기, 간단한 버그 수정, 테스트 추가, 코드 설명, README 정리 같은 일은 Sonnet으로도 충분한 경우가 많아요.
→ 처음부터 Opus 4.7을 쓰지 말고, Sonnet으로 시작하세요. 정말 막히면 그때 Opus를 꺼내세요.
⑤ 지금 바로 할 수 있는 토큰 절약법 10가지
클로드 코드 사용량이 항상 걱정이었다면, 아래 10가지로 토큰 절약을 바로 시작해보세요!
1. 대화가 너무 길어지거나, 작업이 바뀌면 /clear를 쓰세요.
앞에서 클로드 코드는 대화 세션을 읽는데에도 토큰을 사용한다고 말씀드렸었는데요. 대화가 너무 길어지면 무거워지고, 왜이러지 싶을 정도로 성능이 굉장히 나빠집니다.
로그인 기능을 하다 갑자기 아예 다른 주제로 디자인 수정으로 넘어간다면, 차라리 새 대화로 시작하는 편이 가벼워요. 그럴 때는 /clear 를 통해 대화를 지우고 새로 세션을 시작해주세요.
*길게 이어야하는 중요한 작업인데... 여기서 끊기면 안 돼요. 이럴 때는 어떡하나요?
만약 작업의 컨텍스트가 끊기면 안 되는 경우, 클로드에게 "지금까지 한 작업 요약과 앞으로 할 일을 .md 파일로 저장해줘. 그 다음 작업부터 이 문서를 읽고 이어나갈 거야" 라고 이야기해주세요.
그러면 클로드가 생성해준 md 파일을 참조해서 다음 작업부터 읽게 하면 컨텍스트가 유지되고 작업을 이어서 진행할 수 있습니다.
2. 에러 로그는 전부 붙이지 마세요.
처음 500줄보다 “실패한 테스트 이름 + 핵심 에러 메시지”가 더 도움이 될 때가 많아요. 특히 디버깅할 때 콘솔 에러 메시지를 전부 복사 붙여넣기 하는 것보다, 어느 줄에서 문제가 발생했는지와 에러 메시지만 주는 것이 토큰 활용에 훨씬 좋습니다.
3. “전체 코드 봐줘”보다 파일을 찍어주세요.
“/script/main.js만 먼저 봐줘” 또는 "기획하기 전에 내용은 @PRD.md를 먼저 읽어줘" 처럼 범위를 좁히면 토큰을 아낄 수 있어요. IDE를 사용할 경우, 사이드바에서 파일을 직접 지정하거나 경로를 붙여넣는 식으로 특정 파일을 지정할 수도 있습니다.
4. 원하는 결과를 먼저 말하세요.
“회원가입 버튼을 누르면, 이메일 검증 후 다음 화면으로”처럼 목표가 분명하면 헤매는 시간이 줄어요.
5. 긴 작업은 중간에 한번 요약시키세요.
/compact 를 써서 대화의 핵심만 남겨서 압축시키면 토큰 점유가 훨씬 낮아집니다. 또는 “지금까지 결정한 것만 짧게 정리해줘”라고 요청하면 돼요. 1번의 문서를 남겨서 읽게 하는 것과 비슷합니다.
6. 처음 모델은 Sonnet으로 두세요.
일상적인 코딩은 Sonnet으로 충분한 경우가 많아요.
7. Opus는 “막혔을 때” 쓰세요.
설계가 어렵거나, Sonnet이 계속 오류를 내거나, 중요한 리뷰가 필요할 때 Opus를 사용하면 돼요. 실제로 Pro 요금제를 구독하시는 분들은, 긴 세션에서 Opus를 10번 이상 사용하지 못할 수도 있어요. 모델 변경은 /model 로 교체할 수 있어요.
8. 여러 AI 작업을 동시에 많이 띄우지 마세요.
서브에이전트 작업이 많아질수록 각자 읽는 맥락이 늘어나요.
9. 반복되는 프롬프트 패턴이 있다면, .md 형태로 문서에 정리해서 그 문서를 읽거나 스킬로 만들어버리세요.

매번 긴 규칙과 텍스트를 붙여넣으면 그 자체와 함께 읽는 과정 모두가 토큰이 되기 때문에 사용량도 빠르게 소모되고, 무엇보다 작업하시는 분들이 가장 힘들어질 수 있어요. /init 을 타이핑해서 CLAUDE.md 파일이 만들어지면 거기에 클로드가 모든 작업을 시작하기 전 읽어야 할 중요한 원칙을 적어두는 걸 추천합니다. 새로운 직원이 왔을 때 매번 구두로 설명하는 것보다, 인수인계서나 메뉴얼을 만들어두면 그 메뉴얼을 읽고 작업을 하는 것과 동일해요.
또는, 작업별로 기획안이나 중요하게 참고해야 하는 문서들은 폴더를 만든 뒤에 .md 파일로 관리해두세요. 디자인이라면 /design/wireframe.md 및 ui-ux.md, 코딩이라면 /code/~ 등등 말이죠. CLAUDE.md 가 작업을 읽을 때 특정 작업일 때만 특정 폴더의 카테고리를 참조하게 하면, 파일 전체를 읽지 않고 적은 토큰으로 바로 원칙을 적용할 수 있습니다.
만약 글로벌한 작업이 아니라 특정 환경에서 적용할 반복되는 패턴이 있다면, Skills 를 만들어서
10. 복잡한 작업 전에는 Plan mode를 활용하세요.

AI가 잘못 이해한 채 20분 동안 작업을 진행한 뒤, "아 잘못됐어..." 식으로 계속 고치면 토큰을 금방 소모하게 될 거예요. Shift + Tab을 눌러서 Plan mode를 통해, 계획을 먼저 하고 살을 덧붙이며 진행하는 게 가장 저렴하고 구현이 빠릅니다.
기본은 Sonnet으로 만들고, 기획이 필요하거나 알잘딱이 필요하다면 Opus로 한 번 물어보세요. Sonnet에게 먼저 “이 기능 만들어줘”를 맡기고, 어느 정도 결과가 나오면 Opus에게 “이 설계에서 위험한 점이 있는지 리뷰해줘”라고 물어보는 방식이에요. 비용은 덜 쓰면서도 중요한 순간에는 더 강한 모델의 도움을 받을 수 있어요.
Claude Code는 편하게 말해도 잘 알아들어요. 그래서 처음에는 마음껏 물어봐도 됩니다. 다만 익숙해질수록 “지금 이 문제를 해결하는 데 필요한 파일·에러·목표만 보여주기”를 연습하면 사용량을 훨씬 오래 가져갈 수 있어요.
👇 Claude Code 입문이라면, 이 강의들 👇
사용량 관리부터 프롬프트·권한·컨텍스트 운영까지 차근차근 시작해보세요!