나는 2월에 토큰을 얼마나 썼나

12 min read
TL;DR
  • 캐시 제외 603.8M / 캐시 포함 2.11B 토큰, API 환산 추정 비용 $1,962.01
  • 피크는 새벽 1시(동부시간) — 취침 전 자동화→새벽 실행 패턴 영향
  • 캐시 제외는 Codex 99.74%지만, 캐시 포함이면 Claude가 44.53%까지 상승
Cover

개인 프로젝트를 여러 개 동시에 돌리다 보니 문득 궁금해졌습니다. “내가 이번 달에 토큰을 얼마나 쓴 거지?” 구독제를 쓰고 있어서 과금 걱정은 상대적으로 덜하지만, 사용 패턴을 파악하면 워크플로우 최적화에 도움이 될 것 같았습니다.

로컬에 쌓인 세션 로그를 동부시간 기준으로 정리해 2월 한 달치 데이터를 뽑았습니다. (표기 편의상 본문에서는 EST로 통칭하겠습니다.)

먼저 용어부터 정리하면,

  • 캐시 제외 = input + output
  • 캐시 포함 = 캐시 제외 + cache_read + cache_write

입니다.

2월 사용량 분석

핵심 수치부터

항목
총 토큰 (캐시 제외)603,760,491
총 토큰 (캐시 포함)2,108,917,715
피크 시간 (EST)새벽 1시
피크 사용량71,280,115
API 환산 추정 비용$1,962.01

캐시 제외 기준으로 약 603.8M 토큰을 사용했습니다. 캐시까지 포함하면 2.11B 토큰이 넘지만, “실제 새로 처리한 분량”에 가까운 건 캐시 제외 수치입니다. 숫자 자체보다 패턴이 더 흥미롭습니다.

2월 전체 토큰 사용량 요약

인포그래픽

인포그래픽 보기

Codex vs Claude, 캐시가 가르는 차이

캐시 제외 기준으로 보면 Codex가 압도적입니다.

기준CodexClaude
캐시 제외602,189,887 (99.74%)1,570,604 (0.26%)
캐시 포함1,169,852,991 (55.47%)939,064,724 (44.53%)

캐시를 빼면 Codex가 99.74%를 차지하지만, 캐시를 포함하면 Claude가 44.53%까지 올라옵니다. 즉 실제 새로운 처리량은 Codex 중심이고, 캐시 재사용량은 Claude 비중이 매우 높은 구조입니다.

Claude Code로 긴 컨텍스트를 유지하며 작업할 때 캐시 히트율이 높기 때문에 이런 결과가 나온 것 같습니다. 캐시 덕분에 “처리 비용” 관점에서는 실제 부담이 꽤 낮아지고 있다는 뜻이기도 합니다.

Codex와 Claude의 처리 방식 차이와 캐시 패턴

왜 Claude Code는 캐시를 이렇게 많이 쓰는 걸까

수치를 보고 나서 “이게 진짜 맞나?” 싶어서 원인을 찾아봤습니다.

Claude Code는 세션을 시작할 때 시스템 프롬프트, 18개 이상의 툴 정의, git 히스토리, CLAUDE.md 등을 포함한 2만 토큰+ 프리픽스를 구성합니다. 이 프리픽스는 세션 전반에 걸쳐 동일하게 유지되고, Claude Code는 “워밍업 스텝”을 먼저 실행해 이 프리픽스를 캐시에 올려두는 방식으로 설계되어 있습니다.

핵심은 컨텍스트 컴팩션 동작 방식입니다. 컨텍스트 윈도우가 꽉 찼을 때 Claude Code가 대화를 요약(컴팩션)하는데, 이때도 시스템 프롬프트·툴 정의·CLAUDE.md는 부모 세션과 동일하게 유지됩니다. 즉 컴팩션 후에도 이 프리픽스의 KV 캐시가 그대로 재사용됩니다.

캐시 히트가 발생하면 캐시된 토큰은 일반 input 토큰의 10% 비용만 청구됩니다. 반면 Codex는 구조상 매 요청마다 새로운 컨텍스트를 처리하는 방식이라 캐시 재사용보다 실제 처리량이 압도적으로 높게 나오는 편입니다. 두 도구의 아키텍처 차이가 수치로 그대로 드러난 셈입니다.

새벽 1시에 무슨 일이?

Top 5 시간대(캐시 제외)를 보면 새벽 1~2시가 피크입니다.

Rank시간 (EST)토큰
101:0071,280,115
202:0048,578,199
308:0043,119,144
411:0043,112,864
512:0042,137,591

자기 전에 최대한 자동화 세팅을 해놓고 자다 보니 새벽에 높은 사용량이 나온 것 같습니다. 보통 육아 때문에 10~11시면 지쳐서 자는 편인데, 금요일·토요일 새벽처럼 “늦게 잘 수 있는 날”에 자동화도 걸고 직접 작업도 몰아서 하다 보니 피크가 더 커졌습니다.

블록 기준으로 보면 12:00~17:00 구간이 31.63%로 가장 큽니다.

시간대 (EST)토큰비중
00-05164,659,60327.27%
06-11157,139,18126.03%
12-17190,989,76231.63%
18-2390,971,94515.07%

어떻게 집계했나

세 가지 방식으로 확인했습니다. Claude 로그, Codex 로그, 그리고 ccusage와 CodexBar 같은 서드파티 라이브러리입니다.

  • Claude: ~/.claude/projects/**/*.jsonl
    • (sessionId, requestId) 단위로 묶고, 같은 요청 내 중간/최종 usage가 섞이는 문제는 필드별 최대값으로 해소
  • Codex: ~/.codex/sessions/**/*.jsonl
    • total_token_usage가 누적치라서 세션 내 시간순 정렬 후 델타(증분)만 합산, 감소 구간은 제외
  • CodexBar: 계정 상태·일별 크레딧 확인 용도로만 참고
    • 시간대별 분해가 부족해서 시간 분석에는 사용하지 않았습니다.

Claude와 Codex의 필드명이 달라서 동일 축으로 정규화한 뒤 비교했습니다. 타임스탬프는 UTC → 동부시간으로 변환해 시간 버킷으로 집계했습니다.

분석하고 나서 드는 생각

두 도구의 사용 특성 차이가 수치로 명확하게 드러난 게 흥미로웠습니다. Codex는 “새 토큰 처리”를 거의 전담하고, Claude Code는 캐시를 적극적으로 활용하는 구조라 “처리량”보다 “재사용량”이 훨씬 크게 나오는 것 같습니다.

한도 대비 실제 소진율을 보면 또 다른 그림이 나옵니다. 이벤트로 CodexApp에서 rate limit을 2배 제공하고 있는데, 그 기준으로 Claude는 한 달 한도의 약 90%를 소진했고, Codex는 40~50% 수준에 그쳤습니다. Codex 쪽이 상대적으로 여유 있는 구조입니다. 다만 Claude는 Max x5 플랜을 쓰고 있어서, 가격 대비 사용량 관점에서는 가성비가 꽤 좋다고 느낍니다.

토큰 사용량이 이렇게 늘어난 건 OpenClaw 덕분이기도 합니다. Cron으로 반복 작업을 자동화해두거나, 외부에서 쉽게 작업할 수 있는 개인 프로젝트 시스템을 만들어놓은 덕에 유휴 시간에도 토큰이 꾸준히 소진되고 있습니다.

참고로 이 수치는 개인 작업용 랩탑 한 대에서 발생한 토큰입니다. E2E 테스트나 IDE로 Antigravity를 쓰고 있고, Gemini CLI도 별도로 사용 중인데 이쪽은 측정이 애매해서 이번 분석에서는 제외했습니다. OpenRouter/Google AI API 키로 사용한 분도 누락돼 있습니다. 회사 랩탑의 Codex/Cursor 사용량이나 다른 개인 랩탑에서 발생한 비용까지 합치면, 한 달에 꽤 많은 토큰을 태우고 있다는 걸 실감합니다.

구독 아니었으면 얼마였을까

실제 청구액이 아니라 API 단가 기준으로 환산한 추정치입니다. 현재 Max x5 플랜과 ChatGPT Pro를 쓰고 있는데, 2월 중순부터 Codex를 시작한 것치고 사용량이 상당합니다. API로 직접 쓴다고 가정하면 아래 금액이 나옵니다.

서비스추정 비용 (USD)
Codex (gpt-5.3-codex 기준)$1,223.20
Claude (ccusage calculate 기준)$738.81
합계$1,962.01

Claude 쪽은 모델별로 나눠보면 Opus 계열이 대부분을 차지합니다.

모델추정 비용 (USD)
claude-opus-4-6$479.41
claude-opus-4-5$97.25
claude-sonnet-4-5$93.52
claude-sonnet-4-6$59.00
claude-haiku-4-5$9.63

Opus가 비싼 모델이라 Claude 쪽 비용이 높게 잡히는 것 같습니다. 그래도 Max x5 플랜 구독료와 비교하면 API 직접 사용 대비 상당히 절약되는 구조입니다. Codex 역시 이벤트 기간 2배 rate limit 덕분에 한도 대비 소진율이 낮으면서 이만큼 처리했다는 게 인상적입니다.

마치며

막상 숫자로 보니 2.11B 토큰이라는 게 실감이 나네요. 패턴을 보니 흥미롭기도 하고, 앞으로 어떻게 최적화할지 아이디어도 생깁니다.

실제로는 2월 둘째주부터 제대로 쓰기 시작했으니, 3월은 더 긴데 얼마나 많은 토큰을 쓸지 기대됩니다.