← Back

CLAUDE CODE · CACHING

Prompt Caching

Tại sao Claude Code không cần đọc lại toàn bộ codebase mỗi message — và prompt caching tiết kiệm cho bạn 90% input token, 85% latency như thế nào.

2026-05-01 0:55 Claude CodePrompt CachingTokensLatency

Prompt caching là tính năng tự động trong Claude Code: phần “tĩnh” của context (CLAUDE.md, project structure, source files) được lưu lại như một checkpoint. Từ message thứ 2 trở đi, bạn chỉ trả token cho phần mới.

3 điều cần nhớ

  1. Write một lần, đọc nhiều lần. Lần đầu tốn thêm 25% để ghi cache — nhưng chỉ 1 lần. Sau đó giảm 90% input token và 85% latency.
  2. Cache TTL là 5 phút. Idle quá 5 phút → cache expire → write lại từ đầu tự động. Không cần config gì.
  3. Session dài vẫn tốn token. Static context được cache, nhưng conversation history thì không. Dùng /compact để nén khi cần.

Ai cần biết điều này?

Source