1 / 6
Claude Code Feature

Prompt
Caching

Tại sao mỗi tin nhắn không cần đọc lại toàn bộ codebase từ đầu — và điều đó tiết kiệm cho bạn như thế nào.

↓ 90% input token cost sau cache hit
↓ 85% latency khi load context
⚡ auto không cần config gì
Vấn đề: Mỗi message tốn full token
Không có caching
📄 CLAUDE.md + Project Structure~8,000 tokens
// Đọc lại từ đầu mỗi message ↗
📁 50 source files context~42,000 tokens
// Re-read toàn bộ ↗
💬 Message của bạn~50 tokens
"Fix the null pointer in UserService.ts"
50,050Tokens / Msg
~$0.15Chi phí
3–5sLatency
Giải pháp: Chỉ tính token phần mới
Với Prompt Caching ✓
📄 CLAUDE.md + Project Structure⚡ CACHED
// Load từ cache — không tính token ✓
📁 50 source files context⚡ CACHED
// Giảm 90% token cost ✓
💬 Message của bạn~50 tokens
"Fix the null pointer in UserService.ts"
50Tokens / Msg
~$0.0001Chi phí
<1sLatency
Số liệu cụ thể
+25%
Chi phí write lần đầu — chỉ 1 lần
-90%
Giảm input token mọi lần đọc cache
-85%
Giảm latency khi load context
📋CLAUDE.md + Project Structure
BP 1 & 2
📁Source files context
BP 3
💬Conversation + Message mới
DYNAMIC
Diễn ra thế nào qua các message?
M1

Message đầu — Write cache (+25%)

Claude đọc context lần đầu, ghi vào cache. Tốn 125% token — đây là lần duy nhất trả giá cao hơn.

M2

Message thứ 2 — Cache hit, tiết kiệm bắt đầu

Static context load từ cache. Chỉ tính token cho message mới.

M3+

Message 3+ — Full benefit

Static context cached (-90%). Nhưng history tích lũy dần. Dùng /compact để nén.

Idle >5 phút — Cache expire

Cache có TTL 5 phút. Message tiếp theo sẽ write lại từ đầu tự động.

🔄

Tự động hoàn toàn

Claude Code tự đặt breakpoint và quản lý cache. Không cần config gì.

Tóm lại — nhớ 3 điều này
1. Write một lần, đọc nhiều lần.
Lần đầu tốn thêm 25% để ghi cache, nhưng từ message thứ 2 chỉ tính token cho phần mới.
2. Cache TTL là 5 phút.
Idle quá 5 phút → cache expire → write lại từ đầu. Không cần làm gì, Claude tự xử lý.
3. Session dài vẫn tốn token.
Static context được cache, nhưng conversation history thì không. Dùng /compact để nén khi cần.
🎙 Voiceover