Tại sao mỗi tin nhắn không cần đọc lại toàn bộ codebase từ đầu — và điều đó tiết kiệm cho bạn như thế nào.
Claude đọc context lần đầu, ghi vào cache. Tốn 125% token — đây là lần duy nhất trả giá cao hơn.
Static context load từ cache. Chỉ tính token cho message mới.
Static context cached (-90%). Nhưng history tích lũy dần. Dùng /compact để nén.
Cache có TTL 5 phút. Message tiếp theo sẽ write lại từ đầu tự động.
Claude Code tự đặt breakpoint và quản lý cache. Không cần config gì.