Tiết kiệm token bằng cách áp dụng Agile vào Claude
"Token cũng giống như tiền — bạn có thể tiêu nó vào những cuộc trò chuyện 10.000 từ chẳng đi đến đâu, hoặc đầu tư nó vào những sprint ngắn mang lại giá trị thực."
Vấn đề: tại sao bạn đốt token mà không nhận ra?
Nếu bạn từng dùng Claude (hoặc bất kỳ LLM nào) trong công việc thực tế, bạn sẽ nhận ra một sự thật khó chịu: phần lớn token bạn tiêu là token lãng phí.
Một số kịch bản quen thuộc:
Bạn paste cả 5.000 dòng code vào chat chỉ để hỏi sửa 1 hàm
Bạn viết một prompt dài 800 từ mô tả "ứng dụng mơ ước" rồi bực mình khi Claude trả lời chung chung
Bạn chat 50 lượt trong cùng một conversation, mỗi lượt context lại phình to thêm
Bạn hỏi đi hỏi lại cùng một thứ ở các chat khác nhau vì không lưu lại template
Vấn đề không nằm ở Claude. Vấn đề nằm ở cách tiếp cận. Và may mắn là, thế giới phần mềm đã có sẵn một bộ công cụ tư duy được thiết kế chính xác cho bài toán này: Agile.
Tại sao Agile lại phù hợp?
Agile sinh ra để giải quyết một bài toán cũ kỹ trong ngành phần mềm: làm sao tạo ra giá trị nhanh nhất với nguồn lực ít nhất, trong điều kiện yêu cầu liên tục thay đổi?
Đây cũng chính xác là bài toán khi làm việc với Claude:
Trong dev team Khi dùng Claude Thời gian developer Token + thời gian chờ Yêu cầu mơ hồ từ khách Prompt mơ hồ từ chính bạn Code 6 tháng rồi vứt đi Generate 2.000 dòng code rồi không dùng Sprint 2 tuần Mỗi conversation là một sprint
Khi bạn map đúng tư duy, bạn sẽ thấy Agile không chỉ là "framework cho team", mà là một triết lý tối ưu nguồn lực mà freelancer 1 người làm việc với AI rất cần.
6 nguyên tắc Agile áp dụng cho prompt
1. MVP trước, polish sau
Đừng bao giờ bắt đầu bằng câu "Viết cho tôi một website Next.js + Supabase với authentication, dashboard, payment, blog, và admin panel."
Đó là cách đốt 50.000 token để nhận về một mớ code generic mà bạn sẽ phải sửa lại 80%.
Thay vào đó, đi theo lát cắt mỏng (vertical slice):
Sprint 1: Một trang landing tĩnh, không styling cầu kỳ
Sprint 2: Thêm form đăng ký kết nối Supabase
Sprint 3: Auth flow
Sprint 4: Styling và animation
Mỗi sprint = một prompt rõ ràng. Bạn kiểm tra output ngay, sửa ngay, không tích lũy nợ kỹ thuật.
2. User Story thay vì đoạn văn dài
Format kinh điển của Agile:
As a [vai trò], I want [tính năng] so that [lý do/giá trị].
Áp dụng vào prompt:
❌ "Tôi muốn một trang web cho khách hàng của tôi, người ấy bán đồ thủ công và muốn trông chuyên nghiệp, hiện đại, có gì đó ấm áp..."
✅ "Là một thợ thủ công, tôi muốn một landing page Next.js để khách có thể xem 6 sản phẩm nổi bật và đặt liên hệ qua form, để tôi không cần dùng Facebook để chốt đơn nữa."
Cái thứ hai cho Claude mục đích, ràng buộc, và tiêu chí thành công — chỉ trong 1 câu.
3. Definition of Done rõ ràng
Trong Scrum, không có Definition of Done = task không bao giờ kết thúc. Trong Claude, không có DoD = câu trả lời sẽ lan man, đẩy bạn vào vòng lặp "à còn thiếu cái này...".
Trước khi viết prompt, tự hỏi: "Output trông như thế nào thì tôi coi là xong?"
Ví dụ: "Done = một file Hero.tsx dưới 80 dòng, dùng Tailwind, có 1 heading + 1 sub-text + 1 CTA button, không có placeholder lorem ipsum."
Cụ thể đến mức này, Claude không có không gian để "bịa" thêm.
4. Sprint ngắn — đừng nhồi nhét vào 1 conversation
Đây là bí mật ít người để ý: mỗi tin nhắn mới trong cùng một chat đều mang theo TOÀN BỘ context phía trước. Conversation càng dài, mỗi câu hỏi mới càng đắt.
Quy tắc đơn giản:
Một mục tiêu = một conversation
Khi chuyển task (ví dụ: từ "design logo" sang "viết caption Instagram"), mở chat mới
Khi conversation đã đi xa khỏi mục tiêu ban đầu, mở chat mới
Dùng Project để giữ context cố định thay vì paste lại mỗi lần
Đây là phiên bản "Sprint Boundary" của Agile: không cho phép scope của sprint này tràn sang sprint khác.
5. Backlog Prioritization
Trước khi mở Claude, hãy có một backlog tasks. Sắp xếp theo ưu tiên. Chỉ làm cái trên cùng.
Đừng cố hỏi 5 thứ trong 1 prompt với hy vọng "tiết kiệm thời gian". Bạn không tiết kiệm được gì — Claude sẽ trả lời nông cho cả 5 thứ thay vì sâu cho 1 thứ. Và bạn vẫn phải hỏi lại.
6. Retrospective — lưu lại template
Sau mỗi sprint, dev team họp retrospective: cái gì work, cái gì không. Bạn cũng nên làm vậy với prompt.
Prompt nào cho ra output tốt → lưu lại như một component. Bạn đang làm freelancer branding + web, bạn nên có sẵn:
Template prompt cho moodboard concept
Template prompt cho component React
Template prompt cho caption đa nền tảng (cùng nội dung, format khác nhau cho IG/LinkedIn/Threads)
Template prompt cho Supabase RLS policy
Lần sau gặp task tương tự, bạn paste template + thay biến. Tiết kiệm 70% token, đảm bảo output đồng đều.
Anti-pattern cần tránh
Một vài thói quen "đốt token" mà tôi thấy phổ biến nhất:
The Wall of Text: paste cả file 1.000 dòng khi chỉ cần 20 dòng liên quan
The Mind Reader Request: "Bạn hiểu ý tôi mà" — không, Claude không hiểu, và nó sẽ đoán
The Context Hoarder: giữ một conversation chạy hàng tuần cho mọi loại task
The Perfect-on-First-Try: prompt dài 1.000 từ mô tả mọi edge case, thay vì iterate
Mỗi cái này đều vi phạm một nguyên tắc Agile: tương ứng là YAGNI, làm rõ yêu cầu, sprint boundary, và iterative delivery.
Bonus: áp dụng cho công việc freelancer của bạn
Vì bạn đang làm branding + web với Next.js/Supabase, đây là cách áp dụng cụ thể:
Branding project:
Sprint 1: Brand discovery (1 prompt → mô tả persona + tone of voice)
Sprint 2: Concept logo (3 hướng, mỗi hướng 1 đoạn mô tả ngắn)
Sprint 3: Color palette + typography
Sprint 4: Content template cho 3-4 nền tảng
Đừng bao giờ làm Sprint 4 trước Sprint 1. Token bạn tiết kiệm được = thời gian bạn có thể dùng để take thêm dự án.
Web project (Next.js + Supabase):
Backlog rõ: schema → auth → một CRUD flow → UI → polish
Mỗi flow là một conversation riêng
Lưu lại pattern Supabase RLS, pattern Server Action, pattern form validation thành template
Kết
Agile không phải là daily standup hay sticky note màu vàng. Cốt lõi của nó là một câu hỏi đơn giản: "Làm thế nào để tạo ra giá trị nhỏ nhất có thể kiểm chứng, càng nhanh càng tốt?"
Khi bạn áp dụng câu hỏi đó vào mỗi prompt, bạn không chỉ tiết kiệm token. Bạn tiết kiệm thứ quý hơn nhiều: năng lượng tinh thần để ra quyết định.
Mà với một freelancer kiêm founder đang trên đường khởi nghiệp, đó mới là tài nguyên hữu hạn nhất.