Khi các mô hình AI ngày càng mạnh hơn, chúng ta kỳ vọng chúng có thể xử lý những tác vụ phức tạp và kéo dài — như xây dựng toàn bộ ứng dụng web, phát triển các công cụ nội bộ, hoặc điều phối các quy trình kéo dài nhiều ngày.

Tuy nhiên, hầu hết các AI agent hiện nay lại hoạt động theo từng phiên (per-session). Điều này có nghĩa là:

  • Mỗi khi agent bắt đầu một phiên làm việc mới, nó không thể ghi nhớ đầy đủ những gì đã thực hiện trước đó.
  • Đối với các tác vụ kéo dài hàng giờ hoặc nhiều ngày, điều này rất dễ dẫn đến việc lặp lại công việc, bỏ sót bước, hoặc hiểu sai rằng một phần công việc đã hoàn thành.

Giải quyết vấn đề này, Anthropic giới thiệu một giải pháp gọi là “harness” — một khung quy trình (workflow framework) được thiết kế để giúp AI hoạt động ổn định và nhất quán qua nhiều phiên làm việc.

1. Vấn đề cốt lõi – Vì sao AI dễ quên và trở nên thiếu ổn định

Các mô hình như Claude, GPT hoặc Gemini đều có giới hạn cửa sổ ngữ cảnh (context window).
Khi lịch sử phiên làm việc vượt quá giới hạn này, mô hình sẽ dần mất khả năng ghi nhớ:

  • Những gì đã hoàn thành,
  • Trạng thái hiện tại của dự án,
  • Các tác vụ còn lại,
  • Và cách các file hoặc thành phần liên quan với nhau.

Trong các dự án kéo dài, điều này khiến mô hình phải “đoán mò” — dẫn đến:

  • Hiểu sai trạng thái công việc,
  • Gán nhầm tiến độ,
  • Hoặc vô tình làm hỏng những phần đã hoạt động đúng trước đó.

Vì vậy, khi không có cấu trúc hỗ trợ bổ sung, các tác vụ dài hạn trở nên dễ vỡ, thiếu tin cậy và dễ phát sinh lỗi.

2. Giải pháp Harness – Một quy trình làm việc chuyên nghiệp cho AI Agent

Harness cung cấp cấu trúc mà các AI agent hiện nay đang thiếu.
Cách nó hoạt động tương tự như cách một team phát triển phần mềm tổ chức dự án:

  • Progress logs để theo dõi những gì đã hoàn thành và những gì còn dang dở,
  • Danh sách tính năng (feature list) chi tiết,
  • Lịch sử Git để quản lý phiên bản,
  • Các phiên làm việc theo từng bước nhỏ (incremental progress sessions),
  • Môi trường làm việc ổn định, sạch sẽ ở mỗi lần chạy.

Tóm lại: harness giúp AI hoạt động như một lập trình viên chuyên nghiệp, có quy trình rõ ràng, làm việc cẩn thận—không làm ẩu hoặc phá hỏng trạng thái dự án giữa các phiên làm việc.

3. Cách tiếp cận của Anthropic – Harness hoạt động như thế nào

Hệ thống harness bao gồm hai tác nhân chính:

3.1. Initializer Agent – Tác nhân khởi tạo

Trong phiên làm việc đầu tiên, agent này sẽ thực hiện:

  • Tạo cấu trúc thư mục dự án và các script khởi tạo (ví dụ: init.sh),
  • Tạo file log tiến độ (ví dụ: claude-progress.txt),
  • Khởi tạo Git repository và tạo commit đầu tiên,
  • Xây dựng danh sách tính năng (feature list) dựa trên yêu cầu ban đầu.

Sau khi quá trình khởi tạo hoàn tất, vai trò của agent này coi như kết thúc.

3.2. Coding Agent – Tác nhân lập trình

Trong các phiên làm việc tiếp theo, coding agent sẽ:

  • Đọc file log tiến độ,
  • Kiểm tra lịch sử Git,
  • Xem danh sách tính năng còn lại,
  • Chọn một tính năng phù hợp để thực hiện trong phiên làm việc hiện tại,
  • Triển khai code mới hoặc chỉnh sửa code hiện có,
  • Chạy test và xử lý lỗi,
  • Commit thay đổi vào Git,
  • Cập nhật log tiến độ và đảm bảo môi trường làm việc luôn sạch (clean state).

Nhờ quy trình này, dự án được phát triển một cách ổn định và tuần tự — ngay cả khi mỗi phiên làm việc diễn ra ngắn, hoặc bị gián đoạn giữa chừng.

The current image has no alternative text. The file name is: f94c2257964fb2d623f1e81f874977ebfc0986bc-1920x1080-1.gif

4. Lợi ích – Vì sao Harness quan trọng

Framework harness mang lại nhiều ưu điểm nổi bật:

✔ Tiến độ dài hạn ổn định và đáng tin cậy

Agent không còn bị mất trạng thái giữa các phiên làm việc.

✔ Giảm lỗi và tăng tính nhất quán

Lịch sử Git và progress log giúp trạng thái dự án minh bạch, ổn định.

✔ Xử lý tốt các dự án phức tạp, nhiều bước

Ví dụ như xây dựng một web-app hoàn chỉnh hoặc hệ thống đa module.

✔ Con người dễ dàng giám sát

Kỹ sư có thể nhanh chóng hiểu trạng thái hiện tại của dự án ở bất kỳ thời điểm nào.

✔ Tăng tính an toàn và khả năng dự đoán

Phát triển theo từng bước nhỏ (incremental development) giảm rủi ro hỏng cấu trúc hoặc phá vỡ chức năng đã hoạt động.

5. Hạn chế & Các câu hỏi còn bỏ ngỏ – Những điểm cần tiếp tục cải thiện

Mặc dù harness mang lại nhiều lợi ích, nó vẫn có những hạn chế:

  • Hiện tại harness hoạt động hiệu quả nhất trong các tác vụ phát triển web-app hoặc full-stack.
  • Các mảng như nghiên cứu, quy trình data-science, hay automation phức tạp có thể cần các loại agent chuyên biệt hơn.
  • Tương lai có thể xuất hiện harness đa-agent bao gồm:
    • agent kiểm thử (testing agent)
    • agent QA
    • agent cleanup / refactor
    • agent lập kế hoạch kiến trúc (architecture planning agent)
  • Những dự án kéo dài hàng tuần hoặc hàng tháng vẫn là thách thức.

Đây đều là những chủ đề đang được cộng đồng AI nghiên cứu và phát triển thêm.

6. Kết luận – Harness: Nền tảng cho thế hệ AI Agent tương lai

Harness là một bước tiến quan trọng giúp AI:

  • Làm việc xuyên suốt nhiều phiên,
  • Duy trì tiến độ có cấu trúc,
  • Xây dựng được các dự án phần mềm thực sự,
  • Và chuyển mình từ công cụ xử lý “1 lần là xong” thành cộng tác viên đáng tin cậy.

Khi AI ngày càng mạnh hơn, khả năng hoạt động liên tục trong nhiều ngày, nhiều tuần, thậm chí nhiều tháng sẽ trở thành yếu tố thiết yếu — và một harness được thiết kế đúng sẽ trở thành xương sống của mô hình agent trong tương lai.

Tags:

Leave a Reply

Your email address will not be published. Required fields are marked *