Khi AI ngày càng đảm nhiệm những nhiệm vụ phức tạp và kéo dài nhiều giờ – thậm chí nhiều ngày – bài toán lớn nhất không còn là “AI có thông minh không”, mà là: AI có duy trì được tiến độ ổn định và nhất quán hay không?
Vấn đề này xuất hiện rõ nhất khi AI phải làm việc qua nhiều context windows.
Mỗi phiên chạy giống như “một bộ não mới”, không nhớ lại chính xác những gì đã diễn ra trước đó.
Anthropic đã đưa ra một giải pháp hiệu quả để xử lý vấn đề này: một harness dành cho long-running agents, giúp AI làm việc có kỷ luật và duy trì được sự liên tục qua nhiều phiên.
Vì sao AI cần cơ chế vận hành dài hạn?
Khi AI được giao nhiệm vụ dạng “dự án” – như xây dựng web app, phát triển tính năng hoặc tinh chỉnh hệ thống – mô hình phải làm việc qua nhiều phiên. Ở mỗi phiên:
- Mô hình không có trí nhớ dài hạn
- Khối lượng công việc vượt quá khả năng chứa của một context window
- Các bước tác vụ phụ thuộc vào tiến độ đã hoàn thành trước đó
Điều này dẫn đến các thất bại quen thuộc:
- Làm quá nhiều trong một lượt → mất context → phiên sau phải đoán lại
- Đánh giá sai trạng thái dự án
- Không để lại bàn giao hoặc môi trường sạch → gây lỗi lặp lại
Những vấn đề này tương tự một dự án phần mềm thiếu quy trình bàn giao — không có cách để duy trì tiến độ.
Harness là gì?
Trong nghiên cứu của Anthropic, harness là:
“Một cấu trúc vận hành giúp agent làm việc ổn định qua nhiều phiên bằng cách cung cấp môi trường nhất quán, ghi nhận lịch sử công việc và hướng dẫn quy trình rõ ràng.”
Nói cách khác, harness giúp AI:
- Hiểu trạng thái hiện tại của dự án
- Biết nhiệm vụ tiếp theo
- Duy trì đúng hướng đi
- Giữ môi trường làm việc ổn định
Giải pháp 2-Agent của Anthropic
1) Initializer Agent (phiên đầu tiên)
Tạo nền tảng ban đầu:
- Tạo scaffolding: init.sh, progress log, feature list
- Khởi tạo Git và commit đầu tiên
- Chuyển yêu cầu thành danh sách tính năng chi tiết
2) Coding Agent (các phiên tiếp theo)
Mỗi phiên thực hiện một nhiệm vụ rõ ràng:
- Đọc git log, progress file, feature list
- Chọn tính năng để xử lý
- Test end-to-end
- Commit với mô tả rõ ràng
- Cập nhật tiến độ
- Đảm bảo clean state
Mỗi vòng chạy giống một kỹ sư ca mới: đọc bàn giao → làm việc → test → bàn giao lại.
Vì sao harness hoạt động hiệu quả?
- Tạo tính liên tục: luôn nắm được trạng thái dự án
- Giảm lỗi “one-shot”: không cố làm quá nhiều
- Tăng chất lượng: test end-to-end mỗi phiên
- Môi trường ổn định: clean state giảm rủi ro bug
Điều này giúp AI tiến gần hơn tới khả năng tự phát triển phần mềm một cách hoàn chỉnh và độc lập.
Harness không chỉ là công cụ — nó giống như “quy trình làm việc chuẩn” dành cho AI
Nếu nhìn theo góc độ HR, harness rất giống:
- Quy trình bàn giao
- Checklist công việc
- Nhật ký công việc
- Quy định clean state
Nhờ harness, AI làm việc giống một nhân viên có tổ chức – không đoán mò, không làm dở dang.
Kết luận
Harness là bước quan trọng giúp AI vượt qua giới hạn của context window và làm việc như một thành viên thực sự: có bàn giao, có kế hoạch, có tiến độ rõ ràng.
Đối với những dự án AI cần tính liên tục, harness không phải “tùy chọn” – mà là nền tảng.
Bạn muốn tìm hiểu sâu hơn?
Nếu bạn quan tâm đến:
- Cách xây dựng harness cho dự án AI
- Ứng dụng AI agent vào quy trình phần mềm
- Hoặc muốn thử nghiệm harness trong môi trường thực tế
👉 Tham khảo nghiên cứu gốc của Anthropic: https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
👉 Tham khảo thêm các bài viết hay tại https://scuti.asia/blog/