Harness cho Long-Running Agents: Giải pháp giúp AI làm việc liên tục và ổn định qua nhiều phiên - Scuti Ai

by Nga Pham

December 11, 2025

Khi AI ngày càng đảm nhiệm những nhiệm vụ phức tạp và kéo dài nhiều giờ – thậm chí nhiều ngày – bài toán lớn nhất không còn là “AI có thông minh không”, mà là: AI có duy trì được tiến độ ổn định và nhất quán hay không?

Vấn đề này xuất hiện rõ nhất khi AI phải làm việc qua nhiều context windows.
Mỗi phiên chạy giống như “một bộ não mới”, không nhớ lại chính xác những gì đã diễn ra trước đó.

Anthropic đã đưa ra một giải pháp hiệu quả để xử lý vấn đề này: một harness dành cho long-running agents, giúp AI làm việc có kỷ luật và duy trì được sự liên tục qua nhiều phiên.

Vì sao AI cần cơ chế vận hành dài hạn?

Khi AI được giao nhiệm vụ dạng “dự án” – như xây dựng web app, phát triển tính năng hoặc tinh chỉnh hệ thống – mô hình phải làm việc qua nhiều phiên. Ở mỗi phiên:

Mô hình không có trí nhớ dài hạn
Khối lượng công việc vượt quá khả năng chứa của một context window
Các bước tác vụ phụ thuộc vào tiến độ đã hoàn thành trước đó

Điều này dẫn đến các thất bại quen thuộc:

Làm quá nhiều trong một lượt → mất context → phiên sau phải đoán lại
Đánh giá sai trạng thái dự án
Không để lại bàn giao hoặc môi trường sạch → gây lỗi lặp lại

Những vấn đề này tương tự một dự án phần mềm thiếu quy trình bàn giao — không có cách để duy trì tiến độ.

Harness là gì?

Trong nghiên cứu của Anthropic, harness là:

“Một cấu trúc vận hành giúp agent làm việc ổn định qua nhiều phiên bằng cách cung cấp môi trường nhất quán, ghi nhận lịch sử công việc và hướng dẫn quy trình rõ ràng.”

Nói cách khác, harness giúp AI:

Hiểu trạng thái hiện tại của dự án
Biết nhiệm vụ tiếp theo
Duy trì đúng hướng đi
Giữ môi trường làm việc ổn định

Giải pháp 2-Agent của Anthropic

1) Initializer Agent (phiên đầu tiên)

Tạo nền tảng ban đầu:

Tạo scaffolding: init.sh, progress log, feature list
Khởi tạo Git và commit đầu tiên
Chuyển yêu cầu thành danh sách tính năng chi tiết

2) Coding Agent (các phiên tiếp theo)

Mỗi phiên thực hiện một nhiệm vụ rõ ràng:

Đọc git log, progress file, feature list
Chọn tính năng để xử lý
Test end-to-end
Commit với mô tả rõ ràng
Cập nhật tiến độ
Đảm bảo clean state

Mỗi vòng chạy giống một kỹ sư ca mới: đọc bàn giao → làm việc → test → bàn giao lại.

Vì sao harness hoạt động hiệu quả?

Tạo tính liên tục: luôn nắm được trạng thái dự án
Giảm lỗi “one-shot”: không cố làm quá nhiều
Tăng chất lượng: test end-to-end mỗi phiên
Môi trường ổn định: clean state giảm rủi ro bug

Điều này giúp AI tiến gần hơn tới khả năng tự phát triển phần mềm một cách hoàn chỉnh và độc lập.

Harness không chỉ là công cụ — nó giống như “quy trình làm việc chuẩn” dành cho AI

Nếu nhìn theo góc độ HR, harness rất giống:

Quy trình bàn giao
Checklist công việc
Nhật ký công việc
Quy định clean state

Nhờ harness, AI làm việc giống một nhân viên có tổ chức – không đoán mò, không làm dở dang.

Kết luận

Harness là bước quan trọng giúp AI vượt qua giới hạn của context window và làm việc như một thành viên thực sự: có bàn giao, có kế hoạch, có tiến độ rõ ràng.

Đối với những dự án AI cần tính liên tục, harness không phải “tùy chọn” – mà là nền tảng.

Bạn muốn tìm hiểu sâu hơn?

Nếu bạn quan tâm đến:

Cách xây dựng harness cho dự án AI
Ứng dụng AI agent vào quy trình phần mềm
Hoặc muốn thử nghiệm harness trong môi trường thực tế

👉 Tham khảo nghiên cứu gốc của Anthropic: https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

👉 Tham khảo thêm các bài viết hay tại https://scuti.asia/blog/

Tags: AI AI Agent

Get In Touch

Gallery

Vì sao AI cần cơ chế vận hành dài hạn?

Harness là gì?

Giải pháp 2-Agent của Anthropic

1) Initializer Agent (phiên đầu tiên)

2) Coding Agent (các phiên tiếp theo)

Vì sao harness hoạt động hiệu quả?

Harness không chỉ là công cụ — nó giống như “quy trình làm việc chuẩn” dành cho AI

Kết luận

Bạn muốn tìm hiểu sâu hơn?

Quick Links

Blog

Hướng dẫn Xây Dựng Skill Cho Claude: Từ Chiến Lược Đến Ứng Dụng Thực Tế

From Prompt to Product: Investigating AI-Driven Web Design with Antigravity + Stitch

A-RAG: Agent thông minh – Bước Tiến Hóa Mới Của Retrieval-Augmented Generation

Facebook