by Hien Tran

December 11, 2025

Hiệu Quả của “Harness” Dành Cho Long-Running AI Agents: Hướng Dẫn Hoàn Chỉnh Cho Các Đội Ngũ Kỹ Sư Hiện Đại

Giới thiệu: Sự trỗi dậy của các Long-Running AI Agents

Trong vài năm trở lại đây, trí tuệ nhân tạo đã tiến hóa từ các công cụ trả lời đơn lẻ sang các AI agent có khả năng tự thực hiện những tác vụ phức tạp, nhiều bước, kéo dài hàng giờ hoặc hàng ngày. Những hệ thống này có thể viết phần mềm, tự động hóa workflow, phân tích dữ liệu lớn, điều phối các công cụ, triển khai ứng dụng, và độc lập hoàn thành mục tiêu được giao.

Tuy nhiên, dù AI agent đã phát triển mạnh mẽ về mặt trí tuệ, chúng vẫn gặp một hạn chế lớn:

Hầu hết các agent đều khó làm việc liên tục trong thời gian dài.

Một agent có thể hoạt động rất tốt trong một phiên (session), nhưng khi nhiệm vụ kéo dài hàng chục giờ hoặc nhiều ngày, nó phải đối mặt với ba vấn đề nghiêm trọng:

Mất ngữ cảnh giữa các phiên làm việc
Không có cơ chế tự quản lý tiến độ dài hạn
Dễ mất tính nhất quán nếu không có giám sát từ con người

Những rào cản này đã thúc đẩy Anthropic viết bài nghiên cứu “Effective Harnesses for Long-Running Agents”, đề xuất một giải pháp mang tính kỹ thuật: harness.

“Harness” không chỉ là một công cụ; đó là một khung làm việc, một môi trường kỹ thuật, một quy trình và một hệ thống kiểm soát giúp AI agents hoạt động như một thành viên kỹ sư thực thụ trong đội.

1. Vì sao Long-Running AI Agents khó xây dựng?

Dù có vẻ dễ hiểu rằng một agent “nên tiếp tục từ nơi nó dừng lại”, thực tế kỹ thuật lại phức tạp hơn nhiều. Các mô hình AI hiện đại — dù thông minh — về bản chất không lưu trạng thái. Mỗi lần gọi model là một lần “bắt đầu từ con số 0”.

Điều này tạo ra nhiều hệ quả.

1.1. Vấn đề Context Window

Dù mô hình AI có thể xử lý lượng prompt lớn, chúng vẫn bị giới hạn bởi context window. Khi dự án trở nên phức tạp:

Agent không thể giữ tất cả thông tin cần thiết
Những chi tiết quan trọng rơi khỏi bộ nhớ
Agent phải “đoán mò” phần còn lại
Dẫn đến kết quả không ổn định, thiếu logic

Anthropic nhận thấy rằng:

Những agent hiểu tốt nhiệm vụ lúc đầu, nhưng càng về sau càng mất mạch khi kích thước dự án vượt quá khả năng ghi nhớ của model.

Giống như một lập trình viên quên 90% codebase mỗi sáng, rõ ràng điều này không thể bền vững.

1.2. Vấn đề tác vụ quá rộng

Những prompt kiểu:

“Hãy xây cho tôi một ứng dụng web full-stack đầy đủ chức năng.”…thực chất chứa hàng chục nhiệm vụ nhỏ.

Khi đối diện với những yêu cầu lớn, agent thường:

Cố làm quá nhiều thứ trong một phiên
Sản sinh output dang dở
Nghĩ rằng đã hoàn thành dù thực tế sai lệch
Không thể theo dõi tiến độ

Điều thiếu ở đây chính là:

bản kế hoạch
checklist features
workflow
test suite
cơ chế bàn giao giữa các phiên

Một “harness” sẽ giải quyết toàn bộ điều này.

1.3. Vấn đề phiên làm việc rời rạc

Thông thường:

Mỗi phiên gọi mô hình là độc lập
Agent không nhớ những gì đã làm trước
Người dùng phải nhắc lại toàn bộ bối cảnh

Nhưng các nhiệm vụ phức tạp cần:

Lưu trạng thái
Theo dõi tiến độ
Bộ nhớ bền vững
File lịch sử
Test để duy trì chất lượng

Không có chúng, agent không thể hoạt động lâu dài.

1.4. Vấn đề xác minh

Ngay cả khi agent tạo ra kết quả:

Liệu có đúng yêu cầu?
Có phá vỡ logic cũ không?
Có chuẩn để build các bước tiếp theo không?

Con người luôn tự kiểm tra — chạy test, review code, kiểm tra assumption.

Agent cũng cần môi trường như vậy.

2. Vậy “Harness” là gì?

Anthropic định nghĩa harness là một môi trường và quy trình kỹ thuật giúp agent duy trì hiệu suất trong thời gian dài.

Một harness bao gồm:

Môi trường làm việc được kiểm soát
Cơ chế tạo dàn ý và kế hoạch dự án tự động
Quy trình làm việc cho từng phiên
Bộ nhớ dựa trên artifact
Cơ chế kiểm thử và xác minh
Các vai trò agent chuyên biệt

Nói cách khác: Harness là “hệ điều hành” dành cho AI agent.

Thay vì bỏ mặc agent “tự xoay sở”, harness giúp chúng hoạt động bài bản, có quy trình, có kiểm soát — giống như cách đội ngũ kỹ sư chuyên nghiệp hoạt động.

3. Các thành phần chính của một harness hiệu quả

Anthropic nêu bật một số thành phần quan trọng giúp agent hoạt động ổn định và lâu dài.

3.1. Initializer Agent (Agent khởi tạo)

Vai trò: thiết lập toàn bộ dự án.

Bao gồm:

● Tạo cấu trúc project

● Tạo danh sách chức năng

● Tạo script khởi động môi trường

● Tạo file log tiến độ

Agent code sẽ dựa vào đây để biết phiên trước làm gì.

3.2. Coding Agent (Agent lập trình)

Sau khi initializer hoàn tất setup, agent lập trình sẽ:

Đọc feature_list
Chọn feature tiếp theo
Viết code đúng phạm vi
Chạy test
Commit code
Cập nhật progress log

Mỗi phiên chỉ làm một việc, giúp:

tránh quá tải
tránh quên bối cảnh
đảm bảo chất lượng

3.3. Bộ nhớ dựa trên artifact

Khác với con người dùng bộ nhớ sinh học, agent dùng:

file
log
code
báo cáo
test output

Tất cả được lưu trữ và truy cập lại trong các phiên sau — không cần nhét toàn bộ vào prompt.

3.4. Kiểm thử và xác minh

Harness tốt luôn có:

Unit test
Validation script
Consistency check

Agent chỉ đánh dấu “đã hoàn thành” khi vượt qua tiêu chí xác minh. Điều này ngăn lỗi “tự tuyên bố hoàn thành”.

3.5. Cơ chế làm việc theo phiên

Mỗi phiên:

Tập trung 1 feature
Commit 1 lần
Update log rõ ràng
Leave artifacts

Giúp agent tiếp tục mạch logic dài hạn.

4. Harness cải thiện agent như thế nào?

● Giải quyết mất ngữ cảnh

Nhờ artifact.

● Giải quyết tác vụ quá rộng

Nhờ chia nhỏ trong feature_list.

● Giải quyết session rời rạc

Nhờ progress log và history.

● Đảm bảo tính đúng đắn

Nhờ kiểm thử.

● Giữ sự ổn định trong hàng ngày

Nhờ workflow kỷ luật.

5. So sánh agent truyền thống vs agent có harness

Tiêu chí	Agent thường	Agent có harness
Bộ nhớ	Mất hoàn toàn	Bền vững qua artifact
Workflow	Tự phát	Có quy trình
Output	Thiếu nhất quán	Ổn định
Công việc nhiều ngày	Rất khó	Khả thi
Xác minh	Không rõ ràng	Rõ và bắt buộc
Khả năng sửa lỗi	Yếu	Mạnh
Khả năng mở rộng	Thấp	Cao

6. Ví dụ thực tế: Xây app full-stack bằng harness

Phiên 1 – Initializer

tạo cấu trúc
tạo feature list
tạo test
tạo init script
tạo progress log

Phiên 2 trở đi – Coding

mỗi phiên làm một module nhỏ
viết code
chạy test
commit
cập nhật log

Sau 30–40 phiên, ứng dụng hoàn thiện hoàn chỉnh.

7. Vì sao các công ty công nghệ Việt Nam nên quan tâm?

Harness giúp:

rút ngắn chu kỳ phát triển
giảm chi phí nhân sự
tăng chất lượng code
đưa AI vào quy trình sản xuất
thay thế tác vụ lặp lại của kỹ sư
phù hợp với các công ty scale-up

Đặc biệt phù hợp khi:

thiếu senior developer
cần tự động hóa test
cần ra sản phẩm nhanh

8. Cách áp dụng harness trong doanh nghiệp

Chọn model phù hợp (Claude, GPT…)
Tạo bộ template dự án
Tự động hóa tạo feature list
Tạo hệ thống progress log
Tích hợp test pipeline
Dùng Git để quản lý
Xây dựng các vai trò agent
Tích hợp với DevOps

9. Tương lai của long-running agents

Harness là bước đầu của:

lập trình viên AI tự trị
hệ thống tự tối ưu
multi-agent collaboration
AI vận hành 24/7

Tương lai agent có thể:

tự học
tự sửa lỗi
tự chia task
tự điều phối nhiều agent

Kết luận

Khái niệm harness của Anthropic là một bước tiến lớn trong AI engineering thực tế. Harness giải quyết hầu hết hạn chế khiến agent không thể làm việc dài hơi.

Nó cung cấp:

sự cấu trúc
quy trình
bộ nhớ
kiểm thử
khả năng tiếp tục công việc

Với harness, AI agent không còn là “công cụ autocomplete thông minh” mà trở thành một kỹ sư tự động có năng lực, bền bỉ và đáng tin cậy.

Doanh nghiệp công nghệ Việt Nam nếu triển khai harness sớm sẽ đạt lợi thế cạnh tranh lớn khi xu hướng AI tự trị trở thành tiêu chuẩn toàn cầu.

Tags: AI AI Agent

Get In Touch

Gallery

Giới thiệu: Sự trỗi dậy của các Long-Running AI Agents

1. Vì sao Long-Running AI Agents khó xây dựng?

1.1. Vấn đề Context Window

1.2. Vấn đề tác vụ quá rộng

1.3. Vấn đề phiên làm việc rời rạc

1.4. Vấn đề xác minh

2. Vậy “Harness” là gì?

3. Các thành phần chính của một harness hiệu quả

3.1. Initializer Agent (Agent khởi tạo)

● Tạo cấu trúc project

● Tạo danh sách chức năng

● Tạo script khởi động môi trường

● Tạo file log tiến độ

3.2. Coding Agent (Agent lập trình)

3.3. Bộ nhớ dựa trên artifact

3.4. Kiểm thử và xác minh

3.5. Cơ chế làm việc theo phiên

4. Harness cải thiện agent như thế nào?

● Giải quyết mất ngữ cảnh

● Giải quyết tác vụ quá rộng

● Giải quyết session rời rạc

● Đảm bảo tính đúng đắn

● Giữ sự ổn định trong hàng ngày

5. So sánh agent truyền thống vs agent có harness

6. Ví dụ thực tế: Xây app full-stack bằng harness

Phiên 1 – Initializer

Phiên 2 trở đi – Coding

7. Vì sao các công ty công nghệ Việt Nam nên quan tâm?

8. Cách áp dụng harness trong doanh nghiệp

9. Tương lai của long-running agents

Kết luận

Leave a Reply

Quick Links

Blog

Hướng dẫn Xây Dựng Skill Cho Claude: Từ Chiến Lược Đến Ứng Dụng Thực Tế

From Prompt to Product: Investigating AI-Driven Web Design with Antigravity + Stitch

A-RAG: Agent thông minh – Bước Tiến Hóa Mới Của Retrieval-Augmented Generation

Facebook

Get In Touch

Gallery

Effective Harnesses for Long-Running AI Agents

Giới thiệu: Sự trỗi dậy của các Long-Running AI Agents

1. Vì sao Long-Running AI Agents khó xây dựng?

1.1. Vấn đề Context Window

1.2. Vấn đề tác vụ quá rộng

1.3. Vấn đề phiên làm việc rời rạc

1.4. Vấn đề xác minh

2. Vậy “Harness” là gì?

3. Các thành phần chính của một harness hiệu quả

3.1. Initializer Agent (Agent khởi tạo)

● Tạo cấu trúc project

● Tạo danh sách chức năng

● Tạo script khởi động môi trường

● Tạo file log tiến độ

3.2. Coding Agent (Agent lập trình)

3.3. Bộ nhớ dựa trên artifact

3.4. Kiểm thử và xác minh

3.5. Cơ chế làm việc theo phiên

4. Harness cải thiện agent như thế nào?

● Giải quyết mất ngữ cảnh

● Giải quyết tác vụ quá rộng

● Giải quyết session rời rạc

● Đảm bảo tính đúng đắn

● Giữ sự ổn định trong hàng ngày

5. So sánh agent truyền thống vs agent có harness

6. Ví dụ thực tế: Xây app full-stack bằng harness

Phiên 1 – Initializer

Phiên 2 trở đi – Coding

7. Vì sao các công ty công nghệ Việt Nam nên quan tâm?

8. Cách áp dụng harness trong doanh nghiệp

9. Tương lai của long-running agents

Kết luận

Leave a Reply

Quick Links

Blog

Hướng dẫn Xây Dựng Skill Cho Claude: Từ Chiến Lược Đến Ứng Dụng Thực Tế

From Prompt to Product: Investigating AI-Driven Web Design with Antigravity + Stitch

A-RAG: Agent thông minh – Bước Tiến Hóa Mới Của Retrieval-Augmented Generation

Facebook