Khi các hệ thống AI chuyển từ “chat trả lời” sang “agent hành động”, ba
khái niệm xuất hiện ngày càng dày đặc trong tài liệu của Anthropic và cộng
đồng Claude:
Skills, MCP (Model Context Protocol)
Subagents.

Vấn đề là: chúng không nằm cùng một tầng, nhưng lại thường bị đặt
cạnh nhau như thể có thể thay thế cho nhau. Bài viết này sẽ phân tích sâu
hơn ở góc nhìn kiến trúc hệ thống agent: mỗi khái niệm
giải quyết bài toán gì, vì sao nó tồn tại, và nên kết hợp chúng ra sao
trong môi trường thực tế (đặc biệt là enterprise / outsource).

1. Vấn đề gốc: Vì sao agent không thể chỉ dùng “prompt”?

Trong giai đoạn đầu, rất nhiều hệ thống AI được xây dựng bằng cách: viết
một prompt dài, mô tả đủ thứ, rồi hy vọng model “hiểu và làm đúng”. Cách
này có thể hoạt động cho demo, nhưng nhanh chóng sụp đổ khi:

  • Context phình to, khó kiểm soát
  • Mỗi task lại cần sửa prompt
  • Không tái sử dụng được tri thức đã chuẩn hoá
  • Không kiểm soát được quyền truy cập hệ thống thật

Skills, MCP và Subagents xuất hiện chính là để giải quyết các điểm nghẽn
này, nhưng mỗi thứ giải quyết một loại vấn đề khác nhau.

2. MCP – Lớp hạ tầng: “Agent nói chuyện với thế giới thật như thế nào?”

2.1 MCP giải quyết bài toán gì?

Trước MCP, việc cho AI dùng công cụ thường rơi vào hai trạng thái:

  • Hard-code tool: mỗi tool tích hợp một kiểu → khó mở
    rộng
  • Plugin rời rạc: thiếu chuẩn chung → khó quản trị, khó
    audit

MCP (Model Context Protocol) được Anthropic đề xuất như một
chuẩn kết nối trung gian, cho phép model khám phá và sử
dụng tool/dữ liệu theo cách nhất quán. MCP không “dạy” AI cách làm việc,
mà chỉ trả lời câu hỏi:
AI được phép chạm vào những hệ thống nào, theo chuẩn nào?

2.2 MCP nằm ở đâu trong kiến trúc?

MCP nằm ở tầng integration / infrastructure:

  • Kết nối GitHub, Drive, DB, nội bộ API
  • Expose tool metadata cho model
  • Kiểm soát auth, permission, audit

Một điểm rất quan trọng:
MCP không quyết định “khi nào dùng tool”. Nó chỉ cung cấp
khả năng, còn việc dùng hay không là quyết định ở tầng agent logic.

2.3 Rủi ro và trade-off của MCP

MCP mở ra khả năng thao tác hệ thống thật → đồng nghĩa với rủi ro thật:

  • Prompt injection vào tool call
  • Over-permission (agent làm được nhiều hơn cần thiết)
  • Khó kiểm soát nếu không có guardrails

Vì vậy trong môi trường doanh nghiệp, MCP luôn cần đi kèm: IAM, logging,
sandbox, và quy tắc phân quyền chặt chẽ.

3. Skills – Lớp năng lực: “Agent làm việc đúng chuẩn như thế nào?”

3.1 Skills không phải là tool

Một hiểu lầm phổ biến là coi Skills như “plugin” hay “macro”. Thực tế,
Skills là đóng gói tri thức + quy trình, không phải hành
động.

Ví dụ:

  • Code review theo tiêu chuẩn nội bộ
  • Viết tài liệu theo format công ty
  • Phân tích yêu cầu theo checklist PM

Những thứ này không phải API, mà là
cách suy nghĩ và ra quyết định.

3.2 Progressive disclosure – lý do Skills tồn tại

Nếu nhét toàn bộ “best practices” vào system prompt, context sẽ nổ tung.
Skills giải quyết vấn đề này bằng cơ chế
progressive disclosure:

  • Ban đầu chỉ load metadata của Skill
  • Khi task khớp → mới load hướng dẫn chi tiết
  • Chỉ load phần thật sự cần thiết

Đây là điểm khiến Skills khác hoàn toàn với prompt template thông thường.

3.3 Skills như “luật chơi” của tổ chức

Ở góc nhìn enterprise, Skills đóng vai trò như:

  • Chuẩn hoá tri thức tổ chức
  • Giảm phụ thuộc vào cá nhân
  • Đảm bảo đầu ra nhất quán

Vì vậy Anthropic mở chuẩn Skills, không khoá trong Claude, nhằm tạo một hệ
sinh thái nơi “cách làm tốt” có thể chia sẻ và tái sử dụng.

4. Subagents – Lớp tổ chức: “Ai làm việc gì trong một agent?”

4.1 Vì sao cần Subagents?

Khi task phức tạp, một agent duy nhất thường gặp vấn đề:

  • Context lẫn lộn (research + implement + review)
  • Khó kiểm soát tool usage
  • Khó debug

Subagents giải quyết bằng cách chia vai trò. Mỗi Subagent
có:

  • Mục tiêu rõ ràng
  • Context riêng
  • Danh sách tool được phép

4.2 Subagents khác gì “function call”?

Function call chỉ là một lần gọi. Subagent là một
tác nhân có vòng đời: nó có thể suy nghĩ, lặp lại, tổng
hợp, rồi trả kết quả về agent chính.

Điều này đặc biệt hữu ích cho:

  • Research dài hơi
  • Phân tích nhiều tài liệu
  • So sánh, đối chiếu

5. So sánh theo tầng kiến trúc

Tầng Thành phần Câu hỏi nó trả lời
Infrastructure MCP Agent được phép chạm vào hệ thống nào?
Capability Skills Agent nên làm việc theo chuẩn nào?
Organization Subagents Ai làm phần việc nào?

6. Ví dụ thực tế trong môi trường outsource / enterprise

Một workflow điển hình có thể là:

  1. Agent chính nhận yêu cầu từ PM
  2. Subagent “Requirement Analyst” phân tích spec
  3. Subagent “Developer” implement code
  4. Skills đảm bảo code style, commit rule, doc format
  5. MCP kết nối repo, issue tracker, tài liệu nội bộ

Mỗi lớp làm đúng việc của mình, không chồng chéo.

Kết luận

Skills, MCP và Subagents không phải là “3 tính năng cạnh tranh”, mà là
3 mảnh ghép bắt buộc của một agent AI trưởng thành.

Hiểu sai vị trí của chúng sẽ dẫn đến: prompt phình to, agent khó kiểm
soát, và hệ thống khó mở rộng. Hiểu đúng, bạn sẽ có một kiến trúc agent có
thể sống lâu dài trong môi trường production.