Xây Dựng AI Agent Hiệu Quả với MCP

Posted on November 14, 2025 by Phat Ly

Giới Thiệu

Trong thời đại AI đang phát triển mạnh mẽ, việc xây dựng các AI agent thông minh và hiệu quả đã trở thành mục tiêu của nhiều nhà phát triển. Model Context Protocol (MCP) – một giao thức mở được Anthropic phát triển – đang mở ra những khả năng mới trong việc tối ưu hóa cách các AI agent tương tác với dữ liệu và công cụ. Bài viết này sẽ phân tích cách tiếp cận “Code Execution with MCP” và đưa ra những góc nhìn thực tế về việc áp dụng nó vào các dự án thực tế.

MCP Là Gì và Tại Sao Nó Quan Trọng?

Model Context Protocol (MCP) có thể được ví như “USB-C của thế giới AI” – một tiêu chuẩn mở giúp chuẩn hóa cách các ứng dụng cung cấp ngữ cảnh cho các mô hình ngôn ngữ lớn (LLM). Thay vì mỗi hệ thống phải tự xây dựng cách kết nối riêng, MCP cung cấp một giao thức thống nhất, giúp giảm thiểu sự phân mảnh và tăng tính tương thích.

Quan điểm cá nhân: Tôi cho rằng MCP không chỉ là một công nghệ, mà còn là một bước tiến quan trọng trong việc chuẩn hóa hệ sinh thái AI. Giống như cách HTTP đã cách mạng hóa web, MCP có tiềm năng trở thành nền tảng cho việc kết nối các AI agent với thế giới bên ngoài.

Code Execution với MCP: Bước Đột Phá Thực Sự

Vấn Đề Truyền Thống

Trước đây, khi xây dựng AI agent, chúng ta thường phải:

Tải tất cả định nghĩa công cụ vào context window ngay từ đầu
Gửi toàn bộ dữ liệu thô đến mô hình, dù chỉ cần một phần nhỏ
Thực hiện nhiều lần gọi công cụ tuần tự, gây ra độ trễ cao
Đối mặt với rủi ro bảo mật khi dữ liệu nhạy cảm phải đi qua mô hình

Giải Pháp: Code Execution với MCP

Code execution với MCP cho phép AI agent viết và thực thi mã để tương tác với các công cụ MCP. Điều này mang lại 5 lợi ích chính:

1. Tiết Lộ Dần Dần (Progressive Disclosure)

Cách hoạt động: Thay vì tải tất cả định nghĩa công cụ vào context, agent có thể đọc các file công cụ từ hệ thống file khi cần thiết.

Ví dụ thực tế: Giống như việc bạn không cần đọc toàn bộ thư viện sách để tìm một thông tin cụ thể. Agent chỉ cần “mở” file công cụ khi thực sự cần sử dụng.

Lợi ích:

Giảm đáng kể token consumption
Tăng tốc độ phản hồi ban đầu
Cho phép agent làm việc với số lượng công cụ lớn hơn

2. Kết Quả Công Cụ Hiệu Quả Về Ngữ Cảnh

Vấn đề: Khi làm việc với dataset lớn (ví dụ: 10,000 records), việc gửi toàn bộ dữ liệu đến mô hình là không hiệu quả.

Giải pháp: Agent có thể viết mã để lọc, chuyển đổi và xử lý dữ liệu trước khi trả về kết quả cuối cùng.

Ví dụ:

# Thay vì trả về 10,000 records
# Agent có thể viết:
results = filter_data(dataset, criteria)
summary = aggregate(results)
return summary  # Chỉ trả về kết quả đã xử lý

Quan điểm: Đây là một trong những điểm mạnh nhất của phương pháp này. Nó cho phép agent “suy nghĩ” trước khi trả lời, giống như cách con người xử lý thông tin.

3. Luồng Điều Khiển Mạnh Mẽ

Cách truyền thống: Agent phải thực hiện nhiều lần gọi công cụ tuần tự:

Gọi công cụ 1 → Chờ kết quả → Gọi công cụ 2 → Chờ kết quả → ...

Với code execution: Agent có thể viết một đoạn mã với vòng lặp, điều kiện và xử lý lỗi:

for item in items:
    result = process(item)
    if result.is_valid():
        save(result)
    else:
        log_error(item)

Lợi ích:

Giảm độ trễ (latency) đáng kể
Xử lý lỗi tốt hơn
Logic phức tạp được thực thi trong một bước

4. Bảo Vệ Quyền Riêng Tư

Đặc điểm quan trọng: Các kết quả trung gian mặc định được giữ trong môi trường thực thi, không tự động gửi đến mô hình.

Ví dụ: Khi agent xử lý dữ liệu nhạy cảm (thông tin cá nhân, mật khẩu), các biến trung gian chỉ tồn tại trong môi trường thực thi. Chỉ khi agent chủ động log hoặc return, dữ liệu mới được gửi đến mô hình.

Quan điểm: Đây là một tính năng bảo mật quan trọng, đặc biệt trong các ứng dụng enterprise. Tuy nhiên, cần có cơ chế giám sát để đảm bảo agent không vô tình leak dữ liệu.

5. Duy Trì Trạng Thái và Kỹ Năng

Khả năng mới: Agent có thể:

Lưu trạng thái vào file để tiếp tục công việc sau
Xây dựng các function có thể tái sử dụng như “kỹ năng”
Học và cải thiện theo thời gian

Ví dụ thực tế: Agent có thể tạo file utils.py với các function xử lý dữ liệu, và sử dụng lại trong các task tương lai.

Cách Xây Dựng AI Agent Hiệu Quả với MCP

Bước 1: Thiết Kế Kiến Trúc

Nguyên tắc:

Tách biệt rõ ràng giữa logic xử lý và tương tác với MCP
Thiết kế các công cụ MCP theo module, dễ mở rộng
Xây dựng hệ thống quản lý trạng thái rõ ràng

Ví dụ kiến trúc:

Agent Core
├── MCP Client (kết nối với MCP servers)
├── Code Executor (sandbox environment)
├── State Manager (lưu trữ trạng thái)
└── Tool Registry (quản lý công cụ)

Bước 2: Tối Ưu Hóa Progressive Disclosure

Chiến lược:

Tổ chức công cụ theo namespace và category
Sử dụng file system để quản lý định nghĩa công cụ
Implement lazy loading cho các công cụ ít dùng

Code pattern:

# tools/database/query.py
def query_database(sql):
    # Implementation
    pass

# Agent chỉ load khi cần
if need_database:
    import tools.database.query

Bước 3: Xây Dựng Data Processing Pipeline

Best practices:

Luôn filter và transform dữ liệu trước khi trả về
Sử dụng streaming cho dataset lớn
Implement caching cho các query thường dùng

Ví dụ:

def process_large_dataset(data_source):
    # Chỉ load và xử lý phần cần thiết
    filtered = stream_filter(data_source, filter_func)
    aggregated = aggregate_in_chunks(filtered)
    return summary_statistics(aggregated)

Bước 4: Implement Security Measures

Các biện pháp cần thiết:

Sandboxing: Chạy code trong môi trường cách ly
Resource limits: Giới hạn CPU, memory, thời gian thực thi
Audit logging: Ghi lại tất cả code được thực thi
Input validation: Kiểm tra input trước khi thực thi

Quan điểm: Security không phải là feature, mà là requirement. Đừng để đến khi có sự cố mới nghĩ đến bảo mật.

Bước 5: State Management và Skill Building

Chiến lược:

Sử dụng file system hoặc database để lưu trạng thái
Tạo thư viện các utility functions có thể tái sử dụng
Implement versioning cho các “skills”

Ví dụ:

# skills/data_analysis.py
def analyze_trends(data):
    # Reusable skill
    pass

# Agent có thể import và sử dụng
from skills.data_analysis import analyze_trends

Áp Dụng Vào Dự Án Thực Tế

Use Case 1: Data Analysis Agent

Tình huống: Xây dựng agent phân tích dữ liệu từ nhiều nguồn khác nhau.

Áp dụng MCP:

MCP servers cho mỗi data source (database, API, file system)
Code execution để filter và aggregate dữ liệu
Progressive disclosure cho các công cụ phân tích

Lợi ích:

Giảm 60-70% token usage
Tăng tốc độ xử lý 3-5 lần
Dễ dàng thêm data source mới

Use Case 2: Automation Agent

Tình huống: Agent tự động hóa các tác vụ lặp đi lặp lại.

Áp dụng MCP:

MCP servers cho các hệ thống cần tương tác
Code execution để xử lý logic phức tạp
State management để resume công việc

Lợi ích:

Xử lý lỗi tốt hơn với try-catch trong code
Có thể pause và resume công việc
Dễ dàng debug và monitor

Use Case 3: Customer Support Agent

Tình huống: Agent hỗ trợ khách hàng với quyền truy cập vào nhiều hệ thống.

Áp dụng MCP:

MCP servers cho CRM, knowledge base, ticketing system
Code execution để query và tổng hợp thông tin
Privacy protection cho dữ liệu khách hàng

Lợi ích:

Bảo vệ thông tin nhạy cảm tốt hơn
Phản hồi nhanh hơn với data processing tại chỗ
Dễ dàng tích hợp hệ thống mới

Những Thách Thức và Giải Pháp

Thách Thức 1: Code Quality và Safety

Vấn đề: Agent có thể viết code không an toàn hoặc không hiệu quả.

Giải pháp:

Implement code review tự động
Sử dụng linter và formatter
Giới hạn các API và function có thể sử dụng

Thách Thức 2: Debugging

Vấn đề: Debug code được agent tự động generate khó hơn code thủ công.

Giải pháp:

Comprehensive logging
Code explanation từ agent
Step-by-step execution với breakpoints

Thách Thức 3: Performance

Vấn đề: Code execution có thể chậm nếu không tối ưu.

Giải pháp:

Caching kết quả
Parallel execution khi có thể
Optimize code generation từ agent

Roadmap Áp Dụng MCP Vào Dự Án Của Bạn

Dựa trên những nguyên tắc và best practices đã trình bày, đây là roadmap cụ thể để bạn có thể áp dụng MCP vào dự án của mình một cách hiệu quả:

Giai Đoạn 1: Chuẩn Bị và Đánh Giá (Tuần 1-2)

Mục tiêu: Hiểu rõ nhu cầu và chuẩn bị môi trường

Đánh giá use case: Xác định vấn đề cụ thể mà agent sẽ giải quyết
Phân tích hệ thống hiện tại: Liệt kê các hệ thống, API, database cần tích hợp
Thiết lập môi trường dev: Cài đặt MCP SDK, tạo sandbox environment
Xác định metrics: Định nghĩa KPIs để đo lường hiệu quả (token usage, latency, accuracy)
Security audit: Đánh giá các yêu cầu bảo mật và compliance

Giai Đoạn 2: Proof of Concept (Tuần 3-4)

Mục tiêu: Xây dựng prototype đơn giản để validate concept

Tạo MCP server đầu tiên: Bắt đầu với một data source đơn giản nhất
Implement basic agent: Agent có thể gọi MCP tool và xử lý response
Test code execution: Cho agent viết và thực thi code đơn giản
Đo lường baseline: Ghi lại metrics ban đầu để so sánh
Gather feedback: Thu thập phản hồi từ team và stakeholders

Giai Đoạn 3: Mở Rộng và Tối Ưu (Tuần 5-8)

Mục tiêu: Mở rộng chức năng và tối ưu hóa hiệu suất

Thêm MCP servers: Tích hợp các data source và hệ thống còn lại
Implement progressive disclosure: Tổ chức tools theo namespace, lazy loading
Xây dựng data pipeline: Filter, transform, aggregate data trước khi trả về
Security hardening: Implement sandboxing, resource limits, audit logging
State management: Lưu trạng thái, xây dựng reusable skills
Performance optimization: Caching, parallel execution, code optimization

Giai Đoạn 4: Production và Monitoring (Tuần 9-12)

Mục tiêu: Đưa vào production và đảm bảo ổn định

Testing toàn diện: Unit tests, integration tests, security tests
Documentation: Viết docs cho MCP servers, API, và agent behavior
Monitoring setup: Logging, metrics, alerting system
Gradual rollout: Deploy từng phần, A/B testing nếu cần
Training và support: Đào tạo team, setup support process
Continuous improvement: Thu thập feedback, iterate và optimize

Checklist Implementation

Technical Setup

MCP SDK installed
Sandbox environment configured
MCP servers implemented
Code executor setup
State storage configured

Security

Sandboxing enabled
Resource limits set
Input validation implemented
Audit logging active
Access control configured

Performance

Progressive disclosure implemented
Data filtering in place
Caching strategy defined
Metrics dashboard ready
Optimization plan created

Key Takeaways để Áp Dụng Hiệu Quả

Bắt đầu từ use case đơn giản nhất: Đừng cố gắng giải quyết tất cả vấn đề cùng lúc. Bắt đầu nhỏ, học hỏi, rồi mở rộng.
Ưu tiên security từ đầu: Đừng để security là suy nghĩ sau. Thiết kế security vào kiến trúc ngay từ đầu.
Đo lường mọi thứ: Nếu không đo lường được, bạn không thể cải thiện. Setup metrics và monitoring sớm.
Tận dụng code execution: Đây là điểm mạnh của MCP. Cho phép agent xử lý logic phức tạp trong code thay vì nhiều tool calls.
Xây dựng reusable skills: Đầu tư vào việc tạo các function có thể tái sử dụng. Chúng sẽ tiết kiệm thời gian về sau.
Iterate và improve: Không có giải pháp hoàn hảo ngay từ đầu. Thu thập feedback, đo lường, và cải thiện liên tục.

Ví Dụ Thực Tế: E-commerce Data Analysis Agent

Tình huống: Bạn cần xây dựng agent phân tích dữ liệu bán hàng từ nhiều nguồn (database, API, CSV files).

Áp dụng roadmap:

Tuần 1-2: Đánh giá data sources, thiết lập môi trường, xác định metrics (query time, token usage)
Tuần 3-4: Tạo MCP server cho database, agent có thể query và trả về kết quả đơn giản
Tuần 5-8: Thêm MCP servers cho API và file system, implement data filtering, aggregation trong code
Tuần 9-12: Production deployment, monitoring, optimize query performance, build reusable analysis functions

Kết quả: Agent có thể phân tích dữ liệu từ nhiều nguồn, giảm 65% token usage, tăng tốc độ xử lý 4 lần so với cách truyền thống.

Kết Luận và Hướng Phát Triển

Code execution với MCP đại diện cho một bước tiến quan trọng trong việc xây dựng AI agent. Nó không chỉ giải quyết các vấn đề về hiệu quả và bảo mật, mà còn mở ra khả năng cho agent “học” và phát triển kỹ năng theo thời gian.

Quan điểm cuối cùng:

Tôi tin rằng đây mới chỉ là khởi đầu. Trong tương lai, chúng ta sẽ thấy:

Các agent có thể tự động tối ưu hóa code của chính chúng
Hệ sinh thái các MCP servers phong phú hơn
Các framework và tooling hỗ trợ tốt hơn cho việc phát triển

Lời khuyên cho các nhà phát triển:

Bắt đầu nhỏ: Bắt đầu với một use case đơn giản để hiểu rõ cách MCP hoạt động
Tập trung vào security: Đừng đánh đổi bảo mật để lấy hiệu quả
Đo lường và tối ưu: Luôn đo lường performance và tối ưu dựa trên dữ liệu thực tế
Cộng đồng: Tham gia vào cộng đồng MCP để học hỏi và chia sẻ kinh nghiệm

Việc áp dụng MCP vào dự án của bạn không chỉ là việc tích hợp một công nghệ mới, mà còn là việc thay đổi cách suy nghĩ về việc xây dựng AI agent. Hãy bắt đầu ngay hôm nay và khám phá những khả năng mới!

Context Engineering cho AI Agents – Tóm tắt từ Anthropic

Posted on October 14, 2025 by Cuong Dinh

Context Engineering cho AI Agents

Tóm tắt từ bài viết của Anthropic về nghệ thuật quản lý context trong phát triển AI

🎯 Context Engineering là gì?

Context Engineering là tập hợp các chiến lược để tuyển chọn và duy trì bộ tokens (thông tin) tối ưu trong quá trình AI agents hoạt động.

Nó bao gồm việc quản lý toàn bộ trạng thái context như:

System prompts (hướng dẫn hệ thống)
Tools (công cụ)
Model Context Protocol (MCP)
External data (dữ liệu bên ngoài)
Message history (lịch sử hội thoại)
Các thông tin khác trong context window

💡 Bản chất: Context Engineering là nghệ thuật và khoa học về việc tuyển chọn thông tin nào sẽ đưa vào context window giới hạn từ vũ trụ thông tin liên tục phát triển của agent.

🔄 Khác biệt giữa Context Engineering và Prompt Engineering

📝 Prompt Engineering

Focus: Cách viết instructions (hướng dẫn)
Phạm vi: Tối ưu hóa system prompts
Use case: Tác vụ đơn lẻ, one-shot
Tính chất: Rời rạc, tĩnh

Ví dụ: “Tóm tắt văn bản này thành 3 điểm chú trọng số liệu tài chính”

🧠 Context Engineering

Focus: Model nhìn thấy gì trong context window
Phạm vi: Toàn bộ trạng thái thông tin
Use case: Multi-turn, tác vụ dài hạn
Tính chất: Lặp lại, động, liên tục

Ví dụ: Quyết định agent nên xem toàn bộ tài liệu, 3 phần cuối, hay bản tóm tắt đã chuẩn bị?

🎭 Ẩn dụ: Prompt engineering là “nói cho ai đó biết phải làm gì”, còn context engineering là “quyết định nên cung cấp nguồn lực gì cho họ”.

⚡ Tại sao Context Engineering quan trọng hơn?

Khi AI agents thực hiện các tác vụ phức tạp trên nhiều vòng lặp, chúng tạo ra ngày càng nhiều dữ liệu. Thông tin này phải được tinh chỉnh theo chu kỳ. Context engineering xảy ra mỗi khi chúng ta quyết định đưa gì vào model – đây là quá trình lặp đi lặp lại, không phải một lần.

⚠️ Những điều cần chú ý khi phát triển AI Agents

1. 🎯 Vấn đề “Goldilocks Zone” cho System Prompts

System prompts cần nằm ở “vùng vừa phải” giữa hai thái cực:

❌ Quá cứng nhắc: Hardcode logic if-else phức tạp → agent dễ vỡ, khó bảo trì

❌ Quá mơ hồ: Hướng dẫn chung chung, giả định context chung → thiếu tín hiệu cụ thể

✅ Vùng tối ưu: Đủ cụ thể để dẫn dắt hành vi, nhưng đủ linh hoạt để cung cấp heuristics mạnh mẽ

2. 🧹 “Context Rot” – Sự suy giảm độ chính xác

Khi context window dài ra, độ chính xác của model giảm xuống:

Giới hạn chú ý: LLMs giống con người – không thể nhớ mọi thứ khi quá tải. Nhiều tokens ≠ chính xác hơn
Context rot: Context càng dài, độ chính xác truy xuất càng giảm. Thêm 100 trang logs có thể che mất chi tiết quan trọng duy nhất
Kiến trúc transformer: Tạo n² mối quan hệ giữa các tokens (10K tokens = 100M quan hệ, 100K tokens = 10B quan hệ)

💡 Giải pháp: Implement pagination, range selection, filtering, truncation với giá trị mặc định hợp lý

3. 🔧 Quản lý Tools hiệu quả

Giữ tools riêng biệt: Không tạo 2 tools cùng làm việc giống nhau (VD: cùng fetch news)
Mô tả rõ ràng: Viết tool descriptions như hướng dẫn nhân viên mới – rõ ràng, tránh mơ hồ
Token-efficient: Giới hạn tool responses (VD: Claude Code giới hạn 25,000 tokens mặc định)
Error handling tốt: Error messages phải cụ thể, actionable, không phải error codes mơ hồ

4. 📊 Just-in-Time Context Retrieval

Thay vì load toàn bộ dữ liệu trước, hãy fetch dữ liệu động khi cần:

Tránh overload context window
Giảm token costs
Ngăn context poisoning (nhiễu thông tin)
Tương tự cách con người dùng hệ thống indexing bên ngoài

5. 🎨 Ba chiến lược cho tác vụ dài hạn

📦 Compaction (Nén thông tin)

Tóm tắt context cũ, giữ lại thông tin quan trọng

📝 Structured Note-Taking

Agent tự ghi chú có cấu trúc về những gì đã làm

🤖 Multi-Agent Architecture

Spawn sub-agents nhỏ cho các tác vụ hẹp, trả về kết quả ngắn gọn

6. 🎯 Ưu tiên Context theo tầm quan trọng

🔴 High Priority (luôn có trong context): Tác vụ hiện tại, kết quả tool gần đây, hướng dẫn quan trọng

🟡 Medium Priority (khi có không gian): Examples, quyết định lịch sử

⚪ Low Priority (on-demand): Nội dung file đầy đủ, documentation mở rộng

7. 📈 Monitoring và Iteration

Theo dõi liên tục:

Token usage per turn
Tool call frequency
Context window utilization
Performance ở các độ dài context khác nhau
Recall vs Precision khi rút gọn context

💡 Quy trình: Bắt đầu đơn giản → Test → Xác định lỗi → Thêm hướng dẫn cụ thể → Loại bỏ redundancy → Lặp lại

💡 Kết luận

Context engineering là kỹ năng then chốt để xây dựng AI agents hiệu quả. Khác với prompt engineering tập trung vào “cách viết instructions”, context engineering quan tâm đến “môi trường thông tin toàn diện” mà agent hoạt động.

Thành công không nằm ở việc tìm từ ngữ hoàn hảo, mà là tối ưu hóa cấu hình context để tạo ra hành vi mong muốn một cách nhất quán.

🎯 Nguyên tắc cốt lõi: Tìm bộ tokens nhỏ nhất có tín hiệu cao nhất để tối đa hóa khả năng đạt được kết quả mong muốn. Mỗi từ không cần thiết, mỗi mô tả tool thừa, mỗi dữ liệu cũ đều làm giảm hiệu suất agent.

Revolutionizing Test Automation with Playwright Agents

Posted on October 14, 2025October 14, 2025 by Cuong Dinh

🎭 Revolutionizing Test Automation with Playwright Agents

How AI-Powered Agents are Transforming E2E Testing

📅 October 2025
⏱️ 5 min read
🏷️ Testing, AI, Automation

Imagine this: You describe what you want to test, and AI generates comprehensive test plans, writes the actual test code, and even fixes failing tests automatically. This isn’t science fiction—it’s Playwright Agents, and it’s available today.

Playwright has introduced three powerful AI agents that work together to revolutionize how we approach test automation: the Planner, Generator, and Healer. Let’s dive deep into how these agents are changing the game.

What Are Playwright Agents?

Playwright Agents are AI-powered tools that automate the entire test creation and maintenance lifecycle. They can work independently or sequentially in an agentic loop, producing comprehensive test coverage for your product without the traditional manual overhead.

🎯

Planner Agent

The Planner is your AI test strategist. It explores your application and produces detailed, human-readable test plans in Markdown format.

How It Works:

Input: A clear request (e.g., “Generate a plan for guest checkout”), a seed test that sets up your environment, and optionally a Product Requirements Document
Process: Runs the seed test to understand your app’s structure, analyzes user flows, and identifies test scenarios
Output: Structured Markdown test plans saved in specs/ directory with detailed steps and expected results

💡 Pro Tip: The Planner uses your seed test as context, so it understands your custom fixtures, authentication flows, and project setup automatically!

Example Output:

# TodoMVC Application - Basic Operations Test Plan

## Test Scenarios

### 1. Adding New Todos
#### 1.1 Add Valid Todo
**Steps:**
1. Click in the "What needs to be done?" input field
2. Type "Buy groceries"
3. Press Enter key

**Expected Results:**
- Todo appears in the list with unchecked checkbox
- Counter shows "1 item left"
- Input field is cleared and ready for next entry

⚡

Generator Agent

The Generator transforms your human-readable test plans into executable Playwright test code, verifying selectors and assertions in real-time.

Key Features:

Live Verification: Checks selectors against your actual app while generating code
Smart Assertions: Uses Playwright’s catalog of assertions for robust validation
Context Aware: Inherits setup from seed tests and maintains consistency
Best Practices: Generates code following Playwright conventions and modern patterns

Generated Test Example:

// spec: specs/basic-operations.md
// seed: tests/seed.spec.ts
import { test, expect } from '../fixtures';

test.describe('Adding New Todos', () => {
  test('Add Valid Todo', async ({ page }) => {
    // Type and submit todo
    const todoInput = page.getByRole('textbox', { 
      name: 'What needs to be done?' 
    });
    await todoInput.fill('Buy groceries');
    await todoInput.press('Enter');
    
    // Verify todo appears
    await expect(page.getByText('Buy groceries')).toBeVisible();
    await expect(page.getByText('1 item left')).toBeVisible();
    await expect(todoInput).toHaveValue('');
  });
});

🔧

Healer Agent

The Healer is your automated maintenance engineer. When tests fail, it diagnoses issues and applies fixes automatically.

Healing Process:

Step 1: Replays the failing test steps to understand the failure context
Step 2: Inspects the current UI to locate equivalent elements or alternative flows
Step 3: Suggests patches like locator updates, wait adjustments, or data corrections
Step 4: Re-runs the test until it passes or determines the functionality is actually broken

🎯 Smart Decisions: If the Healer can’t fix a test after multiple attempts, it marks the test as skipped and flags it as a potential real bug in your application!

Common Fixes Applied:

Updating selectors when UI structure changes
Adding appropriate waits for dynamic content
Adjusting test data to match new requirements
Handling new dialog boxes or pop-ups

🤖 Working with Claude Code

Playwright Agents integrate seamlessly with Claude Code, enabling natural language test automation directly from your terminal.

Setup Process:

# Initialize Playwright Agents for Claude Code
npx playwright init-agents --loop=claude

# This generates agent definitions optimized for Claude Code
# under .github/ directory with MCP tools and instructions

1
Initialize: Run the init command to generate agent definitions

2
Plan: Ask Claude Code to use the Planner: “Use 🎭 planner to create a test plan for user registration”

3
Generate: Command the Generator: “Use 🎭 generator to create tests from specs/registration.md”

4
Heal: Let the Healer fix issues: “Use 🎭 healer to fix all failing tests”

Benefits with Claude Code:

Natural Language Control: Command agents using simple English instructions
Context Awareness: Claude Code understands your project structure and requirements
Iterative Refinement: Easily adjust and improve tests through conversation
Automatic Updates: Regenerate agents when Playwright updates to get latest features

The Complete Workflow

Here’s how the three agents work together to create comprehensive test coverage:

1. 🎯 Planner explores your app
   └─> Produces: specs/user-flows.md

2. ⚡ Generator reads the plan
   └─> Produces: tests/user-registration.spec.ts
               tests/user-login.spec.ts
               tests/checkout.spec.ts

3. Run tests: npx playwright test
   └─> Some tests fail due to UI changes

4. 🔧 Healer analyzes failures
   └─> Updates selectors automatically
   └─> Tests now pass ✅

Why This Matters

Traditional E2E testing requires significant manual effort:

Writing detailed test plans takes hours
Converting plans to code is tedious and error-prone
Maintaining tests as UI changes is a constant battle
New team members need extensive training

Playwright Agents eliminate these pain points by:

✅ Generating plans in minutes instead of hours
✅ Producing production-ready test code automatically
✅ Self-healing tests that adapt to UI changes
✅ Making test automation accessible to everyoneDEMO:

Github source : https://github.com/cuongdvscuti/agent-playwright

Ready to Transform Your Testing?

Playwright Agents represent a fundamental shift in how we approach test automation. By combining AI with Playwright’s powerful testing capabilities, you can achieve comprehensive test coverage with a fraction of the traditional effort.

Whether you’re starting a new project or maintaining an existing test suite, Playwright Agents can help you move faster, catch more bugs, and spend less time on maintenance.

Get Started with Playwright Agents

📚 Documentation

🐙 GitHub Repo

💬 Discord Community

Serena: Transform Any LLM Into a Professional Coding Agent – Save 80% Tokens, 5x Faster Development

Posted on September 22, 2025September 22, 2025 by hello@scuti

Bạn đã bao giờ ước có một trợ lý lập trình thực sự hiểu codebase của mình, không chỉ đọc file dài dòng hay grep chuỗi, mà còn làm việc như một IDE ngay trong tay?

Đó chính là điều mà Serena mang lại.

Serena là gì?

Serena là một toolkit mạnh mẽ dành cho coding agent, có thể biến bất kỳ LLM nào bạn đang dùng thành một agent giàu tính năng, làm việc trực tiếp trên codebase. Khác với nhiều công cụ hiện tại, Serena không bị ràng buộc vào một LLM, framework hay giao diện cụ thể – bạn có thể linh hoạt sử dụng trong nhiều bối cảnh khác nhau.

🔧 Với Serena, agent của bạn có thể:

Truy xuất và chỉnh sửa code ở mức symbol, thay vì phải đọc toàn bộ file
Hiểu được mối quan hệ giữa các thành phần code, như cách một IDE chuyên nghiệp hoạt động
Tối ưu hiệu suất (token efficiency) khi làm việc với LLM, tiết kiệm chi phí và tăng tốc độ

🆓 Hoàn toàn miễn phí & mã nguồn mở

Serena giúp bạn khai thác tối đa khả năng của các LLM mà không tốn thêm chi phí.

Tại sao Serena quan trọng?

Hãy nghĩ về Serena như việc trao cho coding agent của bạn một “bộ công cụ IDE”: từ find_symbol, find_referencing_symbols cho đến insert_after_symbol. Điều này mở ra một kỷ nguyên mới, nơi việc tự động hóa code không chỉ dừng lại ở “tìm & thay thế chuỗi”, mà là hiểu và chỉnh sửa code như một lập trình viên thực thụ.

Cách hoạt động

Serena bản thân nó không phải là một “AI biết code” – mà là bộ công cụ giúp AI code tốt hơn. Để thực sự hoạt động, Serena cần một LLM (như Claude, GPT, Gemini…) làm “bộ não” để điều phối việc sử dụng công cụ.

Ví dụ đơn giản: bạn có thể supercharge Claude Code chỉ với một dòng lệnh trong terminal, và ngay lập tức Claude sẽ được bổ sung khả năng thao tác codebase ở mức IDE.

So sánh Workflow: Trước và Sau Serena

Tiêu chí	Trước khi dùng Serena	Với Serena
Cách tìm mã cần chỉnh sửa	LLM phải đọc cả file hoặc cả codebase, sau đó “đoán” vị trí cần thay đổi	Sử dụng công cụ như `find_symbol`, `find_referencing_symbols` để nhảy thẳng tới đoạn mã cần thao tác
Hiệu quả token	Tiêu tốn nhiều token do phải nạp cả khối lượng mã lớn	Tiết kiệm token, chỉ truy xuất phần liên quan
Tốc độ	Chậm, vì cần nhiều bước suy luận và thao tác thủ công	Nhanh hơn, nhờ thao tác trực tiếp ở mức symbol
Chất lượng mã sinh ra	Dễ bị lỗi do LLM có thể bỏ sót ngữ cảnh quan trọng hoặc chỉnh sai chỗ	Ổn định và chính xác hơn, nhờ cơ chế truy xuất có cấu trúc
Ứng dụng thực tế	Chỉ phù hợp cho dự án nhỏ	Cực kỳ hữu ích cho dự án lớn, nhiều module phức tạp

Công nghệ đằng sau Serena

Serena được xây dựng dựa trên Language Server Protocol (LSP) – chuẩn chung mà hầu hết các IDE hiện đại đều sử dụng. Nhờ đó, Serena không chỉ đọc code ở mức văn bản, mà còn hiểu được cấu trúc và ngữ nghĩa của mã nguồn: class, function, reference, symbol…

Tương tự như một developer đang thao tác trong IDE, Serena có thể:

Nhanh chóng tìm đúng context trong dự án lớn
Thực hiện chỉnh sửa có chủ đích, thay vì tìm kiếm chuỗi mù quáng
Giúp tiết kiệm token, tăng tốc độ và giảm lỗi khi kết hợp cùng LLM

💡 Kết quả: Serena thường mang lại hiệu quả cao hơn cả những giải pháp thương mại đắt đỏ, nhưng hoàn toàn miễn phí & open-source.

Ngôn ngữ được hỗ trợ

Ngôn ngữ	Ghi chú
Python	Hỗ trợ trực tiếp
TypeScript / JavaScript	Hỗ trợ trực tiếp
PHP	Dùng Intelephense LSP (cần INTELEPHENSE_LICENSE_KEY cho tính năng premium)
Go	Cần cài gopls
R	Cần cài package languageserver
Rust	Dùng rust-analyzer qua rustup
C / C++	Một số vấn đề khi tìm references (đang cải thiện)
Zig	Cần cài ZLS
C#	Hỗ trợ trực tiếp
Ruby	Mặc định dùng ruby-lsp (có thể chọn solargraph cũ)
Swift	Hỗ trợ trực tiếp
Kotlin	Dùng LS chính thức (pre-alpha, còn lỗi)
Java	Startup chậm, có vấn đề trên macOS/Linux
Clojure	Hỗ trợ trực tiếp
Dart	Hỗ trợ trực tiếp
Bash	Hỗ trợ trực tiếp
Lua	Tự động tải lua-language-server nếu chưa có
Nix	Cần cài nixd
Elixir	Cần NextLS + Elixir (chưa hỗ trợ Windows)
Erlang	Cần beam + erlang_ls, experimental, có thể chậm
AL	Hỗ trợ trực tiếp

Cách tích hợp Serena với LLM

Serena được thiết kế linh hoạt, có thể cắm vào nhiều môi trường và workflow khác nhau:

🔹 Qua Model Context Protocol (MCP)

Serena chạy như một MCP server, dễ dàng tích hợp với:

🖥 IDEs: VSCode, Cursor, IntelliJ
🧩 Extensions: Cline, Roo Code
💻 Terminal clients: Codex, Gemini-CLI, Qwen3-Coder, rovodev, OpenHands CLI
🪄 Claude Code và Claude Desktop
🌐 Local clients: OpenWebUI, Jan, Agno

🔹 Qua mcpo (bridge tool)

Dùng để kết nối Serena với những client không hỗ trợ MCP, nhưng có hỗ trợ tool calling qua OpenAPI (ví dụ ChatGPT).

🔹 Nhúng trực tiếp vào agent framework

Các tool trong Serena được xây dựng độc lập với framework → bạn có thể đưa vào bất kỳ agent framework nào (LangChain, LlamaIndex, v.v.), như một “plugin” chuyên về code.

💡 Điểm mạnh: Serena không khóa bạn vào một LLM hay IDE cụ thể. Dù bạn dùng ChatGPT, Claude, Gemini hay bất kỳ model nào, Serena đều có thể biến LLM đó thành một coding agent mạnh mẽ.

Hướng dẫn cài đặt Serena MCP trên Cursor (macOS)

🔹 Bước 1: Cài đặt uvx

Chạy lệnh trong Terminal:

brew install uvx

🔹 Bước 2: Thêm Serena MCP vào Cursor

Mở Cursor Settings
Vào mục MCP → Thêm mới MCP
Trong file mcp.json, thêm cấu hình sau:

{
  "mcpServers": {
    "serena": {
      "command": "uvx",
      "args": [
        "--from",
        "git+https://github.com/oraios/serena",
        "serena",
        "start-mcp-server",
        "--context",
        "ide-assistant"
      ]
    }
  }
}

🔹 Bước 3: Kiểm tra Serena đã chạy thành công

Sau khi restart Cursor, Serena MCP server sẽ được khởi động tại localhost
Bạn có thể mở trình duyệt và truy cập: 👉 http://127.0.0.1:24282/dashboard/index.html
Tại đây sẽ hiển thị dashboard của Serena, xác nhận rằng server đã chạy

⚡️ Giờ thì bạn có thể bắt đầu sử dụng Serena trực tiếp trong Cursor, tận dụng các công cụ phân tích code và chỉnh sửa thông minh giống như IDE xịn + AI hỗ trợ.

Bắt đầu sử dụng Serena trong Cursor

1. Kiểm tra Serena đã kết nối

Mở Command Palette (⌘ + Shift + P)
Gõ:
- MCP: List Tools → để xem danh sách tool mà Serena cung cấp
- MCP: Call Tool → để gọi trực tiếp một tool bất kỳ từ Serena

Nếu bạn thấy các tool này, nghĩa là Serena đã được kết nối thành công.

2. Index dự án với Serena (Bước quan trọng)

Mở chat với AI và nhập lệnh:

"Use Serena to index the entire project."

Chờ Serena hoàn tất indexing (tùy project lớn/nhỏ sẽ nhanh hay chậm)
Sau khi indexing xong, Serena sẽ hiểu toàn bộ codebase ở mức symbol-level

3. Chat AI trong Cursor với Serena

Không dùng Serena (AI tự đoán):

"Find where process_audio_file_url is used."

Dùng Serena (AI gọi đúng tool):

"Use Serena to find where process_audio_file_url is referenced."
"Insert a new function after the UserService class using Serena."

Quan sát: Thay vì đọc toàn file, AI sẽ gọi Serena để tìm chính xác vị trí cần chỉnh sửa → tiết kiệm token, nhanh hơn và code chất lượng hơn.

Hiểu về thư mục `memories/`

Sau khi dùng “Use Serena to index the entire project.”, Cursor sẽ có thêm 1 thư mục memories/.

📂 Thư mục memories dùng để làm gì?

Khi bạn bảo Serena index dự án, nó sẽ quét toàn bộ codebase và trích xuất ra thông tin ở mức symbol-level (class, function, biến, module, dependency, …). Những dữ liệu này không chỉ dùng trong một session, mà được lưu trữ lại trong thư mục memories/ để tái sử dụng.

🔹 Chức năng chính của thư mục memories

Lưu trữ index codebase đã phân tích
- Thay vì phải index lại toàn bộ project mỗi lần mở Cursor, Serena sẽ đọc từ memories/ để tiết kiệm thời gian
- Với project lớn (hàng nghìn file), điều này cực kỳ quan trọng
Giúp Serena “ghi nhớ” ngữ cảnh codebase qua nhiều phiên làm việc
- Cho phép Serena hiểu liên kết giữa các file, dependency, và symbol
- Nhờ đó khi bạn quay lại project, Serena vẫn có thể truy vấn chính xác mà không cần quét lại từ đầu
Tăng tốc độ tìm kiếm và chỉnh sửa code
- Khi bạn gọi tool như find_symbol, Serena sẽ tìm trực tiếp trong dữ liệu memories thay vì đọc toàn bộ file
- Điều này làm giảm đáng kể chi phí token và cải thiện tốc độ phản hồi
Cơ chế cập nhật thông minh
- Nếu bạn chỉnh sửa hoặc thêm file mới, Serena có thể cập nhật lại memories (re-index incrementally) thay vì làm lại toàn bộ
- Giúp giữ bộ nhớ luôn đồng bộ với trạng thái codebase hiện tại

🔹 Khi nào cần xoá hoặc làm mới memories/?

Khi project có thay đổi cấu trúc lớn (ví dụ: đổi tên thư mục gốc, refactor nhiều module cùng lúc)
Khi Serena trả về kết quả sai lệch → có thể do bộ nhớ cũ. Lúc này chỉ cần xóa thư mục memories/ và chạy lại indexing

👉 Nói đơn giản: memories là “bộ não dài hạn” của Serena. Nó cho phép AI làm việc hiệu quả như một IDE, không mất công quét lại dự án mỗi lần bạn mở Cursor.

Quản lý & Làm mới thư mục memories

Đôi khi project thay đổi nhiều, hoặc Serena trả kết quả chưa chính xác → bạn có thể cần làm mới (refresh) thư mục memories/.

🔹 1. Re-index toàn bộ project

Trong chat với AI trong Cursor, gõ:

"Use Serena to re-index the entire project."

Serena sẽ xoá index cũ trong memories/ và quét lại toàn bộ codebase.

🔹 2. Cập nhật incremental (khi thêm file/hàm mới)

Nếu bạn chỉ thêm vài file mới hoặc sửa một phần nhỏ, không cần index lại hết. Hãy chat với AI:

"Use Serena to update index for changed files only."

Serena sẽ scan phần thay đổi và cập nhật lại memories/ thay vì làm lại từ đầu.

🔹 3. Xoá thủ công thư mục memories/

Trong trường hợp nghi ngờ index bị lỗi hoặc không đồng bộ:

Thoát Cursor
Xoá thư mục memories/ trong project: rm -rf memories
Mở lại Cursor và yêu cầu: "Use Serena to index the entire project."

→ Serena sẽ tạo lại bộ nhớ mới sạch sẽ.

✅ Khi nào nên refresh memories?

Project refactor lớn, đổi cấu trúc folder
Serena tìm nhầm symbol hoặc không thấy hàm/class mới thêm
Project import dependency mới hoặc xoá nhiều module cũ

Case Study: Serena thay đổi game như thế nào? 🚀

1. Câu chuyện thực tế

Trong dự án Realtime Translator của công ty, mình sử dụng Claude 4 để hỗ trợ code (sau 2 tuấn để test và thực nghiệm) . Claude 4 rất mạnh về suy luận và viết code, nhưng có một nhược điểm chí mạng: ngốn token khủng khiếp.

Trước khi dùng Serena → chỉ 7 ngày là đã hết quota. Sau khi dùng Serena → tận 2 tuần vẫn chưa hết quota.

Tại sao? Vì mỗi lần yêu cầu AI chỉnh sửa code, nó phải “cày” qua hàng ngàn dòng code không liên quan, đọc cả những file chẳng liên quan gì đến yêu cầu.

👉 Điều này dẫn đến:

Tốn token vô ích
Phản hồi chậm
Độ chính xác giảm vì ngữ cảnh bị nhiễu loạn

Serena ra đời chính là để giải quyết nỗi đau này!

2. Những lợi ích cụ thể

🔥 Hiệu suất & độ chính xác vượt trội

AI không còn bị “ngợp” bởi hàng đống code vô nghĩa. Ngữ cảnh gọn gàng → phản hồi nhanh, chính xác, ít nhầm lẫn.

💸 Tiết kiệm chi phí và tokens

Thay vì để AI đọc cả codebase, chỉ những phần liên quan mới được đưa vào. Với các mô hình tính phí dựa trên token (như Claude, GPT-4), bạn sẽ tiết kiệm được một khoản lớn.

Cá nhân mình dùng Claude Code Pro ($17), trước kia rất dễ chạm limit. Từ ngày có Serena → vẫn còn chạm limit, nhưng đã cải thiện đáng kể

Lưu ý quan trọng khi sử dụng Serena

🔹 Cài đặt theo từng dự án

Serena nên được cài theo từng dự án (per-project)
Không nên cài ở scope “user” vì dữ liệu index có thể bị lẫn lộn giữa các project
Mỗi khi chuyển project, hãy đảm bảo Serena được cấu hình riêng biệt

🔹 Indexing định kỳ

Với project thay đổi thường xuyên, nên re-index ít nhất 1 tuần/lần
Khi add/remove nhiều dependency, luôn chạy lại indexing

🔹 Monitoring hiệu suất

Theo dõi dashboard Serena để đảm bảo server hoạt động ổn định
Nếu thấy phản hồi chậm, kiểm tra lại cấu hình MCP và memory usage

Kết luận

Serena không chỉ là một công cụ, mà là một game changer cho cách chúng ta làm việc với AI trong lập trình. Bằng cách biến LLM thành một coding agent thực sự hiểu codebase, Serena mở ra những khả năng mới:

Tiết kiệm chi phí đáng kể khi sử dụng LLM
Tăng tốc độ và độ chính xác trong các tác vụ coding
Mở rộng khả năng của AI từ “code generator” thành “code collaborator”

Và quan trọng nhất, tất cả điều này đều hoàn toàn miễn phí và mã nguồn mở.

👉 Hành động ngay hôm nay: Hãy thử cài đặt Serena cho project của bạn và trải nghiệm sự khác biệt. Bạn sẽ ngạc nhiên về hiệu quả mà nó mang lại!

Bài viết được viết dựa trên trải nghiệm thực tế sử dụng Serena trong các dự án production. Để biết thêm thông tin chi tiết và cập nhật mới nhất, hãy truy cập GitHub repository của Serena.

Buổi học nội bộ! Tìm hiểu “MCP” – giao thức không thể thiếu trong ứng dụng AI tạo sinh

Posted on May 30, 2025June 19, 2025 by hello@scuti

Internal seminar about MCP

Xin chào, tôi là Kakeya, Giám đốc điều hành của Scuti.

Công ty chúng tôi chuyên phát triển offshore tại Việt Nam với thế mạnh về AI tạo sinh. Chúng tôi cung cấp các dịch vụ như Tư vấn AI tạo sinh và AI-OCR, và gần đây rất vui mừng khi nhận được nhiều yêu cầu phát triển hệ thống tích hợp cùng AI tạo sinh.

Gần đây, Scuti đã tổ chức một buổi học nội bộ để nâng cao hiểu biết về “MCP (Model Connection Protocol)”.

MCP là một giao thức dùng để kết nối AI – đặc biệt là LLM (Mô hình ngôn ngữ lớn) – với các dịch vụ bên ngoài. Mặc dù nghe có vẻ kỹ thuật, nhưng thực tế lại rất hữu ích ngay cả đối với những người không phải kỹ sư. Ví dụ, khi sử dụng các công cụ như Claude, MCP giúp tích hợp hiệu quả với các dịch vụ khác, nâng cao năng suất đáng kể.

Buổi học này hướng đến cả kỹ sư và những người không chuyên kỹ thuật. Nội dung bao gồm khái niệm cơ bản về MCP, các ví dụ ứng dụng thực tế, cũng như cách triển khai vào công việc hàng ngày. Một điểm nổi bật là việc sử dụng MCP kết hợp với các công cụ phát triển như Cursor để kết nối với các dịch vụ bên ngoài, từ đó tăng tốc độ phát triển và nâng cao chất lượng sản phẩm. Đây là kỹ năng gần như bắt buộc đối với kỹ sư.

Tại Scuti, chúng tôi luôn nỗ lực tạo ra môi trường giúp mọi thành viên cập nhật các công nghệ mới nhất. Ngoài các buổi hội thảo nội bộ thường xuyên, chúng tôi còn có chính sách thưởng cho việc nghiên cứu và chia sẻ kết quả, cũng như hỗ trợ nhân viên lấy các chứng chỉ kỹ thuật.

Trong thời đại AI tạo sinh ngày càng gắn liền với sự phát triển kinh doanh, saldo5d việc toàn bộ nhân viên có cùng nền tảng kiến thức và khả năng áp dụng thực tiễn là điều vô cùng quan trọng. Thông qua các buổi học như thế này, Scuti tiếp tục củng cố năng lực công nghệ và khả năng phối hợp nội bộ một cách vững chắc.

Internal Study Session Held! Learning the Essential “MCP” for Generative AI Utilization

Posted on May 30, 2025 by hello@scuti

Hello, this is Kakeya, CEO of Scuti.

Our company specializes in offshore development in Vietnam with a strong focus on generative AI. We provide services such as Generative AI Consulting and Generative AI-OCR, and we are grateful to have received a growing number of system development requests integrated with generative AI.

Recently, we held an internal study session at Scuti to deepen our understanding of “MCP (Model Connection Protocol).”

MCP is a protocol that connects AI—particularly LLMs (Large Language Models)—with external services. While it may sound technical, it is actually quite useful even for non-engineers. For example, when using tools like Claude, MCP enables seamless integration with other services, greatly enhancing efficiency.

The study session was designed to benefit both engineers and non-engineers. It covered the fundamentals of MCP, practical use cases, and how this protocol can be applied to everyday operations. One of the key highlights was how MCP can be utilized with development tools such as Cursor to connect with various external services, thus boosting development speed and product quality. For engineers, this is becoming an essential skill.

At Scuti, we are committed to fostering an environment where every team member can stay up-to-date with the latest technologies. We hold regular internal seminars, offer incentive programs for research and output sharing, and actively support the acquisition of technical certifications.

As generative AI becomes increasingly integral to business growth, it is crucial for all team members to have a common understanding of the technologies involved and be able to apply them effectively. Through sessions like this, Scuti continues to strengthen its technological capabilities and collaborative potential across teams.

Dify MCP Plugin & Zapier: A Hands-On Guide to Agent Tool Integration

Posted on April 29, 2025October 10, 2025 by Tuan Nguyen

Introduction

Leverage the power of the Model Context Protocol (MCP) in Dify to connect your agents with Zapier’s extensive application library and automate complex workflows. Before we dive into the integration steps, let’s quickly clarify the key players involved:

Dify: This is an LLMops platform designed to help you easily build, deploy, and manage AI-powered applications and agents. It supports various large language models and provides tools for creating complex AI workflows.
Zapier: Think of Zapier as a universal translator and automation engine for web applications. It connects thousands of different apps (like Gmail, Slack, Google Sheets, etc.) allowing you to create automated workflows between them without needing to write code.
MCP (Model Context Protocol): This is essentially a standardized ‘language’ or set of rules. It allows AI agents, like those built in Dify, to understand what external tools (like specific Zapier actions) do and how to use them correctly.

Now that we understand the components, let’s explore how to bring these powerful tools together.

Integrating Zapier with Dify via MCP

Zapier Setup

Visit Zapier MCP Settings.
Copy your unique MCP Server Endpoint link.
Click “Edit MCP Actions” to add new tools and actions.
Click “Add a new action”.
Select and configure specific actions like “Gmail: Reply to Email”.
To set up:
– Click “Connect to a new Gmail account”, log in, and authorize your account.

– For fields like thread, to, and body, select “Have AI guess a value for this field”.
Repeat to expand your toolkit with “Gmail: Send Email” action.

MCP Plugins on Dify

MCP SSE: A plugin that communicates with one or more MCP Servers using HTTP + Server-Sent Events (SSE), enabling your Agent to discover and invoke external tools dynamically.
MCP Agent Strategy: This plugin integrates MCP directly into Workflow Agent nodes, empowering agents to autonomously decide and call external tools based on MCP-defined logic.

MCP SSE

Customize the JSON template below by inputting your Zapier MCP Server URL in place of the existing one. Paste the resulting complete JSON configuration into the installed plugin.

{
“server_name”: {
“url”: “https://actions.zapier.com/mcp/*******/sse”,
“headers”: {},
“timeout”: 5,
“sse_read_timeout”: 300
}
}

After setting things up, proceed to create a new Agent app. Ensure you enable your configured MCP SSE plugin under ‘Tools’. This allows the Agent to automatically trigger relevant tools based on the user’s intent, such as drafting and sending emails via an integrated Gmail action.

MCP Agent Strategy

Besides the SSE plugin, the MCP Agent Strategy plugin puts MCP right into your workflow’s Agent nodes. After installing it, set up the MCP Server URL just like before. This allows your workflow agents to automatically use Zapier MCP on their own to do tasks like sending Gmail emails within your automated workflows.

Final Notes

Currently (April 2025), Dify’s MCP capabilities are thanks to fantastic community plugins – our sincere thanks to the contributors! We’re also developing built-in MCP support to make setting up services like Zapier MCP and Composio within Dify even easier. This will unlock more powerful integrations for everyone. More updates are coming soon!

References: Dify MCP Plugin Hands-On Guide: Integrating Zapier for Effortless Agent Tool Calls