Run MarkItDown On Local And Check The Accuracy Of Some Files Types Like PPT, Excel, Images

Link github:

https://github.com/microsoft/markitdown

git clone [email protected]:microsoft/markitdown.git

cd markitdown

pip install -e packages/markitdown

git clone git@github.com:microsoft/markitdown.git

Now try it

First I try it with this PDF document

PDF document

Then, this is result


It looks good!

Then, I try it with PPTX file

This is the result. It seems to be able to get quite complete information on the slide including links, page numbers, comments, etc. but it cannot get information on images, shapes or charts.

Finally, I try it with Excel file

It seems to be able to get the content of all sheets. However it takes blank cells and sets the value to NaN. Also it can’t get the text on the image.

I think this output needs to be processed further if I want to use it.

Thanks for reading!

GitHub Copilot và Cursor AI: Đâu Là Trợ Lý Lập Trình AI Tốt Nhất 2025?

GitHub Copilot và Cursor AI
GitHub Copilot và Cursor AI

Trong giới lập trình ngày nay, trí tuệ nhân tạo (AI) đang dần trở thành người bạn đồng hành đáng tin cậy của các nhà phát triển. Hai trong số những trợ lý lập trình AI nổi bật hiện nay là GitHub CopilotCursor AI. Mỗi công cụ mang đến những trải nghiệm độc đáo, hỗ trợ lập trình viên viết mã hiệu quả và sáng tạo hơn. Hãy cùng khám phá và so sánh chi tiết hai trợ lý này để tìm ra lựa chọn phù hợp nhất cho bạn.

Sự phát triển của AI đã mở ra những chân trời mới trong lĩnh vực lập trình. Từ việc tự động hoàn thành mã đến gợi ý cấu trúc phức tạp, AI đang giúp lập trình viên tiết kiệm thời gian và giảm thiểu sai sót. Trong bối cảnh đó, GitHub Copilot và Cursor AI xuất hiện như những giải pháp hàng đầu, mang đến những tính năng hỗ trợ mạnh mẽ và linh hoạt.

Tổng quan về GitHub Copilot

Github Copilot
Github Copilot
  • Lịch sử phát triển và nhà phát triển

    GitHub Copilot là sản phẩm hợp tác giữa GitHub và OpenAI, ra mắt vào năm 2021. Với sự kết hợp giữa kho mã nguồn phong phú của GitHub và mô hình ngôn ngữ tiên tiến của OpenAI, Copilot nhanh chóng trở thành công cụ hỗ trợ đắc lực cho lập trình viên.

  • Các tính năng chính

    • Hoàn thành mã tự động: Copilot cung cấp gợi ý mã theo ngữ cảnh, giúp lập trình viên viết mã nhanh chóng và chính xác.

    • Hỗ trợ đa ngôn ngữ lập trình: Từ Python, JavaScript đến Ruby và Go, Copilot đáp ứng nhu cầu của nhiều lập trình viên với đa dạng ngôn ngữ.

    • Tích hợp sâu với Visual Studio Code: Copilot hoạt động mượt mà trong môi trường Visual Studio Code, mang lại trải nghiệm liền mạch cho người dùng.

  • Ưu điểm

    • Gợi ý mã chính xác và phù hợp ngữ cảnh: Dựa trên ngữ cảnh hiện tại, Copilot đưa ra các gợi ý mã phù hợp, giúp tiết kiệm thời gian và công sức.

    • Học hỏi từ cộng đồng mã nguồn mở: Với quyền truy cập vào kho mã nguồn mở khổng lồ trên GitHub, Copilot liên tục cập nhật và cải thiện khả năng gợi ý.

  • Nhược điểm

    • Gợi ý đôi khi không chính xác: Mặc dù mạnh mẽ, nhưng đôi khi Copilot có thể đưa ra các gợi ý không phù hợp hoặc lỗi thời.

    • Vấn đề về bảo mật và bản quyền: Sử dụng mã gợi ý từ Copilot có thể dẫn đến lo ngại về bản quyền và bảo mật, đặc biệt khi mã được lấy từ các nguồn không rõ ràng.

Tổng quan về Cursor AI

Cursor AI
Cursor AI
  • Giới thiệu về công cụ và nhà phát triển

    Cursor AI là một môi trường phát triển tích hợp (IDE) được tăng cường bởi AI, phát triển bởi Anysphere Inc. Được xây dựng dựa trên Visual Studio Code, Cursor mang đến trải nghiệm lập trình mới mẻ với sự hỗ trợ mạnh mẽ từ AI.  Nằm trong top 15 AI dược đề xuất mạnh nhất hiện nay

  • Các tính năng nổi bật

    • Hoàn thành mã đa dòng: Cursor có khả năng gợi ý và hoàn thành nhiều dòng mã cùng lúc, giúp tăng tốc quá trình phát triển.

    • Tạo mã tự động với Composer: Composer của Cursor có thể tạo ra toàn bộ ứng dụng dựa trên mô tả, hỗ trợ nhiều ngôn ngữ lập trình trong cùng một dự án.

    • Chức năng chat nhận biết ngữ cảnh: Tính năng chat của Cursor có khả năng hiểu ngữ cảnh và hỗ trợ cả hình ảnh, giúp lập trình viên dễ dàng tương tác và nhận gợi ý từ AI.

  • Ưu điểm

    • Tích hợp AI sâu sắc: Cursor không chỉ là một công cụ hỗ trợ mà còn là một trình soạn thảo mã với AI tích hợp, mang lại trải nghiệm liền mạch cho người dùng.

    • Khả năng tùy chỉnh cao: Người dùng có thể tùy chỉnh và mở rộng chức năng của Cursor theo nhu cầu cá nhân.

  • Nhược điểm

    • Cộng đồng người dùng còn hạn chế: So với các công cụ khác, Cursor vẫn đang trong giai đoạn phát triển và có cộng đồng người dùng nhỏ hơn.

    • Tài liệu hướng dẫn chưa phong phú: Do mới ra mắt, tài liệu và hướng dẫn sử dụng Cursor có thể chưa đáp ứng đầy đủ nhu cầu của người dùng.

So sánh chi tiết GitHub Copilot và Cursor AI

  • Hiệu suất và độ chính xác

    • GitHub Copilot: Được phát triển bởi GitHub và OpenAI, Copilot cung cấp gợi ý mã theo ngữ cảnh, giúp lập trình viên viết mã nhanh chóng và chính xác. Tuy nhiên, đôi khi Copilot có thể đưa ra các gợi ý không phù hợp hoặc lỗi thời.

    • Cursor AI: Là một môi trường phát triển tích hợp (IDE) được tăng cường bởi AI, Cursor cung cấp gợi ý mã chính xác và phù hợp với ngữ cảnh, đặc biệt hữu ích trong việc sửa lỗi và cập nhật API. Tuy nhiên, do còn mới, Cursor có thể gặp phải các gợi ý không chính xác hoặc không đầy đủ.

  • Khả năng tích hợp và hỗ trợ môi trường phát triển

    • GitHub Copilot: Tích hợp sâu với Visual Studio Code và các IDE khác như Neovim và JetBrains, hỗ trợ nhiều ngôn ngữ lập trình phổ biến, mang lại trải nghiệm liền mạch cho người dùng.

    • Cursor AI: Được xây dựng dựa trên Visual Studio Code, Cursor mang đến trải nghiệm lập trình mới mẻ với sự hỗ trợ mạnh mẽ từ AI. Tuy nhiên, do còn mới, khả năng tích hợp của Cursor có thể chưa đa dạng bằng Copilot.

  • Giá cả và mô hình kinh doanh

    • GitHub Copilot: Cung cấp gói dịch vụ với giá 10 USD/tháng hoặc 100 USD/năm cho cá nhân. Các sinh viên và chủ sở hữu dự án mã nguồn mở nổi bật có thể được sử dụng miễn phí.

    • Cursor AI: Hiện tại, Cursor cung cấp phiên bản miễn phí và phiên bản Pro với giá 20 USD/tháng, mang lại hiệu năng và tính năng vượt trội.

Bảng so sánh GitHub Copilot và Cursor AI

Tiêu chí GitHub Copilot Cursor AI
Độ chính xác Gợi ý mã chính xác theo ngữ cảnh, nhưng đôi khi lỗi thời Gợi ý chính xác, hỗ trợ tốt trong sửa lỗi và cập nhật API
Khả năng tích hợp Hỗ trợ Visual Studio Code, Neovim, JetBrains, v.v. Dựa trên Visual Studio Code, nhưng tích hợp chưa đa dạng
Hiệu suất Nhanh, nhưng đôi khi đưa ra mã không tối ưu Gợi ý tối ưu hơn trong một số trường hợp
Ngôn ngữ lập trình Hỗ trợ nhiều ngôn ngữ phổ biến Chủ yếu hỗ trợ JavaScript, Python và một số ngôn ngữ khác
Khả năng tự học Học từ dữ liệu mã nguồn mở trên GitHub Sử dụng AI để học từ code người dùng
Giá cả 10 USD/tháng hoặc 100 USD/năm (miễn phí cho sinh viên, dự án mã nguồn mở) 20 USD/tháng cho bản Pro, có bản miễn phí
Đối tượng phù hợp Lập trình viên muốn một công cụ ổn định, nhiều tính năng Những ai thích thử nghiệm môi trường phát triển mới
Hạn chế Đôi khi gợi ý mã cũ, chưa tối ưu Chưa phổ biến bằng Copilot, có thể gặp lỗi nhỏ

Kết luận

Cả  GitHub Copilot và Cursor AI đều là những trợ lý lập trình AI mạnh mẽ, mang lại nhiều lợi ích cho lập trình viên. Nếu bạn đang tìm kiếm một công cụ đã được kiểm chứng, tích hợp tốt với nhiều IDE và có cộng đồng người dùng rộng rãi, GitHub Copilot là lựa chọn phù hợp. Ngược lại, nếu bạn muốn trải nghiệm một môi trường phát triển tích hợp với AI, cung cấp các tính năng tiên tiến và không ngại thử nghiệm công cụ mới, Cursor AI đáng để xem xét. Việc lựa chọn giữa hai công cụ này phụ thuộc vào nhu cầu cụ thể và ngân sách của bạn.