Siêu năng lực Xử lý Tài liệu cho Trợ lý AI của bạn

Connect AI agents to Documentize with MCP

The Documentize MCP server exposes all document processing capabilities as tools for AI agents and LLM clients — convert, merge, extract, sign, and more, directly from Claude Desktop, VS Code Copilot, Cursor, or any MCP-compatible host.

⚡ Endpoint

The MCP server runs over Streamable HTTP at:

https://api.documentize.app/mcp

The server uses stateful sessions. After the initial initialize request the server returns an Mcp-Session-Id header; include it in every subsequent request. MCP clients handle this automatically.

🔌 Connect from Claude Desktop

Add the server to claude_desktop_config.json (%APPDATA%\Claude\ on Windows, ~/Library/Application Support/Claude/ on macOS):

{
  "mcpServers": {
    "documentize": {
      "type": "http",
      "url": "https://api.documentize.app/mcp"
    }
  }
}

Restart Claude Desktop. The Documentize tools will appear in the tool list.

🔌 Connect from VS Code (GitHub Copilot)

Create .vscode/mcp.json in your workspace (or add to User Settings):

{
  "servers": {
    "documentize": {
      "type": "http",
      "url": "https://api.documentize.app/mcp"
    }
  }
}

Open GitHub Copilot Chat, switch to Agent mode, and click the Tools button — Documentize tools will be listed there.

🔌 Connect from Cursor / Cline

In Cursor, open Settings → MCP and add a new server:

{
  "name": "documentize",
  "type": "http",
  "serverUrl": "https://api.documentize.app/mcp"
}

Cline users can add the same entry under MCP Servers in its settings panel.

⚙️ How tasks work

All processing tools are asynchronous. Each call starts a background job and returns a JSON object with a folderName field — that is your task ID.

  1. Call a processing tool (e.g. ConvertDocument) → receive a task ID.
  2. Call GetTaskStatus with that task ID and poll until statusCode is 200.
  3. Use the downloadURL from the status response to retrieve the result.
// 1. Start a task
ConvertDocument(fileUrl: "https://example.com/report.pdf",
                inputType: "pdf", outputType: "docx")
// → { "folderName": "abc123", "statusCode": 202 }

// 2. Poll
GetTaskStatus(taskId: "abc123")
// → { "statusCode": 200, "downloadURL": "https://..." }

Use GetNextAppSuggestions after any operation to get recommended follow-up tools based on the output format.

🧰 Available Tools

Document Operations

  • ConvertDocument — Convert between PDF, DOCX, PPTX, HTML, JPG, PNG, and more.
  • MergeDocuments — Combine multiple files into a single document.
  • SplitDocument — Split a PDF by page ranges, bookmarks, or fixed size.
  • CompressDocument — Reduce PDF file size (low / medium / high).
  • RotateDocument — Rotate all or selected pages by 90°, 180°, or 270°.
  • ResizeDocument — Resize PDF pages to A4, Letter, A3, etc.
  • RemovePages — Delete specific pages from a PDF.

Security

  • LockDocument — Encrypt a PDF with a password.
  • UnlockDocument — Remove a password from a protected PDF.
  • SignDocument — Digitally sign a document.
  • VerifySignature — Verify existing digital signatures.

Content Extraction

  • ExtractText — Pull all text from a document (Pure or Raw mode).
  • ExtractImages — Export all embedded images.
  • ExtractMetadata — Read author, title, creation date, keywords, etc.
  • ExtractFormData — Export data from fillable PDF form fields.
  • ParseDocument — Parse annotations, bookmarks, tables, and more.
  • SearchInDocument — Find text occurrences inside a document.
  • MakeSearchable — Add a text layer to a scanned PDF via OCR.
  • RunOcr — Run OCR on a scanned file or image to produce a searchable PDF.

Form & Structure

  • FlattenDocument — Flatten form fields and annotations (make non-editable).
  • AddTable — Embed a table from an Excel or CSV file into a PDF.
  • AddToc — Add a table of contents to a PDF based on its headings.

AI-Powered

  • GenerateTableOfContents — AI-structured TOC from document headings.
  • GenerateAbstract — Summarize a document (academic / professional / casual style).
  • GenerateChecklist — Extract tasks, requirements, or compliance items from a document.
  • AnalyzeResume — Extract, analyze, or compare a CV against a job description.
  • ChatWithDocument — Ask questions about document content (RAG).
  • GenerateSvg — Create an SVG illustration from a text prompt.
  • AddIllustrations — Generate AI illustrations and embed them in a document.

Status & Utility

  • GetTaskStatus — Check task progress; returns download link when ready.
  • GetNextAppSuggestions — Get recommended follow-up operations for a given output.

📋 Notes

  • File sources must be public URLs accessible from the server (no local paths).
  • For MergeDocuments, pass file URLs as a comma-separated string.
  • Status codes: 202/203 = still processing, 200 = done, 500 = error.
  • MCP protocol version reported by the server: 2025-11-25.

Quick Reference

MCP Endpoint

https://api.documentize.app/mcp

claude_desktop_config.json

{
  "mcpServers": {
    "documentize": {
      "type": "http",
      "url": "https://api.documentize.app/mcp"
    }
  }
}

.vscode/mcp.json

{
  "servers": {
    "documentize": {
      "type": "http",
      "url": "https://api.documentize.app/mcp"
    }
  }
}

Key Facts

  • Protocol: MCP 2025-11-25 (Streamable HTTP)
  • Sessions: stateful — Mcp-Session-Id header required after init
  • Tasks are async — poll GetTaskStatus for the download link
  • All file inputs must be public URLs

Kết nối Claude, Cursor hoặc bất kỳ client tương thích MCP nào với hơn 28 công cụ tài liệu. Chuyển đổi, nén, ký, trích xuất văn bản, thực hiện OCR và tạo bản tóm tắt AI — tất cả bằng ngôn ngữ tự nhiên.

Cách Documentize MCP hoạt động

1. Kết nối Máy khách MCP của bạn

Thêm máy chủ Documentize MCP vào Claude Desktop, Cursor, VS Code hoặc bất kỳ khách hàng tương thích MCP nào. Cấu hình chỉ trong một dòng.

2. Khởi tạo Phiên

Khách hàng của bạn tự động gửi yêu cầu khởi tạo và nhận được ID phiên. Tất cả các cuộc gọi tiếp theo sẽ sử dụng phiên này để theo dõi (hoàn hảo cho mô hình kiếm tiền dựa trên việc sử dụng).

3. Hỏi một cách tự nhiên

\"Chuyển đổi PDF này sang DOCX\" — trợ lý AI của bạn sẽ gọi công cụ phù hợp với tài liệu của bạn. Không cần tài liệu API.

4. Nhận Kết Quả

Máy chủ xử lý bất đồng bộ, kiểm tra trạng thái và chuyển giao tài liệu đã chuyển đổi hoặc dữ liệu đã trích xuất trực tiếp tới trợ lý AI của bạn.

FAQs

Model Context Protocol (MCP) là một tiêu chuẩn mở cho phép các trợ lý AI như Claude và Cursor gọi trực tiếp các công cụ. Thay vì viết mã API, bạn chỉ cần yêu cầu một cách tự nhiên. Documentize cung cấp một máy chủ MCP với 28 công cụ xử lý tài liệu mà AI của bạn có thể sử dụng ngay lập tức.
Chế độ có trạng thái cho phép theo dõi theo từng phiên, đo lường sử dụng và cô lập khách hàng — cần thiết cho việc kiếm tiền. Mỗi khách hàng nhận được một ID phiên duy nhất sau khi khởi tạo, bạn có thể dùng để tính phí dựa trên mức sử dụng, áp dụng giới hạn tốc độ, hoặc theo dõi hoạt động của khách hàng. Trình khách AI của bạn sẽ tự động xử lý ID phiên này.
Có! Sử dụng các URI file:// (ví dụ: file:///home/user/document.pdf). Máy khách MCP của bạn gửi đường dẫn tệp, và Documentize đọc trực tiếp từ hệ thống tệp cục bộ của bạn. Thích hợp cho các tài liệu nhạy cảm không nên được tải lên đám mây.
Claude Desktop (với Chế độ Agent), Cursor IDE, VS Code với Copilot, Continue.dev, và bất kỳ client nào tương thích với MCP. Chúng tôi cũng cung cấp truy cập HTTP trực tiếp cho các tích hợp tùy chỉnh.
Documentize chạy trên hạ tầng của bạn khi tự lưu trữ, hoặc trên các máy chủ tại EU của chúng tôi cho phiên bản đám mây. Đối với máy chủ MCP, bạn có thể chọn: tự lưu trữ để kiểm soát dữ liệu hoàn toàn, hoặc sử dụng API đám mây của chúng tôi để tiện lợi. Dữ liệu tài liệu không bao giờ được sử dụng để huấn luyện các mô hình AI.
Documentize cung cấp động cơ xử lý. Bạn thêm middleware xác thực, theo dõi việc sử dụng và thanh toán. Mô hình phiên làm việc có trạng thái cung cấp các tiêu đề Mcp-Session-Id mà bạn có thể liên kết với khóa API hoặc tài khoản người dùng. Chúng tôi cung cấp giấy phép cho việc phân phối thương mại.

Unlock the Power of Document Management

Kiến trúc SVG đa lớp sâu

Mỗi SVG được tạo thành các lớp Nền, Trung cảnh và Tiền cảnh với thứ tự Z-index và theo dõi phụ thuộc. AI quản lý mối quan hệ giữa các lớp và tự động loại bỏ các lớp hiệu suất kém để giữ cho kết quả sạch sẽ và nhất quán.

Chỉnh sửa SVG lặp lại

Cải thiện và chỉnh sửa thiết kế SVG thông qua trò chuyện AI liên tục.

Tạo Vector nhanh

Tạo biểu tượng, logo và minh họa trong vài giây.

Giá đơn giản, dựa trên mức sử dụng

Gói Miễn Phí

$0
  • 50 thao tác tài liệu mỗi tháng
  • Tất cả 28 công cụ MCP
  • Hỗ trợ cộng đồng
  • Giới hạn tốc độ: 5 yêu cầu/phút

Pro

$49
  • 2.000 thao tác mỗi tháng
  • Hàng đợi xử lý ưu tiên
  • Hỗ trợ qua email
  • Giới hạn tốc độ: 30 yêu cầu/phút
  • Bảng điều khiển phân tích sử dụng

Doanh nghiệp

Tùy chỉnh
  • Hoạt động không giới hạn
  • Lựa chọn hạ tầng chuyên dụng
  • Cam kết SLA (99,9%)
  • SSO & quản lý nhóm
  • Phát triển công cụ tùy chỉnh