Metadata-Version: 2.4
Name: mcp-document-parse
Version: 0.1.3
Summary: MCP provider for document parsing and conversion to Markdown
Author-email: Niutrans <tianfengning@niutrans.com>
License: MIT
Project-URL: Homepage, https://niutrans.com
Project-URL: Source, https://github.com/niutrans/mcp-document-parse
Keywords: mcp,document,parsing,markdown,pdf,word,excel,ppt
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.9
Classifier: Programming Language :: Python :: 3.10
Classifier: Programming Language :: Python :: 3.11
Classifier: Programming Language :: Python :: 3.12
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.10
Description-Content-Type: text/markdown
Requires-Dist: mcp[cli]>=1.21.0
Requires-Dist: requests>=2.31.0
Requires-Dist: tqdm>=4.60.0
Provides-Extra: dev
Requires-Dist: uv; extra == "dev"

# MCP Document Parse Tool

## 项目介绍

这是一个MCP（Model Communication Protocol）工具，用于帮助解析各种格式的文档（PDF、Word、Excel、PPT等）获取其内容。该工具提供了简单易用的接口，使您能够在各种应用中集成文档解析功能。

## 支持的文件格式

- PDF (.pdf)
- Word (.doc, .docx)
- Excel (.xls, .xlsx)
- PowerPoint (.ppt, .pptx)

## 安装方法

### 使用 uv 安装并启动发布版

```bash
uv tool install mcp-document-parse
```

## 环境变量

- `NIUTRANS_API_KEY`（必填）：小牛翻译开放平台提供文档API的 API Key,可免费使用, 请登录后获取:https://niutrans.com/cloud/api/list
- `NIUTRANS_DOCUMENT_APPID`（必填）：小牛翻译开放平台提供文档API的 APPID,可免费使用, 请登录后获取:https://niutrans.com/cloud/api/list

## 环境要求

- Python >= 3.9
- 依赖项已在 `pyproject.toml` 中定义

## MCP 客户端配置示例

若通过 `uv tool install` 安装，可在 `mcp.json` 中配置：

```json
{
  "mcpServers": {
    "document_parse": {
      "type": "stdio",
      "command": "uv",
      "args": [
        "tool",
        "run",
        "mcp-document-parse"
      ],
      "env": {
        "NIUTRANS_API_KEY": "${env.NIUTRANS_API_KEY}",
        "NIUTRANS_DOCUMENT_APPID": "${env.NIUTRANS_DOCUMENT_APPID}"
      }
    }
  }
}
```

启动支持MCP的应用后，执行 `ListTools` 即可看到 `parse_document_by_path` 工具，同时支持 `ListResources` 读取 `document://supported-types`。


## 工具说明

### parse_document_by_path

将指定路径的文件转换为Markdown格式。

**参数：**
- `file_path` (str): 文件的绝对路径，支持pdf、doc、docx、xls、xlsx、ppt、pptx格式

**返回：**
- 成功: `{"status": "success", "text_content": "文件内容", "filename": 文件名}`
- 失败: `{"status": "error", "error": "错误信息"}`


### document://supported-types

获取支持的文件类型信息。

**返回：**
- 包含支持的文件类型列表及其描述的JSON对象

## 许可证

MIT License

## 联系方式

如有问题或建议，请联系 tianfengning@niutrans.com
