MinerU官方版是一款智能数据提取工具,专注于 PDF 文档的高效解析,能快速处理图片、表格、公式等复杂内容。MinerU支持 70 多种语言和多种输出格式,包括 Markdown、JSON 等,满足全球用户需求。MinerU操作简单,功能强大,让 PDF 内容提取变得轻松便捷。
软件功能
1、公式精准转化为标准代码
强力解析长公式、多行公式与复杂嵌套数学结构
输出 LaTeX/MathML 格式,为科研类 Agent 与数理大模型提供标准输入
2、表格智能还原与结构化
攻克旋转、跨页、合并单元格等难题,消除 AI 对复杂表格的阅读障碍
输出 CSV/HTML/Markdown 等机器可读格式,无缝接入 RAG 数据处理流
3、分子检测识别
精确的分子检测
SOTA 性能的分子结构图识别能力
原子和键的识别与原始图像严格对应
4、多模态与全格式兼容
PDF、PPT、图片、网页 URL 一键解析
精准剥离图文并保留上下文关联,让 Agent 轻松"阅读"复杂排版文档
安装步骤
1、在下载直接下载MinerU,并解压,双击“.exe”文件,进入安装页面,点击“我同意”。
2、选择为谁安装后,点击“下一步”。
3、选择安装地址,点击“安装”。
4、等待安装完毕即可使用。
常见问答
1、文件超限会崩溃吗?
不会。API 专为 Agent 设计了自然语言异常引导。遇到超限(400 错误)时,会返回 agent_instruction 指令,引导 Agent 本地调用 Python(如 PyMuPDF)切分或压缩文件后重试,实现自动闭环处理。
2、如何切换完整版?
接入 Skill 时选择高精度通道,传入 APIKey(需在控制台获取),即可切换为高精度模式,输出纯净 Markdown 与 LaTeX 公式。
3、能否私有化部署?
可以。提供 SaaS 版和开源版 MCP Server,开源版托管在 GitHub 上,专供开发者自建 MinerU 引擎时使用。
更新日志
V0.13.0
修复了一些issue