百度文心 PaddleOCR-VL-1.6 发布：文档解析准确率超96.33%

时间：2026-06-25来源：互联网作者：tjxz

日前，百度文心正式推出 PaddleOCR-VL-1.6.作为文心大模型的衍生版本，PaddleOCR-VL-1.6 在 OmniDocBench v1.6 权威基准测试中准确率超过 96.3%，同时在 Real5-OmniDocBench 和 OmniDocBench v1.5 上也斩获最高分，综合表现位居全球首位，再度刷新行业 SOTA 纪录。

在权威评测集 OmniDocBench v1.6 上，PaddleOCR-VL-1.6总体得分达 96.33%，超越 Gemini-3-Pro、GPT-5.2、MinerU-2.5-Pro、GLM-OCR 等主流模型，综合性能全球第一。在 Real5-OmniDocBench 评测中得分 93.19%，较 Gemini-3-Pro 高出近 4 个百分点，在扫描件、弯折文档、屏幕拍照、光照变化及倾斜文档五大场景中均保持领先。

测试结果表明，PaddleOCR-VL-1.6 在文本、公式、表格等核心识别能力上全面超越当前主流开源及闭源方案，在表格、古籍、生僻字识别等复杂场景中的能力大幅提升，印章、Spotting、图表识别等多项关键能力也同步增强，能够更好地满足文档数字化需求。

据悉，PaddleOCR 基于文心大模型训练，是文心大模型多模态能力的重要组成部分，支持超过 100 种语言识别，用户遍及 170 多个国家和地区。此次发布的 PaddleOCR-VL-1.6 在 PaddleOCR-VL-1.5 基础上进一步升级，通过模型驱动的数据构建机制与渐进式训练优化，在维持 0.9B 轻量化架构的前提下，进一步提升了模型准确率与复杂场景适应能力。由于两代模型结构一致，开发者和企业无需额外适配即可直接升级。

近年来，PaddleOCR先后推出 PaddleOCR-VL、PaddleOCR-VL-1.5 等版本，其中 1.5 版本创新支持异形框定位。此前，GitHub Star 数突破 79.2K，超越谷歌 Tesseract OCR，成为全球最受开发者欢迎的开源 OCR 项目之一。

目前，PaddleOCR-VL-1.6 已在 PaddleOCR 官网上线，支持网页端直接访问和 API 方式调用。模型的代码与权重也已同步发布至 GitHub 和 Hugging Face，面向全球开发者免费开放。

百度文心 PaddleOCR-VL-1.6 发布：文档解析准确率超96.33%

相关文章更多>>

热门推荐

百度文心 PaddleOCR-VL-1.6 发布：文档解析准确率超96.33%

相关文章 更多>>

热门推荐

相关文章更多>>