PP-StructureV3 - OCR识别模型详解

2024年发布

PaddleOCR 3.0最新通用文档解析方案,在公开评测中领先众多开源和闭源方案

性能指标与技术参数

准确率

96%

处理速度

82%

复杂度

模型大小

1.2GB

技术规格

输入格式

PDF, PNG, JPEG, TIFF

输出格式

Markdown, JSON, HTML, Word

处理速度

0.99-4.09秒/页

最大文件

500MB

硬件要求

CPU/GPU/NPU多平台支持

核心功能

  • 多场景多布局PDF高精度解析
  • 表格结构精确识别和重建
  • 数学公式识别(PP-FormulaNet)
  • 图表理解和解析(PP-Chart2Table)
  • 印章文字识别能力
  • 文档图像预处理技术
  • 多卡并行推理支持
  • 丰富的二次开发能力

适用场景

表格识别公式识别图表分析多场景文档

使用场景

企业财务报表智能分析
学术科研文献数字化
政务文件结构化处理
法律合同表格提取
医疗检查报告解析
工业技术文档处理

性能指标

公开评测

公开评测领先

公式识别准确率

95%+

表格识别准确率

94%+

图表转换

80.60% RMS-F1

产业化采用

广泛产业化应用