PP-StructureV3 - OCR识别模型详解
2024年发布
PaddleOCR 3.0最新通用文档解析方案,在公开评测中领先众多开源和闭源方案
性能指标与技术参数
准确率
96%
处理速度
82%
复杂度
高
模型大小
1.2GB
技术规格
输入格式
PDF, PNG, JPEG, TIFF
输出格式
Markdown, JSON, HTML, Word
处理速度
0.99-4.09秒/页
最大文件
500MB
硬件要求
CPU/GPU/NPU多平台支持
核心功能
- ✓多场景多布局PDF高精度解析
- ✓表格结构精确识别和重建
- ✓数学公式识别(PP-FormulaNet)
- ✓图表理解和解析(PP-Chart2Table)
- ✓印章文字识别能力
- ✓文档图像预处理技术
- ✓多卡并行推理支持
- ✓丰富的二次开发能力
适用场景
表格识别公式识别图表分析多场景文档
使用场景
✓企业财务报表智能分析
✓学术科研文献数字化
✓政务文件结构化处理
✓法律合同表格提取
✓医疗检查报告解析
✓工业技术文档处理
性能指标
公开评测
公开评测领先
公式识别准确率
95%+
表格识别准确率
94%+
图表转换
80.60% RMS-F1
产业化采用
广泛产业化应用
相关推荐
MinerU OCR模型
了解MinerU的功能和特性
模型学术论文复杂文档
MonkeyOCR OCR模型
了解MonkeyOCR的功能和特性
模型快速识别图片文字
Docling OCR模型
了解Docling的功能和特性
模型PDF转换文档解析
学术论文中的PP-StructureV3应用
PP-StructureV3在学术论文领域的应用案例
相关MinerUPP-StructureV3
手写识别中的PP-StructureV3应用
PP-StructureV3在手写识别领域的应用案例
相关MonkeyOCRPP-StructureV3
金融票据中的PP-StructureV3应用
PP-StructureV3在金融票据领域的应用案例
相关PP-StructureV3MinerU