TurboOCR 是 aiptimizer 团队的 C++20/CUDA/TensorRT 服务器,封装了与 PaddleOCR 相同的 PP-OCRv5 模型,声称在 FUNSD 表单上达到每秒 268 张图片。我们在 OmniDocBench 设置上运行它,测量到在基准测试的前 500 页英文页面上达到每秒 28 页。
比我们测试过的最快 VLM LightOnOCR 快五十三倍。在原始吞吐量上完胜。关键问题是:达到每秒 28 页大约需要在全新机器上设置 90 分钟。它还在表格结构上得分为零。让我们来分析为什么、如何以及何时它才是真正正确的工具。
1、TurboOCR 到底是什么它不是库。不是 Python 包。它是一个生产级 OCR 服务器,你作为 Docker 容器部署,通过 HT...