使用Adobe PDF Services API对PDF文件执行OCR

最近更新： 2026年1月15日

主题：
PDF Services API

创建对象：

Beginner
Developer

创建PDF主图

借助OCR（光学字符识别），您可以解锁扫描的PDF以提取文本并创建可搜索的文件。使用我们功能强大的基于云的API，将OCR集成到任何文档工作流程中，为归档、复制文本和创建可搜索的文档索引提供了完美的解决方案。从扫描的PDF存储库创建可搜索的归档文件，以快速搜索功能解锁重要信息并节省时间。或者，对上传的扫描文档中的PDF应用OCR，以允许对其进行编辑以在入门培训工作流程中使用。

开发人员只需几分钟即可开始使用，并准备好运行为OCR提供的示例文件。

本教程介绍如何使用Node.js、Java和.Net语言的示例文件运行第一个PDF服务API OCR操作的基础知识。

步骤1：创建凭据并设置环境

使用下面的快速入门教程创建API凭据、下载示例文件和设置您的环境。

PDF服务API和Java快速入门

PDF服务API和.Net快速入门

PDF服务API和Node.js快速入门

运行示例文件中提供的OCR示例

我们的OCR操作默认支持英语语言环境，但也支持德语、法语、丹麦语和其他语言。默认值是美元语言环境。

在传递包含特定区域设置的OCR操作选项时，该方法还接受具有两个选项的“type”参数：

SEARCHABLE_IMAGE：在清理过程中修改原始图像（例如，使图像倾斜），然后将不可见文本图层放在图像上。此类型会删除不需要的对象，并且在某些情况下可能会生成可读性更高的文档。
SEARCHABLE_IMAGE_EXACT：确保文本可搜索且可选择。此选项会保留原始图像，并在其上放置一个不可见的文本图层。建议用于需要原始图像的最大保真度的情况。

Java

打开命令提示符。
将目录更改为示例代码目录。

例如，C:\Temp\PDFToolsAPI\adobe-dc-pdf-tools-sdk-java-samples>。
运行以下命令：

mvn -f pom.xml exec:java -Dexec.mainClass=com.adobe.platform.operation.samples.ocrpdf.OcrPDF

将在src/main/resources目录中创建您的PDF。

.Net