5.4.1将图像转换成为文本
pagemanager 的强大功能之一是 ocr (光学字符识别)。ocr 可以识别文件中的图像和文本,然后将文件转换至可编辑的形式。文件可保存为 html、rtf 或 txt格式。
将图像转换成为文本(ocr)有两种方式:

辨识后的图文排列与其原稿上的排列方式是一样的。被辨识的文本将被视作图像的内容部分,文本内容可以很容易地通过查找功能来取得。

3.使用应用程序工具栏中的winocr进行识别。

2)将此文件拖动到应用程序工具栏中的winocr应用程序图标 识别。如下图所示:

辨别后的文本将在winocr中,您可以通过winocr进行编辑文本、再识别、保存等。具体的操作详见《winocr使用说明》
5.4.2将辨识后的文本保存为 txt/rtf/html格式
1.在 [文件] 菜单选项中选择另存为命令或在常用工具栏上单击另存为图标。
在打开另存为对话框中:
1)输入保存的文件名。
2)在保存类型下拉菜单选项中,选择一个文件格式 (txt, rtf 或 html)。
3)单击确定按钮保存辨识后的文本文件。
若选择的图像尚未执行文本辨识,则将先进行辨识然后再执行另存为。

5.4.3删除辨识后的文本文件
在图像执行文本辨识后,您可以选择 [编辑] 菜单选项中的删除辨识后的文本文件命令以删除已经辨识的文本文件。
1.选择该图像文件,进入浏览全页。(注:在缩略图查看中,删除辨识后的文本文件是禁用的)
2.点击[编辑]-][删除辨识后的文本文件]
3.单击[确定]删除。如图所示: