紫光Ocr的操作流程分为设置、获取图像、版面分析、文字识别、编辑修改等五步,如图所示:

设置
使用系统前应根据应用环境及需求设定系统参数。从“命令”菜单选择“设置”命令,在打开的“设置”对话框中可对系统、扫描、识别、后编改及其它(表格、版面分析等)参数进行设定。这些参数一般按默认设置即可?
获取所要识别的图像文件
获取所要识别的图像文件有两种方式:通过扫描仪扫描新的图像或打开已有图像文件?

提示:扫描仪的操作请参照随同扫描仪附送的用户手册的指导?
1. th-ocr xp 可以识别彩色、灰度和黑白二值的图像,扫描时的扫描模式可任意设置?
2. 对普通书本的印刷质量,字号在5 号以上的印刷材料,可适当选择其扫描分辨率?00dpi,扫描亮度为自动或默认值;
3. 对已有的图像文件,要注意其图像存储格式是否符合紫光Ocr 系统的要求(非压缩Tiff 格式、Packbit 或G4 压缩的Tiff 格式、Bmp 格式或Pcx 格式)?
进行图像版面处理
对扫描所得图像文件根据需要进行处理(旋转、反转、剪裁、倾斜校正等)和版面分析等,并选择需识别的内码、字体,为识别做好准备?

在编辑修改状态,对于正常识别的文字用黑色显示,对于可疑字用系统设置中指定的颜色显示(默认为红色),便于提示修改?
系统提供windows 标准的编辑操作和紫光ocr 系统特有的编辑功能。Windows 标准的编辑操作包括剪切、复制、粘贴和清除等,紫光ocr 系统特有的编辑功能主要包括前向词汇、逆向词汇、相似字、常用符号、和行逆序?
通过双击项目管理窗口的原图形文件和被识别后文件,可以在图像状态和编辑状态间切换?
识别结果输出
识别结果经修改编辑后,可根据需要输出?
1 存盘:从“文件”菜单选择“另存为.”命令,在“另存为”对话框中指定文件名后将文本以其它文件名保存?
2 导出:从“文件”菜单选择“导出”命令,在“导出为”对话框中指定文件名后可将识别后的稿件以包含版面格式的富文本格式(Rtf)文件、包含版面格式的页面格式(html格式,可用Ie 5等应用程序打开)以及纯文本的保存?

退?
在识别过程中系统会生成跟踪文件。为节省硬盘空间,退出系统时,系统会将工作目录中?.chr?.sim?.trc?.rgn”等跟踪文件自动删除?