图像文件根据各自情况经过倾斜校正、版面分析等处理后,即可进入识别程序(图像中只含有单栏的横排文字,没有其它复杂的内容,可以不进行版面分析,就能够识别)。这是th-ocr 系统的核心。
文通鉴-th-ocr 可对单张图像进行识别,也可以多张图像一起进行识别。
1 识别单张图像

2 识别多张图像

使用批量识别功能时,必须保证每页图像都完成了倾斜校正、版面分析等,同时每次页数不宜太多。
文通鉴-th-ocr 还为用户提供了自学习功能。在识别中如果遇到生僻的汉字,甚至是某种特定的符号,都可以让计算机学习。这样以后再次遇到时,系统就能识别。
请参阅文通鉴帮助文件,以取得详细信息。