OCR软件使用步骤和注意事项

作者: 厦门云脉技术有限公司 来源: http://www.yunmai.com/ 时间: 2016-6-29

OCR是英文Optical Character Recognition的缩写,意为光学字符识别。OCR软件通过扫描仪和计算机的配合,将图像数据转化为计算机内码,把扫描后的文字识别出来,它可以极大地减轻文字录入工作的速度、提高文字录入的速度。在教学工作中,我们可以用扫描仪把图片、试题、课文等扫描输入计算机,用OCR软件把文字识别出来。识别后的文字可用于编辑试卷,建立题库,编写多媒体课件,制作网页等。OCR技术可使现有印刷品数字化,是信息资源建设中的重要组成部分。

OCR软件的使用大同小异,主要步骤和注意事项是:

1、扫描图像

扫描图像时原稿在扫描仪中一定要放正,否则扫描出来的字体也是倾斜的,OCR软件无法正确识别。扫描书本的时候要注意,因为书本中央的脊会翘起,导致中央部位图像变形,所以一定要将书脊压平以后再进行扫描。

要选择适当的扫描分辨率,太低或太高的分辨率都会造成不好的识别效果。一般进行文字识别,将分辨率设为黑白方式或灰度方式即可。

调整适当的明亮度,使扫描出的图像既不会断线也不会模糊成黑块。

2、校正倾斜

如果扫描后的图像有点点倾斜,可使用“自动倾斜校正”或者“手动倾斜校正”功能纠正字体的倾斜。

3、分析版面,设定识别区域

根据特殊的版面情况,进行自动或手动版面分析。选择与所扫描原稿对应的版面类型(如横排、竖排等),对于一些中间有图片的文字稿件,建议绕开图片,用鼠标手动设定识别区域。

4、识别,校对

进行识别后,OCR对不能完全确定的文字,会以蓝色显示,请使用者确认。使用者可以在备选字中选择修改,或者通过操作系统提供的文字输入方法,添加所需要的文字。但请注意,在没有提示出错的地方,也有可能出错。所以在校对时,要诵读一遍,提高文字校对的效果。

OCR的作用是将扫描仪输入计算机的图像文件中的字符辨认识别出来,然后再用文字处理软件进行校改和编辑。国内的OCR软件主要用于识别汉字,虽然一些软件也有识别纯英文的功能,但是识别率不高,也不能保持原稿的页面格式。要充分发挥扫描仪在外语教学中的作用,就要寻找不仅支持英文,还要支持其他外文的优秀OCR软件。