OCR软件使用步骤和注意事项

作者： 厦门云脉技术有限公司 来源： http://www.yunmai.com/ 时间： 2016-6-29

OCR是英文Optical Character Recognition的缩写，意为光学字符识别。OCR软件通过扫描仪和计算机的配合，将图像数据转化为计算机内码，把扫描后的文字识别出来，它可以极大地减轻文字录入工作的速度、提高文字录入的速度。在教学工作中，我们可以用扫描仪把图片、试题、课文等扫描输入计算机，用OCR软件把文字识别出来。识别后的文字可用于编辑试卷，建立题库，编写多媒体课件，制作网页等。OCR技术可使现有印刷品数字化，是信息资源建设中的重要组成部分。

OCR软件的使用大同小异，主要步骤和注意事项是：

1、扫描图像

扫描图像时原稿在扫描仪中一定要放正，否则扫描出来的字体也是倾斜的，OCR软件无法正确识别。扫描书本的时候要注意，因为书本中央的脊会翘起，导致中央部位图像变形，所以一定要将书脊压平以后再进行扫描。

要选择适当的扫描分辨率，太低或太高的分辨率都会造成不好的识别效果。一般进行文字识别，将分辨率设为黑白方式或灰度方式即可。

调整适当的明亮度，使扫描出的图像既不会断线也不会模糊成黑块。

2、校正倾斜

如果扫描后的图像有点点倾斜，可使用“自动倾斜校正”或者“手动倾斜校正”功能纠正字体的倾斜。

3、分析版面，设定识别区域

根据特殊的版面情况，进行自动或手动版面分析。选择与所扫描原稿对应的版面类型（如横排、竖排等），对于一些中间有图片的文字稿件，建议绕开图片，用鼠标手动设定识别区域。

4、识别，校对

进行识别后，OCR对不能完全确定的文字，会以蓝色显示，请使用者确认。使用者可以在备选字中选择修改，或者通过操作系统提供的文字输入方法，添加所需要的文字。但请注意，在没有提示出错的地方，也有可能出错。所以在校对时，要诵读一遍，提高文字校对的效果。

OCR的作用是将扫描仪输入计算机的图像文件中的字符辨认识别出来，然后再用文字处理软件进行校改和编辑。国内的OCR软件主要用于识别汉字，虽然一些软件也有识别纯英文的功能，但是识别率不高，也不能保持原稿的页面格式。要充分发挥扫描仪在外语教学中的作用，就要寻找不仅支持英文，还要支持其他外文的优秀OCR软件。