OCR技术迈向实用化

作者: 厦门云脉技术有限公司 来源: http://www.yunmai.com/ 时间: 2016-06-30

人类很早就开始致力于开发能代替人工作的机器,而且历史已经证明这些机器能够帮助人们完成大量的体力劳动。随着计算机技术的发展,用机器来替代人类完成大量的脑力老公也成为可能。在过去的大约半个世纪里,各种各样的电脑——从能够战胜国际象棋世界冠军到能够理解人的语言——纷纷开发成功,似乎表明计算机已经可以与人类只能媲美了。

然而,人类有一种能力仍然是计算机所无法具备的,那就是识别人们自身的手写文字。当然,在手写文字的机器识别领域已经取得了许多进步,但我们很少人会说计算机已经可以像人一详去识别手写文字了。尽管如此,人们仍然致力于开发能比拟人类手写文字识别能力的技术。因为,即使是不太完美的手写字识别技术也具有巨大的应用价值。

上世纪80年代末以来,手写汉字识别的研究更趋活跃,各种思想、方法乃至体系不断涌现,特别是在结构匹配、松弛计算以及人工智能的应用等方面取得了长足的发展。近年来,神经网络和支撑向量机(SVM)在汉字识别中的应用也成为研究的热点。

目前,随着手写汉字识别研究的深入发展,实用化研究成为一个普遍关注的问题。无论是识别范围还是识别性能,更趋向于实用化的研究。目前,已经开发出了较高水平的OCR技术、笔输入技术和笔迹鉴于技术。OCR是指通过扫描仪将印刷或书写在纸面上的文字输入到系统后进行识别。由于系统工作时,文字已经书写完毕,因此被称为脱机文字识别。OCR又有印刷体OCR和手写体OCR之分。笔输入系统是通过专用的书写板和笔输入文字,由于一边写一边识别,也称为联机文字识别。从技术难度来讲,脱机识别比联机识别难度要打,而手写体脱机识别自然又比印刷体脱机识别的难度大。目前笔输入技术、印刷体OCR技术已经达到较高的实用化水平,而手写体OCR技术也正在向实用化迈进。从应用方面看,由于笔输入技术是掌上电脑Palm PC理想的输入手段,因此得到了比OCR更大的应用面。但是,对着社会信息化程度的提高,邮政、银行、税务、图书馆等行业对OCR提出了更多的要求,差生了巨大的市场空间,也成为目前汉字自动识别应用化研究的热点之一。

OCR技术的应用前景非常广阔,其研究的社会意义很大。不仅如此,汉字识别的其他应用也日益活跃。随着技术的发展,位子识别必将给人类的生产和生活方式带来深刻的变化。