什么是光学字元辨识(OCR)? 以及它的辨识原理-时代数字趋势

By 时代数字趋势2021-05-27

光学字元辨识 (Optical Character Recognition, OCR)是一种软件，针对影印、缮打或手写的文件，建立一个电脑可读取的电子文件，而免去人工缮打或输入文字。

OCR 通常用于PDF格式的扫描文件，但也可以使用图片文件建立电脑可读取的电子文字文件。

什么是OCR?

OCR也称为字元辨识，是一种软件科技，可以将数字、文字和标点符号等字元，从影印或手写文件转换成电脑和其他软件程序更容易阅读和读取的电子格式。

有些OCR程序是使用数位相机拍摄文件时进行辨识，而其它则是使用扫描机产生的图片文件或现成照片，透过OCR技术来辨识内容。OCR能让使用者在PDF文件中搜寻、编辑文件。

对于日常少量的扫描需求，是否使用OCR来协助办公或许不是大问题。但如果你要进行大量的文件扫描，并透够把它转换成文字文件，而不仅是图片文件，能够在PDF文件中搜寻到你需要的确切内容，那么使用OCR就可以节省下相当多的时间。

下列是其他OCR可以协助的其他事项：

为什么不直接拍照就好了? 因为拍照只是一张图片，你无法做任何编辑或搜寻文字。扫描文件并使用OCR软件进行辨识，可以将文件转换成你可以编辑和搜寻的电子文件。

虽然文字辨识技术的使用最早可追朔至1914年，但OCR相关科技的广泛运用与发展是始于1950年代，特别是创造了非常简化的字型，更容易转换成可读取的数位文字。

第一个简化字型是由大卫．谢帕德 (David Shepard) 所创造，一般称为OCR-7B。OCR-7B现今仍运用于金融产业，是信用卡和签帐金融卡的标準字型。

1960年代，许多国家的邮政业务开始使用OCR科技，以大幅提升邮件分类的速度，包括美国、英国、加拿大和德国等。OCR现在仍是世界各地的邮政业务用于邮件分类的核心科技。

2000年，OCR科技突破了限制，并产生出一种关键技术，被用来开发防止机器人恶意攻击服务器与阻挡垃圾信件的人机验证(CAPTCHA)程序。

几十年来，由于相关科技领域的进步，如人工智慧、机器学习和电脑视觉，OCR已发展地更加準确且精密。现今，OCR软件使用图形识别、特徵检测以及文件探勘，比以往执行更快速且能正确的转换文件。