什么是光学字元辨识(OCR)? 以及它的辨识原理

By 时代数字趋势2021-05-27

光学字元辨识 (Optical Character Recognition, OCR)是一种软件,针对影印、缮打或手写的文件,建立一个电脑可读取的电子文件,而免去人工缮打或输入文字。

OCR 通常用于PDF格式的扫描文件,但也可以使用图片文件建立电脑可读取的电子文字文件。

  • 什么是OCR?
  • OCR可运用在哪里?
  • 为什么要使用OCR?
  • OCR的发展历史

什么是OCR?

OCR也称为字元辨识,是一种软件科技,可以将数字、文字和标点符号等字元,从影印或手写文件转换成电脑和其他软件程序更容易阅读和读取的电子格式。

有些OCR程序是使用数位相机拍摄文件时进行辨识,而其它则是使用扫描机产生的图片文件或现成照片,透过OCR技术来辨识内容。OCR能让使用者在PDF文件中搜寻、编辑文件。

 

OCR可运用在哪里?

对于日常少量的扫描需求,是否使用OCR来协助办公或许不是大问题。但如果你要进行大量的文件扫描,并透够把它转换成文字文件,而不仅是图片文件,能够在PDF文件中搜寻到你需要的确切内容,那么使用OCR就可以节省下相当多的时间。

下列是其他OCR可以协助的其他事项:

  • 自动处理和输入数据(例如:工作应徵者的纸填履历表变成电子文件建文件)。
  • 可在扫描的书籍中进行搜寻。
  • 将手写扫描文件转换成电脑可读取的文字。
  • 让协助视障人士的阅读软件更容易读取文件。
  • 保存历史文件、数据与新闻,且可在文件中进行搜寻。
  • 撷取数据并转移至帐务软件(例如:收据和发票)。
  • 为文件编辑索引,以供搜寻引擎使用。
  • 使用高速相机和测速相机软件进行车牌辨识。
  • 为无法说话的人进行语音合成,例如理论物理学家史蒂芬.霍金 (Stephen Hawking)是最知名的语音合成软件使用者。

 

为什么要使用OCR?

为什么不直接拍照就好了? 因为拍照只是一张图片,你无法做任何编辑或搜寻文字。扫描文件并使用OCR软件进行辨识,可以将文件转换成你可以编辑和搜寻的电子文件。

 

OCR的发展历史

虽然文字辨识技术的使用最早可追朔至1914年,但OCR相关科技的广泛运用与发展是始于1950年代,特别是创造了非常简化的字型,更容易转换成可读取的数位文字。

第一个简化字型是由大卫.谢帕德 (David Shepard) 所创造,一般称为OCR-7B。OCR-7B现今仍运用于金融产业,是信用卡和签帐金融卡的标準字型。

1960年代,许多国家的邮政业务开始使用OCR科技,以大幅提升邮件分类的速度,包括美国、英国、加拿大和德国等。OCR现在仍是世界各地的邮政业务用于邮件分类的核心科技。

2000年,OCR科技突破了限制,并产生出一种关键技术,被用来开发防止机器人恶意攻击服务器与阻挡垃圾信件的人机验证(CAPTCHA)程序。

几十年来,由于相关科技领域的进步,如人工智慧、机器学习和电脑视觉,OCR已发展地更加準确且精密。现今,OCR软件使用图形识别、特徵检测以及文件探勘,比以往执行更快速且能正确的转换文件。

赞(0)
未经允许不得转载:时代数字趋势 » 什么是光学字元辨识(OCR)? 以及它的辨识原理
分享到: 更多 (0)