什么是OCR字符识别,我们常说的OCR即光学字符识别技术通过设备检查包装盒上打印或喷码的字符是否符合要求,检车设备如扫描仪或相机通过识别物体形状,通过字符识别软件将形状转译成文字信息。这项技术一般可以应用于印刷字符、钢印字符等,采用光学技术将被检测物上的文字转换成黑白点阵,同时字符识别软件转换成文本信息,在通过软件进行进一步分析。这项技术在工业OCR字符检测上一般应用于智能卡、医药包装盒、食品包装盒等产品的质量检测,对模糊不清、缺陷、三期码错误等不符合要求的产品进行剔除,检测合格的产品将进入自动化生产的下一项步骤。
那么,如何提高OCR视觉识别的正确率呢,这是验证视觉检测厂家的实力的经验的根本。
如何衡量OCR系统的好坏:
拒识率
误识率
识别速度
用户界面的友好性
产品的稳定性
易用性及可行性等
OCR识别的过程有哪些:
图像输入:进行ORC识别时,首先就是需要采集需要识别的图像,可以是名片、包装盒、证件、公文、文档等等,随后图像会传输到识别系统。
图像预处理:此过程包含二值化(将图像上的像素点灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等。
版面分析:将所要识别的文档分段、分行处理
字符切割:此时需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。
字符特征提取:提取字符特征,为后面的识别提供依据。
字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。
版面回复:将识别结果按照原来的版面排班,输出Word或pdf格式的文档。
后处理校正:根据特定的语言上下文的关系,对识别结果进行较正的算法。
Recommended news