在档案管理应用当中,有一个大家都非常关注的功能:档案管理系统搜索引擎,是否可以直接搜索PDF文件?对于这个问题,会博通的回答是肯定的。
会博通通过专项开发接口,可将百度OCR功能调用到档案管理系统中,将存放于系统的证照、票据等图片识别为文字,实现了图片档案的快速检索。
使用效果如下图。直接在会博通搜索引擎上输入搜索文字,结果反馈除了文档格式之外,还包括PDF等图片格式。
OCR技术指的是,对文本资料的图像文件,进行分析识别处理,获取版面信息的过程。在众多OCR应用当中,基于对识别准确率、场景覆盖面、语种丰富度等因素的考量,会博通选择了百度OCR。
在图片文字识别上,百度OCR不仅能够识别常规PDF文件,还能识别存在背景丰富、低亮度、低对比度、光照不均、透视变形、字号、字重、颜色不一等多重问题的图片,精准度可以说是非常高的。
同时,百度OCR也适用于卡证验核、财会报销、交通物流、教育培训、内容审核等多种文字识别场景,满足档案管理的多种需求。此外,百度OCR还支持英、日、韩、法、德、意等20多种语种,对于多语言识别也不在话下。
在配置了OCR功能的会博通档案系统当中,图片资料一经上传,系统便会分配一个后台任务,在系统空闲的时候,对文件进行识别成为文本文件。 文本文件识别完成后,内容就会自动接入到会博通搜索平台当中,与搜索内容进行匹配,便于用户精准快速获取包含图片在内的信息。
在会博通档案管理软件当中,OCR功能属于选配组件。如果您的档案当中存在大量的PDF、JPG等图片资料,为方便后期检索,我们建议您最好选配OCR功能。
如果您对于档案全文检索需求不大,或档案资料以电子化的文档为主,那么也可以暂且不配置该功能;如果您的系统安装没有配置OCR功能,但随着业务的发展,对于图片搜索的需求增加,那么也可以随时联系我们进行系统升级。
图片资料,为方便后期检索,我们建议您最好选配OCR功能;如果您对于档案全文检索需求不大,或档案资料以电子化的文档为主,那么也可以暂且不配置该功能;如果您的系统安装没有配置OCR功能,但随着业务的发展,对于图片搜索的需求增加,那么也可以随时联系我们进行系统升级。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。