查看或下载此文章的可打印版本 (PDF 1281 kb)
提高文档处理的效率,减少IT部门的工作量。
创建具有透明监控和报告的集中式文档处理平台。
该公司是一家独立机构,旨在为知名基金公司,自动交易服务提供商,为经纪人和中介机构等提供专业服务。为满足相应的法律和法规,减轻系统风险,审查和警告那些可能导致不当行为的公司活动。通过这些服务,公司可以保持财务稳健并以高标准运作,成为在香港特别行政区的投资领域具有竞争力的品牌。
业务活动要求从不同来源快速准确地处理大量文件。这包括物理文档的数字化、提交审阅文档和文本搜索。该项目旨在为一个集中系统提供服务,为多个内部部门提供服务,并提供简单的管理控制台,用于系统警报,流量审查和使用情况的报告。
这些文件从纸张、文章到表格、图表甚至是整本书籍,通常是多语言混杂:中文(繁体/简体)和英文。
在寻找新的解决方案时,该公司设定了许多目标。其中之一是在应用OCR后减小文件大小。由于一些文档超过1000页,因此必须将下载时间和带宽降至最低。另一个目标是集中文件处理和提供透明的报告。最后,目标是提高处理速度和处理量,因为每年输入文件的数量在显著增加。
赞华集团 (香港) 的优势就在于勇于挑战; 赞华集团是香港著名的系统集成商和ABBYY的授权合作伙伴。
解决方案的选择要基于四个主要标准:OCR准确性、高质量的文件压缩、可扩展性以及集成和工作流配置的灵活性。
赞华集团开发了一个定制的Web管理控制台,在后端驱动识别服务器。 ABBYY Recognition Server丰富的API使这项开发变得轻而易举。
使用ABBYY Recognition Server,工作流程从表单、图表、文章和书籍等传入文档的数字化开始。负责导入的系统模块从多功能复印机,传真,电子邮件,门户网站和其他来源接收图像和文档,并自动将它们指向识别服务器进行文档转换。在应用光学字符识别 (OCR) 之前,增强了接收图像的质量来获得更好的结果。该解决方案提供高速和准确的亚洲语言与欧洲语言混合识别。
该解决方案在具有12核的单个虚拟机服务器上运行。 总的来说,与传统的OCR系统相比,处理时间显著缩短。
将完全可搜索的文档保存为PDF压缩文件。 PDF格式用于数据存储,其中具有高视觉数据质量的文件的大小非常重要,就像在这个案例中的一样。 一种称为MRC (混合光栅内容) 的特殊压缩技术用于缩小PDF和PDF/A文件的体积。 MRC技术允许更好的文档外观并且仅有JPEG 文件大小的 1/8 – 1/10 的体积。
在最后阶段,捕获和转换的数据将发送到公司的数据管理系统,一般为网络文件夹或特定电子邮件。 该解决方案可帮助公司优化业务流程,同时实现合规性、协作和长期存储的目标。
该项目在5个月内完成了交付,包括3个月的开发和2个月的用户测试。
提供透明文档处理的新企业级平台已经表现出了很好的性能。输出的PDF文件经过合理压缩并且完全可访问,无需耗费大量时间下载繁重的档案。由于部署简单,维护简单,IT支持工作比以前更加顺畅。高级监控和报告控制台有助于透明地区分资源消耗和占用。
ABBYY Recognition Server帮助创建了一个可靠的集中文档处理平台,该平台具有简单透明的管理控制台,可用于系统警报,流量审查和使用情况报告。该解决方案显着减少了IT部门工作所需的时间和资源。
该公司计划将所有内部部门连接到集中式文档转换平台,每年将文档数量增加到至少300万份。此外,该公司还设计了法律文件导出功能,从数据管理系统到压缩和记录的一整套解决方案,因为有 300 万份文档等待被归档处理。