帮助中心

ABBYY FlexiCapture SDK主要功能

主要功能

行业领先的技术

业界领先的OCR和全球最广泛的语言基础

ABBYY FlexiCapture SDK包含最新版本的ABBYY OCR / ICR技术。它为包括阿拉伯文、中文、日文和韩文在内的209种OCR语言提供了最佳的识别质量,以简化应用程序开发的本地化,使开发人员可以更轻松地满足全球客户的需求。

数据提取精度高

ABBYY FlexiCapture SDK为某些字段提供智能数据提取。该技术在文档中查找字段并分析它们周围的区域。为了提高结果,开发人员可以使用内置字段提取训练来更准确地定义结构化或半结构化文档页面上的字段和重复组的位置。培训在最终用户开始使用文档时立即开始。

通过反馈学习

FlexiCapture SDK使开发人员可以实施有关字段提取和分类技术的培训,以提高字段提取和分类的准确性。

该技术基于最终用户提供的反馈进行学习。该反馈可以收集在任何第三方组件中以进行校验,由开发人员实施,并且包含有关正确的视场区域(以训练场提取技术)和正确的图像类别(以训练分类技术)的信息。

图像增强和质量控制

现在,开发人员可以手动和自动改善图像,包括移动设备捕获的图像。该功能允许开发人员处理ID,保险单等文件的复杂背景。例如,可以应用以下图像校正:

  • 自动校正分辨率
  • 将图像的分辨率覆盖为指定的分辨率
  • 基于黑色分隔符,黑色正方形或文本的图像歪斜角校正
  • 将图像转换为黑白
  • 图像的旋转,反转和镜像
  • 降低ISO噪点
  • 去除色标和垃圾
  • 自动裁剪图像

也可以将预配置的图像增强配置文件应用于图像。

高级分类

高级文档分类可使用可通过API使用的预配置分类器,将传入文档分类为类别。分类技术具有高度的灵活性,可以用来区分

  • 单据类型,如发票,银行对帐单,税表,索赔等。
  • 文档类型内的文档变化,例如来自不同供应商的发票
  • 文档边界,例如每种类型的文档的第一页和后续页

分类技术使用两种方法:

  • 图像分类利用卷积神经网络,并在视觉上不同的文档之间进行区分。
  • 文本分类依赖于统计和语义文本分析,并且需要OCR

同时使用这两种方法可以实现最可靠的分类结果。

FlexiCapture SDK提供了API,可以从头开始训练分类器,并在应用程序内部使用经过训练的分类器来加速文档处理。

开箱即用的发票、收据和订单处理

发票、收据和订单处理自动化是用于实施到第三方系统中的最受欢迎的方案之一。 ABBYY FlexiCapture SDK提供了用于开箱即用的发票、收据和订单处理的API。它基于智能文档分析和字符识别技术,以透明、可管理、高效和自动化的数据捕获代替了劳动密集型数据输入任务。它包括预定义的设置,验证规则和专门为处理发票量身定制的高级数据库查找功能。该技术可以识别绝大多数发票、收据和订单上的数据字段,使用户可以立即开始处理。智能的基于反馈的学习技术可改进具有非标准布局的文件数据的提取。

FlexiCapture SDK为很多国家提供现成的发票、收据和订单​项目。发票项目可以通过FlexiCapture开发人员软件包中的图形用户界面创建,也可以直接通过FlexiCapture SDK中的API创建

支持国家的完整列表可以在这里找到 ›

自然语言处理

最新发布的带有自然语言处理(NLP)的FlexiCapture SDK版本扩展了其捕获能力,将非结构化文档(如合同、租约、条款和协议)都包括在捕获范围中。您可以利用NLP技术,将更多需要手动输入数据的业务流程都推向以自动化的方式来处理,快速地从重要文档中提取数据并应用到业务程序中,大大节省了时间、金钱和人力。通过用户反馈的方式对NLP模型进行另外附加训练,提取数据的质量不断提升的同时也减少了文档验证的成本和时间。

高性能与快速响应

通过创建并行运行在不同进程上的处理器池,我们可以改进服务器应用程序的性能和响应能力。客户端请求由不同的 CPU 核心独立处理,无须在队列中等待,服务器应用程序因此响应更快。另外,单一长任务拆分成多个小任务并行处理,能够合理利用多核 CPU 的运行能力,从而提高性能。

无缝整合

基于API的设置

FlexiCapture SDK提供了两种创建项目的选项-使用FlexiCapture开发人员软件包中的图形用户界面或通过API。这在文档管理系统的开发中很重要,在该系统中,开发人员可能需要修改元数据,该元数据可以直接从其解决方案中提取并用于每个文档。拥有许多FlexiCapture项目的业务流程外包商可能需要自动调整特定字段的设置,而无需遍历每个项目。

开发者套餐

为了简化数据捕获过程的初始设置,分布式开发人员将与FlexiCapture 12 SDK一起使用FlexiCapture 12开发人员软件包。它包括FlexiCapture项目设置站和FlexiLayout Studio。开发人员软件包可用于设置FlexiCapture项目,以便在FlexiCapture SDK中进一步使用。在FlexiCapture开发人员软件包中创建并随FlexiCapture SDK一起提供的所有FlexiCapture项目都可以在FlexiCapture SDK中使用,反之亦然。

多功能的解决方案

捕获不同类型文档的数据

ABBYY FlexiCapture SDK提供了用于从固定格式以及半结构化和非结构化文档中提取数据的工具。所有必需的数据字段都可以快速找到并以适当的格式提取。

处理数字出生的文档

ABBYY FlexiCapture SDK可处理所有常用格式的办公文档。可以以相同的流程处理所有文档,而无需将图像格式与文本格式分开。 SDK支持DOC、DOCX、RTF、HTML、TXT和ODT格式的文本文档; XLS、XLSX和ODS表;以及PPT、PPTX和ODP中的演示。

任何环境支持

ABBYY FlexiCapture SDK支持虚拟机,容器(包括Docker容器)和公共云服务等所有现代环境,从而允许构建高度可扩展的解决方案,例如由容器编排器支持的基于云的Web服务。

灵活的出口选择

使用FlexiCapture导出选项,可以管理输出文件的大小和质量,以在数据存储策略中实现最大效率。

导出选项包括将所有相关数据保存到后端应用程序中,以及将分析后的文档转换为可搜索的PDF或PDF / A格式以进行存档的功能。数据捕获技术将数据导出到结构化格式(例如XML或CSV)或其他存储位置。对于某些格式,还可以保存原始文档的图像,以便在需要时易于查找和比较。

广泛的代码样本库

广泛的代码示例库

开始使用FlexiCapture Engine的最快方法是通读帮助文件,并查看该软件随附的示例代码。全面的代码示例集说明了如何使用SDK进行编程。每个库部分都有代码片段,并附有有关如何执行相关任务的逐步说明。开发人员可以在他们的应用程序中使用重用示例代码来节省开发时间。

  • 入门: 如果这是你第一次使用 ABBYY FlexiCapture 引擎,想知道如何识别文档并导出识别结果,那么从这里开始阅读最合适
  • 开发 web 服务: 开发数据采集方案,然后以 web 服务的形式提供。
  • 使用高级技术: 适合 ABBYY FlexiCapture SDK的高级用户,你可以了解到如何创建、编辑文档定义,如何预处理图像,以及如何扫描。
  • 在脚本语言中使用 FlexiCapture SDK: 教你如何在脚本语言中使用 ABBYY FlexiCapture SDK。
  • 实现常见的处理场景: 你可以在这里找到各种技巧,教你如何实现常见的处理场景,比如自定义图像源、浏览已识别的文档,又或是实现已识别数据的存储。
  • 有效利用高性能计算机的资源: 教你在程序中使用 ABBYY FlexiCapture 引擎创建多线程服务器应用。

本网站使用cookies

我们使用 cookie 来创建相关内容和广告, 提供社交媒体功能并分析我们的流量。我们还分享以下信息 您与我们的社交媒体、广告和分析合作伙伴一起使用我们的网站,他们可能会 将其与您提供给他们或他们收集的其他信息结合起来 从您使用他们的服务.