内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

分布式存储_在关系数据库中_安全稳定

2021-07-19 16:10 出处:欧普曼云计算 人气: 评论(0

阅读一个PDF文件来提取和组织它包含的数据可能是一项乏味的工作,尤其是当你有数百个文件要处理时,这可能会导致许多错误,什么叫大数据分析,并产生各种后果,我们将了解如何将智能RPA和文档信息提取结合起来,以自动处理PDF文档。

如果您从未听说过文档信息提取,轻淘客,让我来介绍一下什么是文档信息提取。

文档信息提取(通常称为DOX)是一种服务,您可以使用它来处理标题和表格中包含内容的文档。通常,您可以使用它从发票或付款通知单中提取数据。有了这样一个服务,你可以上传一个PDF文档,并以JSON对象的形式获取提取的数据。

你可以在这个页面上找到关于该服务的所有有用信息。

但是首先,让我们设置该服务,手机网站建站,这样我们就可以使用它。

你需要一个SAP CP global帐户和一个CPEA许可证。

让我们保存url,数据库大数据,uaa.clientid, uaa.clientsecret客户端以及uaa.url因为我们以后会需要它们。

创建一个新的项目和一个新的工作流。

设置变量

Web服务使用DOX

您应该有下面的工作流:

现在,构建解决方案。我们必须对生成的JavaScript代码进行一些调整。

注意:在这种情况下,clientid和clientsecret的值被硬编码在Set Context活动的属性值中。为了更符合安全性,您当然可以将这些值存储在某些Factory credentials变量中,并在工作流中检索它,如本博客中所述。

更新代码

由于我们无法在web服务调用中提供所有必需的选项,我们需要手动执行。

重要注意:如果我们查看代码,我们可以请注意,在检索数据时,我们在URL中提供clientId参数。这个参数也存在于我们上传服务时发送给DOX的选项中。在我们的例子中,这个参数的值是c\u 00。如果您阅读了服务API的文档,就会发现此参数是必需的。为了确保您可以使用具有此客户机id的服务,您需要使用客户机API创建一个客户机(此处详细说明)。

此时,从文档中提取的数据存储在rootData.WS.Output输出.数据变量。例如,您可以将它们作为另一个场景的参数传递给处理发票。

如文档中所述,中移物联网,结果是一个JSON对象。对于提取的每个数据,都有一个置信分数(介于0和1之间的数字),当您需要处理这些数据时,可以在场景中使用该值。

例如,有一个置信分数低于0.8的值时,可能会出现错误。

分享给小伙伴们:
本文标签: 分布式存储关系数据库安全稳定

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表