管理学习实例
- Updated: 2023/04/05
学习实例是一个 IQ Bot 结构,用于描述单一文档类型中的数据,例如发票。 它包含诸如文档中使用的语言和要提取的字段等信息。
学习实例可以处于测试模式或实际正式模式。 这些模式决定了学习实例是草稿版本还是正式版本。
- 测试模式
-
在测试模式下,您可以创建和编辑学习实例,上传示例文档,并训练 bots 从您上传的示例文档中提取数据。 您可以在将学习实例及其 bots 部署到实际正式模式之前测试并提高其准确性。
注: 由于在测试模式下生成的学习实例数据是基于示例文档的,因此它与实际正式模式下的学习实例数据是分开的。 例如,示例文档不计入您组织购买的页面数量。 有关更多信息,请参阅 查看控制面板。 - 实际正式模式
- 在实际正式模式下,学习实例可以自动处理真实的业务文档,提取数据,并将需要人工验证的文档发送到验证队列。
要查找学习实例所处的模式,请导航到学习实例选项卡,其中我的学习实例页面显示环境中的学习实例。 每个学习实例在操作列中都有一个切换开关,指示其处于测试模式(开关向左并显示为灰色)还是实际正式模式(开关向右并显示为橙色)。
根据学习实例所处的模式,不同类型的用户会对 IQ Bot 做出贡献。 例如,在测试模式下,数据工程师创建学习实例,Bot 构建者构建支持的 RPA bots,而在实际正式模式下,验证者手动更正 IQ Bot 无法处理的文档中的字段。 要了解每个用户如何为 IQ Bot 做出贡献,请参阅
IQ Bot 流程概述。
注: 各阶段的文件大小限制如下:
- 在测试模式下,每个学习实例最多可以上传 150 个 10 MB 大小的文件。
- 在实际正式模式下,每个文档最大可上传 50 MB。 然而,每个学习实例允许的最大文档数量取决于许可证。
- 在 pdfbox OCR 中,每个文档的页数没有限制。
- 在基于图像的 OCR 中,每个文档最多可上传 60 页。
- 对于 Tesseract4 OCR,已知存在一个限制,即每个文档的页数少于 60 页。
学习实例生命周期
在独立开发、测试和实际正式环境等传统的 DevOps 工作流中,测试模式和实际正式模式与 IQ Bot 环境无关。 在开发生命周期的任何环境中,学习实例可以处于任一模式。
注: 当您传输学习实例时,它将保持在导出时的模式。 例如,如果您从开发环境以测试模式导出一个学习实例并将其导入到测试环境中,该学习实例仍将处于测试模式,并且不会自动执行文档处理。
下图显示了学习实例的典型生命周期:

您可以使用迁移工具在不同环境之间传输学习实例。 这有助于您避免重新创建类似的学习实例,并更好地管理相关 bots 的生命周期。 要了解更多详情,请参阅 迁移学习实例。