为了简化涉及分类和数据提取的文档处理工作流,您可以将分类任务集成到文档处理工作流中。 这种集成消除了手动预分类文档的需求,获得统一的自动化流程,并可在单个工作流中按顺序处理这两项任务。

先决条件

确保您已创建要用于此流程的学习实例,并将其发布到实际正式环境中。 请参阅 实际正式发布学习实例

在此过程中,我们使用了 Document Classifier package 中的分类操作,并相应地创建了变量。 根据您选择的分类器操作,您可能需要修改过程并创建不同的变量集。

过程

  1. 登录到您的 Control Room
  2. 导航到自动化 > 私有选项卡
  3. 单击 创建 > 任务机器人
    确保不要将 bot 放在文档工作区流程文件夹中。
  4. bot 提供一个名称,例如,doc-processing-with-classification。
  5. 创建以下变量:
    变量名称 描述 数据类型
    源路径 包含待分类文档的文件夹的文件路径 字符串 请输入待分类文档所在的文件路径。
    机密文件路径 包含分类文档的文件夹的文件路径 字符串 请输入分类文档所在的文件路径。
    输出路径 包含提取数据和无效或失败文档的文件夹的文件路径 字符串 请输入您想要存储提取输出的文件路径
    文件夹内文件分类 保存文件名和扩展名 字典 不适用
    文件夹内文件夹数据处理 保存文件夹名称 字符串 不适用
    文件夹内文件数据处理 保存文件名和扩展名 字典 不适用

    请参阅 创建变量

  6. 插入一个循环操作,以遍历特定文件路径中要分类的所有文档。
    1. 双击循环操作或将该操作拖动到编辑器中。
    2. 选择文件夹中每个文件迭代器
    3. 文件夹路径字段中,输入 $SourcePath$
    4. 为此变量分配文件名和扩展名字段中,输入 $FilesInFolderClassification$
    请参阅 Loop package
  7. 配置用于分类文档的操作。
    1. Document Classifier package 中的 分类操拖入循环容器。
    2. 输入文件字段中,选择桌面文件选项,并输入 $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$
    3. 分类器字段中,选择适当的模型文件。
    4. 输出文件夹路径字段中,选择桌面文件夹选项,并输入 $ClassifiedFilePath$
  8. 插入一个循环操作,以遍历特定文件路径中的所有文件夹。
    1. 双击循环操作或将该操作拖动到编辑器中。
    2. 选择对于文件夹中的每个文件夹迭代器
    3. 文件夹路径字段中,输入 $ClassifiedFilePath$
      注: 我们选择ClassifiedFilePath变量作为文件夹路径,因为分类文件被存储为该文件夹中的单独文件夹。
    4. 为此变量分配相对文件夹路径字段中,输入 $FoldersInFolderDataProcessing$
    请参阅 Loop package
  9. 插入一个循环操作,以遍历特定文件路径中要进行数据处理的所有文件。
    1. 双击循环操作或将该操作拖动到编辑器中。
    2. 选择文件夹中每个文件迭代器
    3. 文件夹路径字段中,输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$.
    4. 为此变量分配文件名和扩展名字段中,输入 $FilesInFolderDataProcessing$
    请参阅 Loop package
  10. 配置操作以将文档上传到与特定学习实例相关的流程。
    1. Process Composer package 中的 创建请求操作拖入循环容器。
    2. 公共流程字段中,单击浏览,然后选择一个在公共模式下可用的学习实例。
    3. 文件“InputFile”字段中,选择桌面文件选项,并输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$
    4. 字符串“InputFileName” 字段中,输入 $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$
    5. 字符串“OutputFolder”字段中,输入 $OutputPath$
  11. 使用 File package,您可以执行以下操作:
    • 使用复制桌面文件操作,您可以将成功处理的文件复制到桌面上的其他位置。 例如,在源文件字段中,输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$
    • 使用删除操作,您可以在文档上传到 Document Automation 后将其移除。 例如,在 文件字段中,输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$

    请参阅 Text file package

  12. 单击保存
现在,当您运行此自动化时,文档会先被分类,然后在学习实例中用于数据提取。