在数据提取工作流中使用分类
- Updated: 2025/04/30
为了简化涉及分类和数据提取的文档处理工作流,您可以将分类任务集成到文档处理工作流中。 这种集成消除了手动预分类文档的需求,获得统一的自动化流程,并可在单个工作流中按顺序处理这两项任务。
先决条件
在此过程中,我们使用了 Document Classifier package 中的分类操作,并相应地创建了变量。 根据您选择的分类器操作,您可能需要修改过程并创建不同的变量集。
过程
- 登录到您的 Control Room。
- 导航到自动化 > 私有选项卡。
-
单击 创建 > 任务机器人。
确保不要将 bot 放在文档工作区流程文件夹中。
- 为 bot 提供一个名称,例如,doc-processing-with-classification。
-
创建以下变量:
变量名称 描述 数据类型 值 源路径 包含待分类文档的文件夹的文件路径 字符串 请输入待分类文档所在的文件路径。 机密文件路径 包含分类文档的文件夹的文件路径 字符串 请输入分类文档所在的文件路径。 输出路径 包含提取数据和无效或失败文档的文件夹的文件路径 字符串 请输入您想要存储提取输出的文件路径 文件夹内文件分类 保存文件名和扩展名 字典 不适用 文件夹内文件夹数据处理 保存文件夹名称 字符串 不适用 文件夹内文件数据处理 保存文件名和扩展名 字典 不适用 请参阅 创建变量。
-
插入一个循环操作,以遍历特定文件路径中要分类的所有文档。
- 双击循环操作或将该操作拖动到编辑器中。
- 选择文件夹中每个文件迭代器
- 在文件夹路径字段中,输入 $SourcePath$。
- 在为此变量分配文件名和扩展名字段中,输入 $FilesInFolderClassification$。
请参阅 Loop package。 -
配置用于分类文档的操作。
- 将 Document Classifier package 中的 分类操拖入循环容器。
- 在输入文件字段中,选择桌面文件选项,并输入 $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$。
- 在分类器字段中,选择适当的模型文件。
- 在输出文件夹路径字段中,选择桌面文件夹选项,并输入 $ClassifiedFilePath$。
-
插入一个循环操作,以遍历特定文件路径中的所有文件夹。
- 双击循环操作或将该操作拖动到编辑器中。
- 选择对于文件夹中的每个文件夹迭代器
-
在文件夹路径字段中,输入 $ClassifiedFilePath$。
注: 我们选择ClassifiedFilePath变量作为文件夹路径,因为分类文件被存储为该文件夹中的单独文件夹。
- 在为此变量分配相对文件夹路径字段中,输入 $FoldersInFolderDataProcessing$。
请参阅 Loop package。 -
插入一个循环操作,以遍历特定文件路径中要进行数据处理的所有文件。
- 双击循环操作或将该操作拖动到编辑器中。
- 选择文件夹中每个文件迭代器
- 在文件夹路径字段中,输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$.。
- 在为此变量分配文件名和扩展名字段中,输入 $FilesInFolderDataProcessing$。
请参阅 Loop package。 -
配置操作以将文档上传到与特定学习实例相关的流程。
- 将 Process Composer package 中的 创建请求操作拖入循环容器。
- 在公共流程字段中,单击浏览,然后选择一个在公共模式下可用的学习实例。
- 在文件“InputFile”字段中,选择桌面文件选项,并输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$。
- 在字符串“InputFileName” 字段中,输入 $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$。
- 在字符串“OutputFolder”字段中,输入 $OutputPath$。
-
使用 File
package,您可以执行以下操作:
- 使用复制桌面文件操作,您可以将成功处理的文件复制到桌面上的其他位置。 例如,在源文件字段中,输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$。
- 使用删除操作,您可以在文档上传到 Document Automation 后将其移除。 例如,在 文件字段中,输入 $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$。
请参阅 Text file package。
- 单击保存。