普元数据开发平台 普元数据开发平台
产品介绍
安装部署
快速入门
操作指南
SDK开发指南
FAQ
  • XML输入组件使用说明
  • 组件说明
  • 配置项说明

# XML输入组件使用说明

  • 组件说明
  • 配置项说明
  • 使用示例
    • 从HDFS获取文件
    • 从LOCAL获取文件
    • 从XML源获取文件名

# 组件说明

该组件提供了读取存储在 XML 文件中的信息。

# 配置项说明

配置名称 数据类型 是否必须 默认值 描述
节点名称 String 是 - 当前创建的节点名称,由用户自定义且不可为空。命名可包含字母、数字、下划线。
是否将XML源定义在一个字段中 Boolean 是 false 如果该组件有上一节点,且需要从该节点中获取变量的值,作为XML源的定义,则选中此选项。
源字段名 String 是 - XML源字段名选择。
选择类型 String 是 - 可选择“HDFS”类型或“LOCAL”类型。
选择数据源 String 是 - 当前输入绑定的数据源名称,从下拉选项中列出的指定的关联类型(HDFS)的数据源进行选择。
文件目录 String 是 - 读取数据的文件/目录来源。
正则匹配 String 是 - 指定要用于选择上一个选项中指定的目录中文件的正则表达式。
正则排除 String 是 - 排除满足此正则表达式指定条件的所有文件(位于给定位置)。
循环读取路径 String 是 - xml文件中的层次结构。
编码方式 String 是 UTF-8 xml文件的字符编码类型。
考虑命名空间 Boolean 是 - 若XML文件使用命名空间则需要勾选此参数。
验证XML Boolean 是 - 在解析之前验证XML格式是否正确。
输出中包括行号 Boolean 是 - 显示行数(从 1 开始),为递增列。
行数字段 String 是 - 行数字段。行数字段。
记录数量限制 String 是 - 限制输出的行数,代表下游节点接收到的最大数量,0 代表输出所有行。
是否添加文件名到结果 Boolean 是 false 此组件运行时,会把读取的文件名输出1列。
字段列表 - 是 - 名称:字段的名称。XML路径:要读取的元素节点或属性的路径节点:要读取的元素类型:节点或属性类型:字段的类型(String,Date或Number等)。格式:控制输入数据的格式(整数、有小数位、日期格式等)。长度:字段的长度取决于以下字段类型:Number:一个数字中有效数字的总数;String:字符串的总长度;Date:字符串打印输出的长度。精度:对于Number:浮点数的数量。对于String,Date,Boolean:未使用。

← Excel输入 JSON输入 →