普元数据开发平台 普元数据开发平台
产品介绍
安装部署
快速入门
操作指南
SDK开发指南
FAQ
  • CSV文件输入组件使用说明
  • 组件说明
  • 配置项说明

# CSV文件输入组件使用说明

  • 组件说明
  • 配置项说明
  • 使用示例
    • 从HDFS获取文件
    • 从LOCAL获取文件

# 组件说明

从指定的CSV文件输入数据。

# 配置项说明

配置名称 数据类型 是否必须 默认值 描述
节点名称 String 是 - 当前创建的节点名称,由用户自定义且不可为空。命名可包含字母、数字、下划线。
选择类型 String 是 - 可选择“HDFS”类型或“LOCAL”类型。
选择数据源 String 是 - 当前输入绑定的数据源名称,从下拉选项中列出的指定的关联类型(HDFS)的数据源进行选择。
文件目录 String 是 - 读取数据的文件/目录来源。
源文件包含列名标题行 String 是 - 指示源文件是否包含列名的一个标题行。
字段中有回车换行 String 是 - 设置数据字段是否可能包含换行字符。
添加文件名到结果 String 是 - 将CSV源文件名添加到此转换的结果中。
文件编码 String 是 - 指文件本身的编码,防止读取的数据乱码。文件编码类型可使用notepad++进行查看
列分隔符 String 是 - 文件中每一列数据之间,使用的分割符。
封闭符 String 是 - 指定源文件中使用的结束字符。
NIO缓存 String 是 - 指定读取缓冲区的大小,指一次从源文件读取的字节数(性能相关)。
字段定义列表 String 是 - 名称:字段的名称。类型:字段的类型(String,Date或Number等)。格式:用于转换原始字段格式的可选格式掩码。长度:字段的长度取决于以下字段类型:Number:一个数字中有效数字的总数;String:字符串的总长度;Date:字符串打印输出的长度。精度: 用于数字类型字段的浮点数。

← 文本文件输入 Excel输入 →