• 功能介绍
  • 参数说明
  • 脚本示例
    • 脚本代码
    • 脚本运行结果

    功能介绍

    提供流式 UDF 功能。

    在Python环境中,可以提供含eval函数的对象或者lambda函数作为UDF。

    参数说明

    以下为Python脚本中的参数:

    名称 中文名称 描述 类型 是否必须? 默认值
    func UDF 函数 UDF 函数 含eval函数的对象或者lambda函数
    outputCol 输出结果列列名 输出结果列列名 String
    resultType 输出结果列类型 输出结果列类型 String
    selectedCols 选择的列名 计算列对应的列名列表 String[]
    reservedCols 算法保留列名 算法保留列 String[] null

    脚本示例

    脚本代码

    1. source = CsvSourceStreamOp()\
    2. .setSchemaStr("sepal_length double, sepal_width double, petal_length double, petal_width double, category string")\
    3. .setFilePath("http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv")
    4. udfOp = UDFStreamOp() \
    5. .setFunc(lambda x: x + 1) \
    6. .setResultType("DOUBLE") \
    7. .setSelectedCols(['sepal_length']) \
    8. .setOutputCol('sepal_length_t') \
    9. .setReservedCols(['sepal_width'])
    10. res = udfOp.linkFrom(source)
    11. res.print()
    12. StreamOperator.execute()

    脚本运行结果

    1. sepal_length_t sepal_width
    2. 1 6.9 3.2
    3. 2 6.4 3.7
    4. 3 7.9 3.1
    5. 4 6.5 2.5
    6. 5 6.4 3.4
    7. ... ... ...
    8. 96 8.9 3.8
    9. 97 6.2 2.7
    10. 98 7.4 2.7
    11. 99 7.8 3.0
    12. 100 6.7 2.5