• Vector 缺失值填充预测组件
    • 功能介绍
    • 参数说明
    • 脚本示例
      • 运行脚本
      • 运行结果

    Vector 缺失值填充预测组件

    功能介绍

    使用 Vecotor 缺失值填充模型对流Vector数据进行数据填充。

    参数说明

    名称 中文名称 描述 类型 是否必须? 默认值
    outputCol 输出结果列 输出结果列列名,可选,默认null String null

    脚本示例

    运行脚本

    1. data = np.array([["1:3,2:4,4:7", 1],\
    2. ["1:3,2:NaN", 3],\
    3. ["2:4,4:5", 4]])
    4. df = pd.DataFrame({"vec" : data[:,0], "id" : data[:,1]})
    5. dataStream = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="stream")
    6. data = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="batch")
    7. vecFill = VectorImputerTrainBatchOp().setSelectedCol("vec")
    8. model = data.link(vecFill)
    9. VectorImputerPredictStreamOp(model).setOutputCol("vec1").linkFrom(dataStream).print()
    10. StreamOperator.execute()

    运行结果

    vec id vec1
    1:3,2:4,4:7 1 1:3.0 2:4.0 4:7.0
    1:3,2:NaN 3 1:3.0 2:4.0
    2:4,4:5 4 2:4.0 4:5.0