• Vector Slice 组件
    • 功能介绍
    • 算法参数
    • 脚本示例
      • 运行脚本
      • 运行结果

    Vector Slice 组件

    功能介绍

    取出Vector 中的若干列,组成一个新的Vector。

    算法参数

    名称 中文名称 描述 类型 是否必须? 默认值
    indices 需要被提取的索引数组 需要被提取的索引数组 int[] null
    selectedCol 选中的列名 计算列对应的列名 String
    outputCol 输出结果列 输出结果列列名,可选,默认null String null
    reservedCols 算法保留列名 算法保留列 String[] null

    脚本示例

    运行脚本

    1. data = np.array([["1:3,2:4,4:7", 1],
    2. ["0:3,5:5", 3],
    3. ["2:4,4:5", 4]])
    4. df = pd.DataFrame({"vec" : data[:,0], "id" : data[:,1]})
    5. data = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="batch")
    6. vecSlice = VectorSlicer().setSelectedCol("vec").setOutputCol("vec_slice").setIndices([1,2,3])
    7. vecSlice.transform(data).collectToDataframe()

    运行结果

    vec id vec_slice
    1:3,2:4,4:7 1 $3$0:3.0 1:4.0
    0:3,5:5 3 $3$
    2:4,4:5 4 $3$1:4.0