• Json值抽取
    • 功能介绍
    • 参数说明
    • 脚本示例
      • 运行脚本
      • 运行结果

    Json值抽取

    功能介绍

    该组件完成json字符串中的信息抽取,按照用户给定的Path 抓取出相应的信息。该组件支持多Path抽取。

    参数说明

    名称 中文名称 描述 类型 是否必须? 默认值
    jsonPath Json 路径数组 用来指定 Json 抽取的内容。 String[]
    skipFailed 是否跳过错误 当遇到抽取值为null 时是否跳过 boolean false
    selectedCol 选中的列名 计算列对应的列名 String
    reservedCols 算法保留列名 算法保留列 String[] null
    outputCols 输出结果列列名数组 输出结果列列名数组,必选 String[]

    脚本示例

    运行脚本

    1. import numpy as np
    2. import pandas as pd
    3. data = np.array([
    4. ["{a:boy,b:{b1:1,b2:2}}"],
    5. ["{a:girl,b:{b1:1,b2:2}}"]])
    6. df = pd.DataFrame({"str": data[:, 0]})
    7. streamData = dataframeToOperator(df, schemaStr='str string', op_type='stream')
    8. JsonValueStreamOp().setJsonPath(["$.a","$.b.b1"]).setSelectedCol("str").setOutputCols(["f0","f1"]).linkFrom(streamData).print()
    9. StreamOperator.execute()

    运行结果

    str f0 f1
    {a:boy,b:{b1:1,b2:2}} boy 1
    {a:girl,b:{b1:1,b2:2}} girl 1