代码之家 › 专栏 › 技术社区 › gogasca

在BigQuery中使用最大值展平结果

google-bigquery google-cloud-platform

gogasca · 技术社区 · 5 年前

original predicted probabilities
 <=50K   >50K      >50K 0.5377828170971353
                   <=50K 0.46221718290286473
 <=50K   <=50K     >50K 0.05434716579642335
                   <=50K 0.9456528342035766

我想展平我的结果,但现在使用这个查询,我只得到上面的表,并使用bigQuery Python client得到一个: [object Object],[object Object]

    SELECT
      original,
      predicted,
      probabilities
    FROM
      ML.PREDICT(MODEL `my_dataset.my_model`,
      (
      SELECT
        *
      FROMÂ Â  
       `bigquery-public-data.ml_datasets.census_adult_income`

      ))

0 回复 | 直到 5 年前

Tlaquetzal 5 年前

你的 probabilities 字段是重复记录,即结构数组。可以使用子查询遍历数组并选择最大概率,如下所示:

SELECT 
    original,
    predicted, 
    (SELECT p 
         -- Iterate over the array
         FROM UNNEST(probabilities) as p 
         -- Order by probability and get the first result
         ORDER BY p.prob DESC
         LIMIT 1) AS probabilities
  FROM
      ML.PREDICT(MODEL `my_dataset.my_model`,
      (
      SELECT
        *
      FROM   
       `bigquery-public-data.ml_datasets.census_adult_income`

      ))

结果如下:

from google.cloud import bigquery

client = bigquery.Client()

# Perform a query.
sql = ''' SELECT ... ''' # Your query 

query_job = client.query(sql)

rows = query_job.result()  # Waits for query to finish

for row in rows:
    print(row.values())

输出:

(' >50K', ' >50K', {'label': ' >50K', 'prob': 0.5218586871072727})
(' >50K', ' >50K', {'label': ' >50K', 'prob': 0.5907989087876587})
(' >50K', ' >50K', {'label': ' >50K', 'prob': 0.734145221825564})

注意,概率是BigQuery SQL中的一种结构数据类型,因此它被映射为python dict。

BigQuery quickstart 有关客户端库的详细信息。

推荐文章

Saravana Kumar · 是否将值插入结构列?

1 年前

Supplementing · 使用nuxt在谷歌应用程序引擎上部署失败

1 年前

mehere · 谷歌搜索控制台-批量导出-缺少权限

1 年前

Chris A · 生成中未拾取环境变量

2 年前

zinger44 · 如何将数据集从Huggingface移动到谷歌云?

2 年前

Mazen Ezzeddine · 使用一点上下文搜索谷歌云日志(匹配关键字的日志和匹配日志前后的少量日志。)

2 年前

nav112 · 在GCP中将桶数据从区域移动到多区域

2 年前

so beautiful memory · 如何将我在本地训练的tensorflow模型正确部署到谷歌云人工智能平台?我部署了它,但没有图像返回

2 年前

Theo75 · R库将消息发布到Google Cloud Pub/Sub主题

2 年前

Itamar Cohen · 谷歌管理的SSL证书不起作用

2 年前