代码之家  ›  专栏  ›  技术社区  ›  Adam

使用bigtable源时如何获取干净的bigquery架构?

  •  0
  • Adam  · 技术社区  · 6 年前

    Bigtable:一个简单的表,有一个字符串键和一个列族, publication_number ,also a string.

    此表可以通过遵循 google的说明在bigquery中作为数据集安装。

    查询此表时,我希望看到一个简单的两列输出: rowkey and publication\u number ,both string 。相反,我看到了:

    BigQuery添加了一个 。column ,一个 。column.name , 。cell , 。cell.timestamp ,最后该值位于 。column.cell.value

    是否有一种方法可以将此简化为只具有:

    rowkey string
    出版物编号字符串
    

    什么都没有?我可以同时更改表的创建方式和导出的完成方式。Google's instructions.

    查询此表时,我希望看到一个简单的两列输出:rowkey出版物编号,两个STRING.相反,我看到了:

    BigQuery Schema

    BigQuery添加了.column,A.column.name,.cell,请.cell.timestamp最后,值在.column.cell.value.

    是否有一种方法可以将此简化为仅具有:

    rowkey              STRING
    publication_number  STRING
    

    什么都没有?我可以更改表的创建方式和导出方式。

    1 回复  |  直到 6 年前
        1
  •  2
  •   Adam    6 年前

    CREATE VIEW dataset.publication_view AS
    SELECT
      rowkey,
      cell.value AS publication_number
    FROM dataset.publication_table,
    UNNEST(publication_number.column)
    

    CREATE VIEW dataset.publication_view AS
    SELECT
        rowkey,
        ARRAY_TO_STRING(ARRAY(SELECT cell.value FROM UNNEST(publication_number.column)), "") AS publication_number
    FROM `dataset.publication_table`