代码之家  ›  专栏  ›  技术社区  ›  Paolo Ciarrocchi

使用GCP模板将云存储文本转换为BigQuery

  •  1
  • Paolo Ciarrocchi  · 技术社区  · 6 年前

    我正在尝试使用GCP模板执行管道,该模板位于: https://cloud.google.com/dataflow/docs/templates/provided-templates#cloud-storage-text-to-bigquery

    但我得到了一个错误:

    2018-03-30 (15:35:17) java.lang.IllegalArgumentException: Failed to match any files with the pattern: gs://.......
    

    任何人都可以共享一个可用的CSV文件作为运行该管道的输入吗?

    2 回复  |  直到 6 年前
        1
  •  3
  •   Paolo Ciarrocchi    6 年前

    问题出在椅子和键盘之间,您只需要根据JSON文件中定义并由JS文件转换的数据结构创建一个CSV文件。

        2
  •  0
  •   Community CDub    4 年前

    我看到这个问题已经得到了回答,但我遇到了一个类似的问题,这个答案对我来说是片面的——事实证明,模板中的路径模式(至少目前)不支持某些类型的模式。 例如,对于给定GCS路径中跨多个子目录的多个CSV文件(这是我的用例):

    gs://bucket name/dir/

    有效的模式是:

    gs://bucket name/dir/*/*。csv

    这些模式虽然通过gsutil ls有效并返回正确的文件,但在模板中不起作用:

    gs://bucket name/dir/*

    gs://bucket name/dir/*。csv