代码之家  ›  专栏  ›  技术社区  ›  user5887221

如何使用云ML来预测csv文件而不是json?

  •  0
  • user5887221  · 技术社区  · 7 年前

    还有人能列出在Gcloud上训练和部署tensorflow模型的详细步骤吗? 我有自己的代码,我不想更改。似乎代码必须采用某种严格的格式才能在Gcloud上使用,例如任务。py文件等。

    2 回复  |  直到 7 年前
        1
  •  0
  •   josiah    7 年前

    两周前,我第一次亲自经历了这个过程。我建议你用这个 tutorial (由谷歌善良的员工创建)。

    在上述链接教程的示例中,要将预测输入从json更改为csv,您会注意到默认值为“json”,但可以将其更改为“csv”( source ):

    parser.add_argument(
          '--export-format',
          help='The input format of the exported SavedModel binary',
          choices=['JSON', 'CSV', 'EXAMPLE'],
          default='JSON'
      )
    

    这意味着您可以指定 --export-format 'CSV' 创建模型时。例如:

    python trainer/task.py \
    --train-files ~/Documents/data/adult.data.csv \
    --eval-files ~/Documents/data/adult.test.csv \
    --job-dir ~/Documents/models/census/v1 \
    --train-steps 100 \
    --verbosity 'DEBUG' \
    --export-format 'CSV'
    
        2
  •  0
  •   Nikhil Kothari    7 年前

    让我看看我是否可以帮助你——这可能需要在这个高层次答案之外的后续问题(欢迎提出)。

    首先是文档-希望你已经看到了 https://cloud.google.com/ml-engine/docs/how-tos/training-steps

    1. 在非常高的级别上,您需要编写一个接受一组命令行参数的python程序,因此界面相当通用。您不需要将事物命名为task.py。

    2. https://cloud.google.com/ml-engine/docs/how-tos/packaging-trainer )

    3. 在分布式培训的情况下,您需要使用TF\u CONFIG环境变量来实例化TensorFlow服务器,该服务器可以与您工作中的其他工作人员进行协调。看到这个了吗 https://cloud.google.com/ml-engine/docs/concepts/trainer-considerations

    4. 使用gcloud工具提交作业时,需要指定集群配置。

    5. 在云中,您希望从/到云存储中读取训练数据并写入检查点、摘要和生成的模型,而不是本地磁盘(这是暂时的)。TensorFlow在其文件I/O API中支持GCS。看见 https://cloud.google.com/ml-engine/docs/how-tos/working-with-data

    6. 最后,当您生成用于ML引擎部署/预测的模型时(如果需要),请确保使用SavedModelAPI- https://cloud.google.com/ml-engine/docs/how-tos/deploying-models

    希望这有助于您全面了解。