![]() |
1
4
您可以在etl工作中使用spark:
请记住,它仅适用于getCatalogSource()API,而不适用于create\u dynamic\u frame\u from\u options() |
![]() |
2
4
使用AWS Glue Python自动生成的脚本,我添加了以下几行:
然后,在
|
![]() |
3
1
我使用的是AWS Glue Python自动生成的脚本。我尝试使用
JcMaco
因为这正是我所需要的,这是一个非常简单的解决方案
然而,我无法做到这一点,我的专栏除了标题之外总是空的,但我
是
能够获取粘合作业的名称,并将其用作新列中的常量,其用途与
如果查看脚本的左上角,您将看到
我是如何做到的:
(JOB\u名称作为命令行参数传入。)
然后,在
在上面的示例中,您将更改
|
![]() |
Leonard · Pyspark:JSON到Pyspark数据帧 1 年前 |
![]() |
juamd · 顺序(k,<元组>)RDD 6 年前 |
![]() |
Gaurav Gupta · 如何加载多行记录的CSV文件? 6 年前 |
![]() |
Jared · 如何在本地模式下运行的pyspark中读取S3? 6 年前 |
![]() |
ka_boom · 在pyspark中链接多个groupBy 6 年前 |
![]() |
ds_user · 在apache spark中复制记录计数 6 年前 |
![]() |
ds_user · 结合类型和子类型的Apache Spark组 6 年前 |