1
6
Dataproc构建在GCE虚拟机上,因此同样的安全性也适用。
GCE VM(PDs或本地SSD)磁盘上的所有数据都经过加密:
https://cloud.google.com/compute/docs/disks/
. 所以Spark
离开谷歌数据中心的网络通信(例如跨地区通信)是加密的。此外,Google API访问也是加密的。但是,数据中心内的节点到节点通信(可能是集群内的所有Dataproc通信)没有加密。您可以在此处阅读更多内容: https://cloud.google.com/security/encryption-in-transit/ . 也就是说,集群中的通信基本上是空的。节点到节点的通信通过隔离服务器上的内部IP进行 VPC network . Dataproc具有 guidance 关于如何配置防火墙规则。 您还可以使用Dataproc private IP clusters 避免虚拟机上有外部IP地址。 以下是谷歌云GDPR合规性文档: https://www.google.com/cloud/security/gdpr/ . |
Bruno Peixoto · Spark群集CI管道构建失败 1 年前 |
mcsilvio · 在foreach中组织联接的最佳方式是什么? 1 年前 |
Dhruv · 在sbt控制台上运行Spark 1 年前 |
Leonard · Pyspark:JSON到Pyspark数据帧 1 年前 |
billie class · 将列中的值重写为列表中的下一个值 2 年前 |