代码之家 › 专栏 › 技术社区 › Roger Lipscombe

Amazon S3:在上传完成之前,客户端可以看到文件吗

amazon-s3

Roger Lipscombe · 技术社区 · 8 年前

在 PutObject - Amazon Simple Storage Service ,我发现以下内容:

Amazon S3从不添加部分对象;如果收到成功响应,AmazonS3会将整个对象添加到bucket中。

但那是说我收到成功响应。我能保证不另外客户端在列出bucket中的对象时会看到这个对象——直到整个对象被上传?

我想使用S3作为“spool”目录——我将在那里上传文件,另一个客户机将定期列出这些文件,然后下载它们。我不希望它试图下载一个没有完全上传的文件。

1 回复 | 直到 2 年前

Michael - sqlbot 8 年前

答案与此一致:

Amazon S3从不添加部分对象

在上传完成之前,正在上传的内容在技术上并不“在”bucket中。

正如您可能知道的那样,S3不是分层文件系统。它至少有两个重要的组件,后备存储和索引,与典型的文件系统不同,它们是分开的……因此,当你写一个对象时,你并不是真的在“原地”写它。上传一个对象会将对象保存到后备存储,并且然后将其添加到bucket的索引中,该索引由 GET 以及其他获取存储数据和元数据以进行检索的请求。

如果索引中没有条目,则无法访问该对象。所以你很好。下载尚未完成上载的对象是不可能的。从技术上讲,这个对象还不存在。

类似地,如果一个对象已经存在,并且您开始覆盖它,那么任何试图下载它的人都会获得该对象的“旧”副本,至少直到您的上传完成为止,即使在没有启用版本控制的bucket中也是如此——覆盖不会覆盖实际的对象,它会覆盖索引项,只有在上传完成时才会发生这种情况。请注意,此机制似乎负责应用于的最终一致性模型 PUT 覆盖现有对象的请求。

注意,关于数据完整性:确保无论您使用什么上传设置 Content-MD 请求标头。这为S3提供了一种检测传输错误的机制,并在上传的内容不匹配时强制失败,从而防止了损坏的上传。

推荐文章

Anna Berezko · AWS匹配不支持的TLD域名和S3 bucket静态网站

1 年前

renzCNFT · 与s3相比,workdocs有什么优势

2 年前

Hasham · 如何将多个本地文件上载到s3中的一个文件

2 年前

sebas flores · S3 URL-使用python下载

2 年前

Jawwad Hussain · 带s3 amazaon的玛雅edms

2 年前

sklal · 在Python中从S3存储桶读取xml文件——只存储最后一个文件的内容

2 年前

Tobitor · S3:无效的bucket name-bucket name必须与正则表达式匹配

2 年前

geo909 · AWS Athena:具有非标准文件结构的S3存储桶分区表

2 年前

DEB · 上传焦油。gz文件到S3 Bucket,使用Bot3和Python

2 年前

omid · 下一个js-导出站点的目录结构

2 年前