有没有一种标准的方法可以将多个记录(在本例中是来自多个.png或.jpeg图像的数据)编码到一个PyTorch可以读取的文件中吗?类似于TensorFlow的“TFRecord”或MXNet的“RecordIO”,但对于PyTorch。
我需要从S3下载图像数据以进行推断,如果图像数据包含在许多小的.jpg文件中,而不是较少的文件中,则速度会慢得多。
谢谢。
一件事是将成批的图像存储在一个单一的 npz 文件。努比的 np.savez torch.from_numpy 转换为张量。
npz
np.savez
torch.from_numpy