假设我们得到张量: img 以及边界框: bbox 形状:
img
bbox
[B, C, H, W], [B, xmin, ymin, xmax, ymax], respectively
是否有一种优化的方法可以通过PyTorch或Python从每个张量(每个张量都有不同的边界框)中提取相应的补丁? 由于我想构建一个实时应用程序,我在这方面的所有尝试都非常缓慢。