Стек Pytorchvideo ожидает, что каждый тензор будет равенным размером, но получил [89088] при входе 0 и [88064] при входе 1

# Add decode_audio=False to the val_dataset 

# Before:
val_dataset = pytorchvideo.data.Kinetics(
  data_path=os.path.join(self._DATA_PATH, "val.csv"),
  clip_sampler=pytorchvideo.data.make_clip_sampler("uniform",
                                                   self._CLIP_DURATION),
  transform=val_transform
)

# After
val_dataset = pytorchvideo.data.Kinetics(
  data_path=os.path.join(self._DATA_PATH, "val.csv"),
  clip_sampler=pytorchvideo.data.make_clip_sampler("uniform", 
                                                   self._CLIP_DURATION),
  decode_audio=False,
  transform=val_transform
)
Jittery Jay